Vous voulez des données de qualité, mais vous n'utilisez pas de données de qualité

by 24 août 2022BI/Analytique0 commentaires

Teasers

Quand avons-nous vu des données pour la première fois ?

  1. Milieu du XXe siècle
  2. En tant que successeur du Vulcain, Spock
  3. 18,000 BC
  4. Qui sait?  

Aussi loin que nous puissions remonter dans l'histoire découverte, nous trouvons des humains utilisant des données. Fait intéressant, les données précèdent même les nombres écrits. Certains des premiers exemples de stockage de données datent d'environ 18,000 2 avant JC, où nos ancêtres sur le continent africain utilisaient des marques sur des bâtons comme forme de comptabilité. Les réponses 4 et 21 seront également acceptées. C'était au milieu du XXe siècle, cependant, que la Business Intelligence a été définie pour la première fois telle que nous la comprenons aujourd'hui. La BI ne s'est généralisée qu'au tournant du XNUMXe siècle.

Les avantages de la qualité des données sont évidents. 

  • La confiance. Les utilisateurs feront davantage confiance aux données. "75 % des dirigeants ne font pas confiance à leurs données »
  • De meilleures décisions. Vous pourrez utiliser des analyses par rapport aux données pour prendre des décisions plus intelligentes.  Qualité des données est l'un des deux plus grands défis auxquels sont confrontées les organisations qui adoptent l'IA. (L'autre étant les compétences du personnel.)
  • Avantage compétitif.  La qualité des données affecte l'efficacité opérationnelle, le service client, le marketing et le résultat net - les revenus.
  • en ligne. La qualité des données est fortement liée aux affaires succès.

 

6 éléments clés de la qualité des données

Si vous ne pouvez pas faire confiance à vos données, comment pouvez-vous respecter ses conseils ?

 

Aujourd'hui, la qualité des données est essentielle à la validité des décisions que les entreprises prennent avec les outils de BI, l'analyse, l'apprentissage automatique et l'intelligence artificielle. Dans sa forme la plus simple, la qualité des données est une donnée valide et complète. Vous avez peut-être vu les problèmes de qualité des données dans les gros titres :

À certains égards, même au cours de la troisième décennie de la Business Intelligence, il est encore plus difficile d'atteindre et de maintenir la qualité des données. Certains des défis qui contribuent à la lutte constante pour maintenir la qualité des données incluent :

  • Fusions et acquisitions qui tentent de rassembler des systèmes, des processus, des outils et des données disparates provenant de plusieurs entités. 
  • Des silos internes de données sans les standards pour concilier l'intégration des données.            
  • Le stockage bon marché a facilité la capture et la conservation de grandes quantités de données. Nous capturons plus de données que nous ne pouvons en analyser.
  • La complexité des systèmes de données s'est accrue. Il existe davantage de points de contact entre le système d'enregistrement où les données sont saisies et le point de consommation, qu'il s'agisse de l'entrepôt de données ou du cloud.

De quels aspects des données parlons-nous ? Quelles propriétés des données contribuent à leur qualité ? Six éléments contribuent à la qualité des données. Chacune d'entre elles sont des disciplines entières. 

  • Opportunité
    • Les données sont prêtes et utilisables quand elles sont nécessaires.
    • Les données sont disponibles pour les rapports de fin de mois dans la première semaine du mois suivant, par exemple.
  • Validité
    • Les données ont le type de données correct dans la base de données. Le texte est du texte, les dates sont des dates et les nombres sont des nombres.
    • Les valeurs sont dans les plages attendues. Par exemple, alors que 212 degrés Fahrenheit est une température mesurable réelle, ce n'est pas une valeur valide pour une température humaine.  
    • Les valeurs ont le bon format. 1.000000 n'a pas la même signification que 1.
  • Cohérence
    • Les données sont cohérentes en interne
    • Il n'y a pas de doublons d'enregistrements
  • Intégrité
    • Les relations entre les tables sont fiables.
    • Il n'est pas modifié par inadvertance. Les valeurs peuvent être tracées jusqu'à leurs origines. 
  • état complet
    • Il n'y a pas de "trous" dans les données. Tous les éléments d'un enregistrement ont des valeurs.  
    • Il n'y a pas de valeurs NULL.
  • Précision
    • Les données dans l'environnement de reporting ou d'analyse - l'entrepôt de données, sur site ou dans le cloud - reflètent les systèmes sources, ou les systèmes ou l'enregistrement
    • Les données proviennent de sources vérifiables.

Nous convenons donc que le défi de la qualité des données est aussi vieux que les données elles-mêmes, le problème est omniprésent et vital à résoudre. Alors, que faisons-nous à ce sujet? Considérez votre programme de qualité des données comme un projet à long terme et sans fin.  

La qualité des données représente étroitement la précision avec laquelle ces données représentent la réalité. Pour être honnête, certaines données sont plus importantes que d'autres données. Sachez quelles données sont essentielles à des décisions commerciales solides et au succès de l'organisation. Commencez par là. Concentrez-vous sur ces données.  

En tant que Data Quality 101, cet article est une introduction de niveau étudiant au sujet : l'historique, les événements actuels, le défi, pourquoi c'est un problème et un aperçu de haut niveau de la façon d'aborder la qualité des données au sein d'une organisation. Faites-nous savoir si vous souhaitez approfondir l'un de ces sujets dans un article de niveau 200 ou de niveau supérieur. Si tel est le cas, nous approfondirons les détails dans les mois à venir.   

BI/AnalytiqueAutres
Pourquoi Microsoft Excel est l'outil d'analyse n°1
Pourquoi Excel est-il l'outil d'analyse n°1 ?

Pourquoi Excel est-il l'outil d'analyse n°1 ?

  C'est bon marché et facile. Le logiciel de feuille de calcul Microsoft Excel est probablement déjà installé sur l'ordinateur de l'utilisateur professionnel. Et de nombreux utilisateurs d’aujourd’hui ont été exposés aux logiciels Microsoft Office depuis le lycée ou même avant. Cette réponse instinctive quant à...

En savoir plus

BI/AnalytiqueAutres
Désencombrez vos informations : un guide pour le nettoyage de printemps analytique

Désencombrez vos informations : un guide pour le nettoyage de printemps analytique

Désencombrez vos informations Un guide pour l'analyse du ménage de printemps La nouvelle année commence en beauté ; des rapports de fin d'année sont créés et examinés, puis tout le monde s'installe dans un horaire de travail cohérent. À mesure que les jours rallongent et que les arbres et les fleurs fleurissent,...

En savoir plus

BI/AnalytiqueAutres
NY Style vs Chicago Style Pizza : un délicieux débat

NY Style vs Chicago Style Pizza : un délicieux débat

Pour satisfaire nos envies, peu de choses peuvent rivaliser avec la joie d’une part de pizza bien chaude. Le débat entre la pizza à la new-yorkaise et la pizza à la Chicago suscite des discussions passionnées depuis des décennies. Chaque style a ses propres caractéristiques uniques et ses fans dévoués....

En savoir plus

BI/Analytique
Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Introduction En tant que directeur de la technologie (CTO), je suis toujours à la recherche de technologies émergentes qui transforment notre façon d'aborder l'analyse. L'une de ces technologies qui a retenu mon attention au cours des dernières années et qui est immense et prometteuse est l'Analytics...

En savoir plus