Teasers
Quand avons-nous vu des données pour la première fois ?
- Milieu du XXe siècle
- En tant que successeur du Vulcain, Spock
- 18,000 BC
- Qui sait?
Aussi loin que nous puissions remonter dans l'histoire découverte, nous trouvons des humains utilisant des données. Fait intéressant, les données précèdent même les nombres écrits. Certains des premiers exemples de stockage de données datent d'environ 18,000 2 avant JC, où nos ancêtres sur le continent africain utilisaient des marques sur des bâtons comme forme de comptabilité. Les réponses 4 et 21 seront également acceptées. C'était au milieu du XXe siècle, cependant, que la Business Intelligence a été définie pour la première fois telle que nous la comprenons aujourd'hui. La BI ne s'est généralisée qu'au tournant du XNUMXe siècle.
Les avantages de la qualité des données sont évidents.
- La confiance. Les utilisateurs feront davantage confiance aux données. "75 % des dirigeants ne font pas confiance à leurs données »
- De meilleures décisions. Vous pourrez utiliser des analyses par rapport aux données pour prendre des décisions plus intelligentes. Qualité des données est l'un des deux plus grands défis auxquels sont confrontées les organisations qui adoptent l'IA. (L'autre étant les compétences du personnel.)
- Avantage compétitif. La qualité des données affecte l'efficacité opérationnelle, le service client, le marketing et le résultat net - les revenus.
- en ligne. La qualité des données est fortement liée aux affaires succès.
6 éléments clés de la qualité des données
Si vous ne pouvez pas faire confiance à vos données, comment pouvez-vous respecter ses conseils ?
Aujourd'hui, la qualité des données est essentielle à la validité des décisions que les entreprises prennent avec les outils de BI, l'analyse, l'apprentissage automatique et l'intelligence artificielle. Dans sa forme la plus simple, la qualité des données est une donnée valide et complète. Vous avez peut-être vu les problèmes de qualité des données dans les gros titres :
- Amélioration des données COVID-19 du CDC - "Au cours de la pandémie, le CDC a amélioré la rapidité, l'exhaustivité et la qualité des données critiques pour la réponse."
- Déchets entrants, déchets sortants ; le chien de garde de la ville trouve un schéma troublant de qualité des données peu fiable – « Un nouveau rapport de l'inspecteur général par intérim [de Chicago] indique que les « problèmes de qualité des données » affectent « l'objectivité, l'utilité et l'intégrité » des informations utilisées pour allouer les ressources, mesurer les performances des employés et surveiller une foule de programmes.
- GAO trouve des problèmes de qualité des données lors du déploiement du DSE de VA - "La VA n'a pas assuré la qualité des données migrées vers son nouveau système Cerner EHR."
À certains égards, même au cours de la troisième décennie de la Business Intelligence, il est encore plus difficile d'atteindre et de maintenir la qualité des données. Certains des défis qui contribuent à la lutte constante pour maintenir la qualité des données incluent :
- Fusions et acquisitions qui tentent de rassembler des systèmes, des processus, des outils et des données disparates provenant de plusieurs entités.
- Des silos internes de données sans les standards pour concilier l'intégration des données.
- Le stockage bon marché a facilité la capture et la conservation de grandes quantités de données. Nous capturons plus de données que nous ne pouvons en analyser.
- La complexité des systèmes de données s'est accrue. Il existe davantage de points de contact entre le système d'enregistrement où les données sont saisies et le point de consommation, qu'il s'agisse de l'entrepôt de données ou du cloud.
De quels aspects des données parlons-nous ? Quelles propriétés des données contribuent à leur qualité ? Six éléments contribuent à la qualité des données. Chacune d'entre elles sont des disciplines entières.
- Opportunité
- Les données sont prêtes et utilisables quand elles sont nécessaires.
- Les données sont disponibles pour les rapports de fin de mois dans la première semaine du mois suivant, par exemple.
- Validité
- Les données ont le type de données correct dans la base de données. Le texte est du texte, les dates sont des dates et les nombres sont des nombres.
- Les valeurs sont dans les plages attendues. Par exemple, alors que 212 degrés Fahrenheit est une température mesurable réelle, ce n'est pas une valeur valide pour une température humaine.
- Les valeurs ont le bon format. 1.000000 n'a pas la même signification que 1.
- Cohérence
- Les données sont cohérentes en interne
- Il n'y a pas de doublons d'enregistrements
- Intégrité
- Les relations entre les tables sont fiables.
- Il n'est pas modifié par inadvertance. Les valeurs peuvent être tracées jusqu'à leurs origines.
- état complet
- Il n'y a pas de "trous" dans les données. Tous les éléments d'un enregistrement ont des valeurs.
- Il n'y a pas de valeurs NULL.
- Précision
- Les données dans l'environnement de reporting ou d'analyse - l'entrepôt de données, sur site ou dans le cloud - reflètent les systèmes sources, ou les systèmes ou l'enregistrement
- Les données proviennent de sources vérifiables.
Nous convenons donc que le défi de la qualité des données est aussi vieux que les données elles-mêmes, le problème est omniprésent et vital à résoudre. Alors, que faisons-nous à ce sujet? Considérez votre programme de qualité des données comme un projet à long terme et sans fin.
La qualité des données représente étroitement la précision avec laquelle ces données représentent la réalité. Pour être honnête, certaines données sont plus importantes que d'autres données. Sachez quelles données sont essentielles à des décisions commerciales solides et au succès de l'organisation. Commencez par là. Concentrez-vous sur ces données.
En tant que Data Quality 101, cet article est une introduction de niveau étudiant au sujet : l'historique, les événements actuels, le défi, pourquoi c'est un problème et un aperçu de haut niveau de la façon d'aborder la qualité des données au sein d'une organisation. Faites-nous savoir si vous souhaitez approfondir l'un de ces sujets dans un article de niveau 200 ou de niveau supérieur. Si tel est le cas, nous approfondirons les détails dans les mois à venir.