Teasers
Πότε είδαμε για πρώτη φορά δεδομένα;
- Μέσα του εικοστού αιώνα
- Ως διάδοχος του Vulcan, ο Spock
- 18,000 π.Χ.
- Ποιος ξέρει;
Όσο πιο πίσω μπορούμε να πάμε στην ανακαλυφθείσα ιστορία, βρίσκουμε ανθρώπους που χρησιμοποιούν δεδομένα. Είναι ενδιαφέρον ότι τα δεδομένα προηγούνται ακόμη και των γραπτών αριθμών. Μερικά από τα παλαιότερα παραδείγματα αποθήκευσης δεδομένων είναι από περίπου το 18,000 π.Χ. όπου οι πρόγονοί μας στην αφρικανική ήπειρο χρησιμοποιούσαν σημάδια σε ραβδιά ως μια μορφή τήρησης βιβλίων. Οι απαντήσεις 2 και 4 θα γίνουν επίσης δεκτές. Ήταν στα μέσα του εικοστού αιώνα, ωστόσο, όταν η Business Intelligence ορίστηκε για πρώτη φορά όπως την καταλαβαίνουμε σήμερα. Το BI δεν έγινε ευρέως διαδεδομένο σχεδόν στις αρχές του 21ου αιώνα.
Τα οφέλη της ποιότητας των δεδομένων είναι προφανή.
- Εμπιστευθείτε. Οι χρήστες θα εμπιστεύονται καλύτερα τα δεδομένα. "Το 75% των στελεχών δεν εμπιστεύονται τα δεδομένα τους"
- Καλύτερες αποφάσεις. Θα μπορείτε να χρησιμοποιείτε αναλυτικά στοιχεία έναντι των δεδομένων για να λαμβάνετε πιο έξυπνες αποφάσεις. Η ποιότητα των δεδομένων είναι μία από τις δύο μεγαλύτερες προκλήσεις που αντιμετωπίζουν οι οργανισμοί που υιοθετούν την τεχνητή νοημοσύνη. (Το άλλο είναι σύνολα δεξιοτήτων προσωπικού.)
- Ανταγωνιστικό πλεονέκτημα. Η ποιότητα των δεδομένων επηρεάζει τη λειτουργική αποτελεσματικότητα, την εξυπηρέτηση πελατών, το μάρκετινγκ και τα τελικά έσοδα.
- Επιτυχία. Η ποιότητα των δεδομένων συνδέεται σε μεγάλο βαθμό με τις επιχειρήσεις επιτυχία.
6 Βασικά Στοιχεία Ποιότητας Δεδομένων
Εάν δεν μπορείτε να εμπιστευτείτε τα δεδομένα σας, πώς μπορείτε να σεβαστείτε τις συμβουλές τους;
Σήμερα, η ποιότητα των δεδομένων είναι κρίσιμη για την εγκυρότητα των αποφάσεων που λαμβάνουν οι επιχειρήσεις με εργαλεία BI, αναλυτικά στοιχεία, μηχανική μάθηση και τεχνητή νοημοσύνη. Στην πιο απλή του μορφή, η ποιότητα των δεδομένων είναι δεδομένα που είναι έγκυρα και πλήρη. Μπορεί να έχετε δει τα προβλήματα ποιότητας δεδομένων στους τίτλους:
- Βελτίωση δεδομένων COVID-19 του CDC – «Κατά τη διάρκεια της πανδημίας, το CDC έχει βελτιώσει την επικαιρότητα, την πληρότητα και την ποιότητα των κρίσιμων δεδομένων για την απόκριση».
- Σκουπίδια μέσα, σκουπίδια έξω? Ο φύλακας της πόλης βρίσκει ανησυχητικό μοτίβο αναξιόπιστης ποιότητας δεδομένων – «Μια νέα έκθεση από τον εν ενεργεία γενικό επιθεωρητή [Σικάγο] λέει ότι «τα ζητήματα ποιότητας δεδομένων» επηρεάζουν την «αντικειμενικότητα, τη χρησιμότητα και την ακεραιότητα» των πληροφοριών που χρησιμοποιούνται για την κατανομή πόρων, τη μέτρηση της απόδοσης των εργαζομένων και την παρακολούθηση μιας σειράς προγραμμάτων».
- Το GAO εντοπίζει ζητήματα ποιότητας δεδομένων κατά την κυκλοφορία του EHR της VA – «Η VA δεν διασφάλισε την ποιότητα των δεδομένων που μεταφέρθηκαν στο νέο της σύστημα Cerner EHR».
Κατά κάποιο τρόπο – ακόμη και στην τρίτη δεκαετία της Επιχειρηματικής Ευφυΐας – η επίτευξη και η διατήρηση της ποιότητας των δεδομένων είναι ακόμη πιο δύσκολη. Μερικές από τις προκλήσεις που συμβάλλουν στον συνεχή αγώνα για τη διατήρηση της ποιότητας των δεδομένων περιλαμβάνουν:
- Συγχωνεύσεις και εξαγορές που προσπαθούν να συγκεντρώσουν ανόμοια συστήματα, διαδικασίες, εργαλεία και δεδομένα από πολλαπλές οντότητες.
- Εσωτερικά σιλό δεδομένων χωρίς τα πρότυπα για την ενοποίηση των δεδομένων.
- Η φθηνή αποθήκευση έχει διευκολύνει τη λήψη και τη διατήρηση μεγάλων ποσοτήτων δεδομένων. Συλλέγουμε περισσότερα δεδομένα από όσα μπορούμε να αναλύσουμε.
- Η πολυπλοκότητα των συστημάτων δεδομένων έχει αυξηθεί. Υπάρχουν περισσότερα σημεία επαφής μεταξύ του συστήματος καταγραφής όπου εισάγονται τα δεδομένα και του σημείου κατανάλωσης, είτε αυτό είναι η αποθήκη δεδομένων είτε το cloud.
Για ποιες πτυχές δεδομένων μιλάμε; Ποιες ιδιότητες των δεδομένων συμβάλλουν στην ποιότητά τους; Υπάρχουν έξι στοιχεία που συμβάλλουν στην ποιότητα των δεδομένων. Καθένα από αυτά είναι ολόκληροι κλάδοι.
- Επικαιρότητα
- Τα δεδομένα είναι έτοιμα και μπορούν να χρησιμοποιηθούν όταν χρειάζονται.
- Τα δεδομένα είναι διαθέσιμα για αναφορά στο τέλος του μήνα εντός της πρώτης εβδομάδας του επόμενου μήνα, για παράδειγμα.
- Εγκυρότητα
- Τα δεδομένα έχουν τον σωστό τύπο δεδομένων στη βάση δεδομένων. Το κείμενο είναι κείμενο, οι ημερομηνίες είναι ημερομηνίες και οι αριθμοί είναι αριθμοί.
- Οι τιμές είναι εντός των αναμενόμενων ορίων. Για παράδειγμα, ενώ οι 212 βαθμοί Φαρενάιτ είναι μια πραγματική μετρήσιμη θερμοκρασία, δεν είναι έγκυρη τιμή για μια ανθρώπινη θερμοκρασία.
- Οι τιμές έχουν τη σωστή μορφή. Το 1.000000 δεν έχει την ίδια σημασία με το 1.
- Συνοχή
- Τα δεδομένα είναι εσωτερικά συνεπή
- Δεν υπάρχουν διπλότυπα εγγραφών
- Ακεραιότητα
- Οι σχέσεις μεταξύ των πινάκων είναι αξιόπιστες.
- Δεν αλλάζει άθελά του. Οι αξίες μπορούν να εντοπιστούν στην προέλευσή τους.
- Πληρότητα
- Δεν υπάρχουν «τρύπες» στα δεδομένα. Όλα τα στοιχεία μιας εγγραφής έχουν τιμές.
- Δεν υπάρχουν NULL τιμές.
- Ακρίβεια
- Τα δεδομένα στο περιβάλλον αναφοράς ή ανάλυσης – η αποθήκη δεδομένων, είτε on-prem είτε στο cloud – αντικατοπτρίζουν τα συστήματα προέλευσης ή τα συστήματα ή την εγγραφή
- Τα δεδομένα προέρχονται από επαληθεύσιμες πηγές.
Συμφωνούμε, λοιπόν, ότι η πρόκληση της ποιότητας των δεδομένων είναι τόσο παλιά όσο και τα ίδια τα δεδομένα, το πρόβλημα είναι πανταχού παρόν και είναι ζωτικής σημασίας να επιλυθεί. Λοιπόν, τι κάνουμε για αυτό; Θεωρήστε το πρόγραμμα ποιότητας δεδομένων σας ως ένα μακροπρόθεσμο, ατέρμονο έργο.
Η ποιότητα των δεδομένων αντιπροσωπεύει στενά το πόσο με ακρίβεια αυτά τα δεδομένα αντιπροσωπεύουν την πραγματικότητα. Για να είμαστε ειλικρινείς, ορισμένα δεδομένα είναι πιο σημαντικά από άλλα δεδομένα. Μάθετε ποια δεδομένα είναι κρίσιμα για τις στέρεες επιχειρηματικές αποφάσεις και την επιτυχία του οργανισμού. Ξεκινήστε από εκεί. Εστιάστε σε αυτά τα δεδομένα.
Ως Data Quality 101, αυτό το άρθρο είναι μια εισαγωγή σε επίπεδο πρωτοετών μαθητών στο θέμα: το ιστορικό, τα τρέχοντα γεγονότα, η πρόκληση, γιατί είναι πρόβλημα και μια επισκόπηση υψηλού επιπέδου του τρόπου αντιμετώπισης της ποιότητας δεδομένων σε έναν οργανισμό. Ενημερώστε μας εάν ενδιαφέρεστε να ρίξετε μια πιο βαθιά ματιά σε οποιοδήποτε από αυτά τα θέματα σε ένα άρθρο 200 επιπέδων ή μεταπτυχιακού επιπέδου. Αν ναι, θα βουτήξουμε βαθύτερα στις λεπτομέρειες τους επόμενους μήνες.