Jy wil datakwaliteit hê, maar jy gebruik nie kwaliteitdata nie

by Augustus 24, 2022BI/analise0 kommentaar

Tergers

Wanneer het ons die eerste keer data gesien?

  1. Middel twintigste eeu
  2. As 'n opvolger van die Vulcan, Spock
  3. 18,000 BC
  4. Wie weet?  

So ver terug as wat ons kan gaan in die ontdekte geskiedenis vind ons mense wat data gebruik. Interessant genoeg gaan data selfs geskrewe getalle vooraf. Van die vroegste voorbeelde van die stoor van data is van ongeveer 18,000 2 vC waar ons voorouers op die Afrika-kontinent merke op stokke as 'n vorm van boekhouding gebruik het. Antwoorde 4 en 21 sal ook aanvaar word. Dit was egter die middel van die twintigste eeu toe Business Intelligence die eerste keer gedefinieer is soos ons dit vandag verstaan. BI het nie wydverspreid geword tot byna die draai van die XNUMXste eeu nie.

Die voordele van datakwaliteit is voor die hand liggend. 

  • Vertrou. Gebruikers sal die data beter vertrou. “75% van bestuurders vertrou nie hul data nie"
  • Beter besluite. Jy sal analise teen die data kan gebruik om slimmer besluite te neem.  Data gehalte is een van die twee grootste uitdagings wat organisasies in die gesig staar wat KI aanneem. (Die ander is personeelvaardighede.)
  • Kompeterende voordeel.  Die kwaliteit van data beïnvloed operasionele doeltreffendheid, kliëntediens, bemarking en die bottom line – inkomste.
  • Sukses. Datakwaliteit is sterk gekoppel aan besigheid sukses.

 

6 Sleutelelemente van datakwaliteit

As jy nie jou data kan vertrou nie, hoe kan jy die advies daarvan respekteer?

 

Vandag is die kwaliteit van data van kritieke belang vir die geldigheid van besluite wat besighede neem met BI-gereedskap, analise, masjienleer en kunsmatige intelligensie. Op sy eenvoudigste is datakwaliteit data wat geldig en volledig is. Jy het dalk die probleme van datakwaliteit in die opskrifte gesien:

Op sommige maniere – selfs ver in die derde dekade van Besigheidsintelligensie – is die bereiking en instandhouding van die kwaliteit van data selfs moeiliker. Sommige van die uitdagings wat bydra tot die voortdurende stryd om datakwaliteit te handhaaf, sluit in:

  • Samesmeltings en verkrygings wat probeer om uiteenlopende stelsels, prosesse, gereedskap en data van verskeie entiteite bymekaar te bring. 
  • Interne silo's van data sonder die standaarde om die integrasie van data te versoen.            
  • Goedkoop berging het die vaslegging en bewaring van groot hoeveelhede data makliker gemaak. Ons vang meer data vas as wat ons kan ontleed.
  • Die kompleksiteit van datastelsels het gegroei. Daar is meer raakpunte tussen die rekordstelsel waar data ingevoer word en die punt van verbruik, of dit nou die datapakhuis of wolk is.

Van watter aspekte van data praat ons? Watter eienskappe van die data dra by tot die kwaliteit daarvan? Daar is ses elemente wat bydra tot datakwaliteit. Elkeen van hierdie is hele dissiplines. 

  • tydigheid
    • Data is gereed en bruikbaar wanneer dit nodig is.
    • Die data is byvoorbeeld beskikbaar vir einde-van-maand-verslagdoening binne die eerste week van die volgende maand.
  • Geldigheid
    • Die data het die korrekte datatipe in die databasis. Teks is teks, datums is datums en getalle is getalle.
    • Waardes is binne verwagte reekse. Byvoorbeeld, terwyl 212 grade Fahrenheit 'n werklike meetbare temperatuur is, is dit nie 'n geldige waarde vir 'n menslike temperatuur nie.  
    • Waardes het die korrekte formaat. 1.000000 het nie dieselfde betekenis as 1 nie.
  • Konsekwentheid
    • Die data is intern konsekwent
    • Daar is geen duplikate van rekords nie
  • integriteit
    • Verwantskappe tussen tabelle is betroubaar.
    • Dit word nie onbedoeld verander nie. Waardes kan na hul oorsprong herlei word. 
  • volledigheid
    • Daar is geen "gate" in die data nie. Al die elemente van 'n rekord het waardes.  
    • Daar is geen NULL-waardes nie.
  • Akkuraatheid
    • Data in die verslagdoenings- of analitiese omgewing – die datapakhuis, hetsy on-prem of in die wolk – weerspieël die bronstelsels, of stelsels of rekord
    • Data is van verifieerbare bronne.

Ons stem dus saam dat die uitdaging van datakwaliteit so oud soos data self is, die probleem is alomteenwoordig en noodsaaklik om op te los. So, wat doen ons daaromtrent? Beskou jou datakwaliteitprogram as 'n langtermyn, nimmereindigende projek.  

Die kwaliteit van data verteenwoordig noukeurig hoe akkuraat daardie data die werklikheid verteenwoordig. Om eerlik te wees, sommige data is belangriker as ander data. Weet watter data krities is vir soliede besigheidsbesluite en die sukses van die organisasie. Begin daar. Fokus op daardie data.  

As Data Kwaliteit 101 is hierdie artikel 'n eerstejaarsvlak inleiding tot die onderwerp: die geskiedenis, huidige gebeure, die uitdaging, hoekom dit 'n probleem is en 'n hoëvlakoorsig van hoe om datakwaliteit binne 'n organisasie aan te spreek. Laat weet ons as jy belangstel om dieper na enige van hierdie onderwerpe te kyk in 'n 200-vlak- of nagraadse-vlak artikel. Indien wel, sal ons in die komende maande dieper in die besonderhede duik.