Jo wolle gegevenskwaliteit, mar jo brûke gjin kwaliteitsgegevens

by Aug 24, 2022BI/Analytics0 comments

teasers

Wannear seagen wy earst gegevens?

  1. Midden tweintichste iuw
  2. As opfolger fan de Vulcan, Spock
  3. 18,000 BC
  4. Wa wit?  

Sa fier werom as wy kinne gean yn ûntdekte skiednis fine wy ​​minsken mei help fan gegevens. Nijsgjirrich is dat gegevens sels skreaune nûmers foarôfgeane. Guon fan 'e ierste foarbylden fan it opslaan fan gegevens binne fan sawat 18,000 f.Kr., wêr't ús foarâlden op it Afrikaanske kontinint merken op stokken brûkten as in foarm fan boekhâlding. Antwurden 2 en 4 wurde ek akseptearre. It wie lykwols midden fan 'e tweintichste ieu doe't Business Intelligence foar it earst definiearre waard sa't wy it hjoed begripe. BI waard net wiidferspraat oant hast de beurt fan 'e 21e ieu.

De foardielen fan gegevenskwaliteit binne dúdlik. 

  • Fertrouwe. Brûkers sille de gegevens better fertrouwe. "75% fan bestjoerders fertrout har gegevens net"
  • Better besluten. Jo kinne analytyk brûke tsjin de gegevens om slimmer besluten te nimmen.  Datakwaliteit is ien fan 'e twa grutste útdagings foar organisaasjes dy't AI oannimme. (De oare is personielfeardigens.)
  • Competitive Advantage.  De kwaliteit fan gegevens beynfloedet operasjonele effisjinsje, klanttsjinst, marketing en de ûnderste line - ynkomsten.
  • Sukses. Gegevenskwaliteit is sterk keppele oan bedriuw sukses.

 

6 kaai eleminten fan gegevens kwaliteit

As jo ​​​​jo gegevens net kinne fertrouwe, hoe kinne jo dan har advys respektearje?

 

Tsjintwurdich is de kwaliteit fan gegevens kritysk foar de jildichheid fan besluten dy't bedriuwen meitsje mei BI-ark, analytics, masine learen en keunstmjittige yntelliginsje. Op syn ienfâldichste is gegevenskwaliteit gegevens dy't jildich en folslein binne. Jo hawwe miskien de problemen fan gegevenskwaliteit sjoen yn 'e koppen:

Op guon manieren - sels goed yn 'e tredde desennia fan Business Intelligence - is it berikken en behâlden fan de kwaliteit fan gegevens noch dreger. Guon fan 'e útdagings dy't bydrage oan' e konstante striid foar it behâld fan gegevenskwaliteit omfetsje:

  • Fúzjes en oanwinsten dy't besykje ferskate systemen, prosessen, ark en gegevens fan meardere entiteiten byinoar te bringen. 
  • Ynterne silo's fan gegevens sûnder de noarmen om de yntegraasje fan gegevens te fermoedsoenjen.            
  • Goedkeape opslach hat it fêstlizzen en behâlden fan grutte hoemannichten gegevens makliker makke. Wy fange mear gegevens dan wy kinne analysearje.
  • De kompleksiteit fan gegevenssystemen is groeid. D'r binne mear kontaktpunten tusken it systeem fan rekord wêr't gegevens wurde ynfierd en it punt fan konsumpsje, of dat no it datapakhús of wolk is.

Hokker aspekten fan gegevens hawwe wy it oer? Hokker eigenskippen fan de gegevens drage by oan har kwaliteit? D'r binne seis eleminten dy't bydrage oan gegevenskwaliteit. Elk fan dizze binne folsleine dissiplines. 

  • Tiidigens
    • Gegevens binne klear en brûkber as it nedich is.
    • De gegevens binne bygelyks beskikber foar rapportaazje oan 'e ein fan' e moanne binnen de earste wike fan 'e folgjende moanne.
  • Jildigens
    • De gegevens hawwe it juste gegevenstype yn 'e databank. Tekst is tekst, datums binne datums en sifers binne sifers.
    • Wearden binne binnen ferwachte berik. Bygelyks, wylst 212 graden Fahrenheit in werklike mjitbere temperatuer is, is it gjin jildige wearde foar in minsklike temperatuer.  
    • Wearden hawwe it juste formaat. 1.000000 hat net deselde betsjutting as 1.
  • Konsistinsje
    • De gegevens binne yntern konsistint
    • D'r binne gjin duplikaten fan records
  • Yntegriteit
    • Relaasjes tusken tabellen binne betrouber.
    • It is net ûnbedoeld feroare. Wearden kinne nei har oarsprong weromfierd wurde. 
  • Completeness
    • D'r binne gjin "gaten" yn 'e gegevens. Alle eleminten fan in rekord hawwe wearden.  
    • D'r binne gjin NULL-wearden.
  • Foarkommen
    • Gegevens yn 'e rapportaazje of analytyske omjouwing - it gegevenspakhús, itsij on-prem as yn 'e wolk - wjerspegelje de boarnesystemen, as systemen as rekord
    • Gegevens binne fan ferifieare boarnen.

Wy binne it dus iens dat de útdaging fan gegevenskwaliteit sa âld is as gegevens sels, it probleem is ubiquity en essensjeel om op te lossen. Dus, wat dogge wy der oan? Beskôgje jo programma foar gegevenskwaliteit as in langduorjend, nea einigjend projekt.  

De kwaliteit fan gegevens jout nau oan hoe krekt dy gegevens de realiteit fertsjintwurdigje. Om earlik te wêzen, guon gegevens binne wichtiger as oare gegevens. Witte hokker gegevens kritysk binne foar solide saaklike besluten en it sukses fan 'e organisaasje. Begjin dêr. Fokus op dy gegevens.  

As Data Quality 101 is dit artikel in ynlieding op Freshman-nivo oer it ûnderwerp: de skiednis, aktuele barrens, de útdaging, wêrom it in probleem is en in oersjoch op heech nivo fan hoe't jo gegevenskwaliteit binnen in organisaasje oanpakke kinne. Lit it ús witte as jo ynteressearre binne yn in djipper blik op ien fan dizze ûnderwerpen yn in artikel op 200-nivo of graduate-nivo. As dat sa is, sille wy de kommende moannen djipper yn 'e spesifikaasjes dûke.