Želite kvalitetu podataka, ali ne koristite kvalitetne podatke

by Kolovoz 24, 2022BI/Analitika0 komentari

Zagonetke

Kada smo prvi put vidjeli podatke?

  1. Sredina dvadesetog stoljeća
  2. Kao nasljednik Vulkana, Spock
  3. 18,000 prije Krista
  4. Tko zna?  

Koliko god možemo ići unatrag u otkrivenoj povijesti nalazimo ljude koji koriste podatke. Zanimljivo je da podaci čak prethode napisanim brojevima. Neki od najranijih primjera pohranjivanja podataka potječu iz razdoblja oko 18,000 godina prije Krista, gdje su naši preci na afričkom kontinentu koristili oznake na štapićima kao oblik knjigovodstva. Odgovori 2 i 4 također će biti prihvaćeni. Ipak, bila je sredina dvadesetog stoljeća kada je poslovna inteligencija prvi put definirana onako kako je danas shvaćamo. BI je postao široko rasprostranjen tek na prijelazu u 21. stoljeće.

Prednosti kvalitete podataka su očite. 

  • Vjeruj. Korisnici će bolje vjerovati podacima. “75% rukovoditelja ne vjeruje svojim podacima"
  • Bolje odluke. Moći ćete koristiti analitiku u odnosu na podatke kako biste donosili pametnije odluke.  Podaci o kvalitetu jedan je od dva najveća izazova s ​​kojima se suočavaju organizacije koje usvajaju AI. (Drugi su skupovi vještina osoblja.)
  • Konkurentska prednost.  Kvaliteta podataka utječe na operativnu učinkovitost, korisničku uslugu, marketing i krajnji rezultat – prihod.
  • Uspjeh. Kvaliteta podataka uvelike je povezana s poslovanjem uspjeh.

 

6 ključnih elemenata kvalitete podataka

Ako ne možete vjerovati svojim podacima, kako možete poštovati njihove savjete?

 

Danas je kvaliteta podataka ključna za valjanost odluka koje tvrtke donose pomoću BI alata, analitike, strojnog učenja i umjetne inteligencije. Najjednostavnije rečeno, kvaliteta podataka su podaci koji su valjani i potpuni. Možda ste vidjeli probleme s kvalitetom podataka u naslovima:

Na neki način – čak iu trećem desetljeću poslovne inteligencije – postizanje i održavanje kvalitete podataka još je teže. Neki od izazova koji pridonose stalnoj borbi za održavanje kvalitete podataka uključuju:

  • Spajanja i preuzimanja koja pokušavaju spojiti različite sustave, procese, alate i podatke iz više entiteta. 
  • Interni silosi podataka bez standarda za pomirenje integracije podataka.            
  • Jeftina pohrana olakšala je snimanje i zadržavanje velikih količina podataka. Hvatamo više podataka nego što možemo analizirati.
  • Složenost podatkovnih sustava je narasla. Postoji više dodirnih točaka između sustava evidencije gdje se podaci unose i točke potrošnje, bilo da je to skladište podataka ili oblak.

O kojim aspektima podataka govorimo? Koja svojstva podataka doprinose njihovoj kvaliteti? Postoji šest elemenata koji pridonose kvaliteti podataka. Svaka od njih je čitava disciplina. 

  • pravovremenost
    • Podaci su spremni i upotrebljivi kada su potrebni.
    • Podaci su dostupni za izvješćivanje na kraju mjeseca, na primjer, unutar prvog tjedna sljedećeg mjeseca.
  • Opravdanost
    • Podaci imaju ispravnu vrstu podataka u bazi podataka. Tekst je tekst, datumi su datumi, a brojevi su brojevi.
    • Vrijednosti su unutar očekivanih raspona. Na primjer, iako je 212 stupnjeva Fahrenheita stvarna mjerljiva temperatura, to nije valjana vrijednost za ljudsku temperaturu.  
    • Vrijednosti imaju ispravan format. 1.000000 nema isto značenje kao 1.
  • Dosljednost
    • Podaci su interno dosljedni
    • Nema duplikata zapisa
  • Integritet
    • Odnosi između tablica su pouzdani.
    • Nije nenamjerno promijenjeno. Vrijednosti se mogu pratiti do njihovog podrijetla. 
  • potpunost
    • Nema "rupa" u podacima. Svi elementi zapisa imaju vrijednosti.  
    • Ne postoje vrijednosti NULL.
  • Točnost
    • Podaci u okruženju za izvještavanje ili analitičkom okruženju – skladište podataka, bilo on-prem ili u oblaku – odražava izvorne sustave, ili sustave ili zapis
    • Podaci su iz provjerljivih izvora.

Slažemo se, dakle, da je izazov kvalitete podataka star koliko i sami podaci, problem je sveprisutan i vitalan za rješavanje. Dakle, što da radimo u vezi s tim? Razmotrite svoj program kvalitete podataka kao dugoročni projekt bez kraja.  

Kvaliteta podataka usko predstavlja koliko točno ti podaci predstavljaju stvarnost. Da budem iskren, neki podaci su važniji od drugih podataka. Saznajte koji su podaci ključni za čvrste poslovne odluke i uspjeh organizacije. Počni tamo. Usredotočite se na te podatke.  

Kao Data Quality 101, ovaj je članak uvod u temu na razini brucoša: povijest, trenutni događaji, izazov, zašto je to problem i pregled na visokoj razini o tome kako se pozabaviti kvalitetom podataka unutar organizacije. Javite nam ako ste zainteresirani za dublji uvid u bilo koju od ovih tema u članku na razini 200 ili diplomskoj razini. Ako je tako, dublje ćemo se pozabaviti pojedinostima u nadolazećim mjesecima.