Želite kakovost podatkov, vendar ne uporabljate kakovostnih podatkov

by Avgust 24, 2022BI/Analitika0 komentarji

Dražljivke

Kdaj smo prvič videli podatke?

  1. Sredina dvajsetega stoletja
  2. Kot naslednik Vulkana, Spock
  3. 18,000 BC
  4. Kdo ve?  

Kolikor se lahko vrnemo v odkrito zgodovino, najdemo ljudi, ki uporabljajo podatke. Zanimivo je, da so podatki celo pred zapisanimi številkami. Nekateri najzgodnejši primeri shranjevanja podatkov so iz leta okoli 18,000 pr. n. št., ko so naši predniki na afriški celini uporabljali oznake na palicah kot obliko knjigovodstva. Upoštevana bosta tudi odgovora 2 in 4. Vendar je bila sredina dvajsetega stoletja, ko je bila poslovna inteligenca prvič opredeljena, kot jo razumemo danes. BI se je razširil šele skoraj na prelomu 21. stoletja.

Prednosti kakovosti podatkov so očitne. 

  • Zaupajte. Uporabniki bodo bolje zaupali podatkom. “75 % vodstvenih delavcev ne zaupa svojim podatkom"
  • Boljše odločitve. Za sprejemanje pametnejših odločitev boste lahko uporabili analitiko v primerjavi s podatki.  Kakovost podatkov je eden od dveh največjih izzivov, s katerimi se soočajo organizacije, ki sprejemajo AI. (Drugo so nabori spretnosti osebja.)
  • Konkurenčna prednost.  Kakovost podatkov vpliva na operativno učinkovitost, storitve za stranke, trženje in bistvo – prihodke.
  • Uspeh. Kakovost podatkov je močno povezana s poslovanjem uspeh.

 

6 ključnih elementov kakovosti podatkov

Če ne morete zaupati svojim podatkom, kako lahko spoštujete njihove nasvete?

 

Danes je kakovost podatkov ključnega pomena za veljavnost odločitev, ki jih podjetja sprejemajo z orodji poslovne inteligence, analitiko, strojnim učenjem in umetno inteligenco. Najenostavneje, kakovost podatkov so podatki, ki so veljavni in popolni. Morda ste v naslovih videli težave s kakovostjo podatkov:

Na nek način – tudi v tretjem desetletju poslovne inteligence – je doseganje in ohranjanje kakovosti podatkov še težje. Nekateri izzivi, ki prispevajo k nenehnemu boju za ohranjanje kakovosti podatkov, vključujejo:

  • Združitve in prevzemi, ki poskušajo združiti različne sisteme, procese, orodja in podatke iz več subjektov. 
  • Notranji silosi podatkov brez standardov za uskladitev integracije podatkov.            
  • Poceni prostor za shranjevanje je olajšal zajem in hrambo velikih količin podatkov. Zajamemo več podatkov, kot jih lahko analiziramo.
  • Kompleksnost podatkovnih sistemov je narasla. Med sistemom zapisa, kjer se podatki vnašajo, in točko porabe je več stičnih točk, pa naj bo to podatkovno skladišče ali oblak.

O katerih vidikih podatkov govorimo? Katere lastnosti podatkov prispevajo k njihovi kakovosti? K kakovosti podatkov prispeva šest elementov. Vsaka od teh so cele discipline. 

  • Pravočasnost
    • Podatki so pripravljeni in uporabni, ko jih potrebujemo.
    • Podatki so na voljo za poročanje ob koncu meseca, na primer v prvem tednu naslednjega meseca.
  • veljavnost
    • Podatki imajo pravilno vrsto podatkov v bazi podatkov. Besedilo je besedilo, datumi so datumi in številke so številke.
    • Vrednosti so znotraj pričakovanih razponov. Na primer, čeprav je 212 stopinj Fahrenheita dejanska merljiva temperatura, to ni veljavna vrednost za človeško temperaturo.  
    • Vrednosti imajo pravilno obliko. 1.000000 nima enakega pomena kot 1.
  • Usklajenost
    • Podatki so notranje skladni
    • Ni dvojnikov zapisov
  • Integriteta
    • Relacije med tabelami so zanesljive.
    • Ni nenamerno spremenjeno. Vrednotam je mogoče slediti do njihovega izvora. 
  • Popolnost
    • V podatkih ni "lukenj". Vsi elementi zapisa imajo vrednosti.  
    • Ni vrednosti NULL.
  • natančnost
    • Podatki v poročevalskem ali analitičnem okolju – podatkovno skladišče, bodisi lokalno ali v oblaku – odražajo izvorne sisteme ali sisteme ali zapis
    • Podatki so iz preverljivih virov.

Strinjamo se torej, da je izziv kakovosti podatkov star toliko kot podatki sami, problem je vseprisoten in ga je ključnega pomena rešiti. Torej, kaj naj naredimo glede tega? Razmislite o svojem programu kakovosti podatkov kot o dolgoročnem, nikoli končanem projektu.  

Kakovost podatkov natančno predstavlja, kako natančno ti podatki predstavljajo resničnost. Če sem iskren, so nekateri podatki pomembnejši od drugih. Vedite, kateri podatki so ključni za trdne poslovne odločitve in uspeh organizacije. Začni tam. Osredotočite se na te podatke.  

Kot Data Quality 101 je ta članek uvod v temo na ravni novincev: zgodovina, trenutni dogodki, izziv, zakaj je to težava in pregled na visoki ravni, kako obravnavati kakovost podatkov v organizaciji. Sporočite nam, če vas zanima globlji pregled katere koli od teh tem v članku za 200-stopenjsko ali podiplomsko raven. Če je tako, se bomo v prihodnjih mesecih poglobili v podrobnosti.