Chcete kvalitu dat, ale nepoužíváte kvalitní data

by 24. 2022BI/Analytika0 komentáře

Ukážky

Kdy jsme poprvé viděli data?

  1. Polovina dvacátého století
  2. Jako nástupce Vulcana, Spocku
  3. 18,000 BC
  4. Kdo ví?  

Kam až můžeme jít do objevené historie, nacházíme lidi, kteří používají data. Zajímavé je, že data dokonce předcházejí psaná čísla. Některé z nejranějších příkladů ukládání dat pocházejí z doby kolem 18,000 2 př. n. l., kdy naši předkové na africkém kontinentu používali značky na tyčích jako formu účetnictví. Odpovědi 4 a 21 budou také akceptovány. Bylo to však v polovině dvacátého století, kdy byla Business Intelligence poprvé definována tak, jak ji chápeme dnes. BI se rozšířilo až téměř na přelomu XNUMX. století.

Výhody kvality dat jsou zřejmé. 

  • Věřte. Uživatelé budou lépe důvěřovat datům. “75 % vedoucích pracovníků nedůvěřuje svým datům"
  • Lepší rozhodnutí. Budete moci používat analytiku proti datům, abyste mohli činit chytřejší rozhodnutí.  Kvalita dat je jednou ze dvou největších výzev, kterým organizace přijímající AI čelí. (Dalším jsou sady dovedností zaměstnanců.)
  • Konkurenční výhoda.  Kvalita dat ovlivňuje provozní efektivitu, zákaznický servis, marketing a konečný výsledek – výnosy.
  • úspěch. Kvalita dat je silně spojena s podnikáním úspěch.

 

6 klíčových prvků kvality dat

Pokud svým údajům nemůžete věřit, jak můžete respektovat jejich rady?

 

Kvalita dat je dnes zásadní pro platnost rozhodnutí, která podniky učiní pomocí nástrojů BI, analytiky, strojového učení a umělé inteligence. Nejjednodušší je, že kvalita dat jsou data, která jsou platná a úplná. Možná jste viděli problémy s kvalitou dat v titulcích:

V některých ohledech – dokonce i ve třetím desetiletí Business Intelligence – je dosažení a udržení kvality dat ještě obtížnější. Některé z výzev, které přispívají k neustálému boji o udržení kvality dat, zahrnují:

  • Fúze a akvizice, které se snaží spojit různé systémy, procesy, nástroje a data z více subjektů. 
  • Interní sila dat bez standardů pro sladění integrace dat.            
  • Levné úložiště usnadnilo zachycení a uchování velkého množství dat. Zachycujeme více dat, než můžeme analyzovat.
  • Složitost datových systémů vzrostla. Mezi systémem evidence, kam se zadávají data a místem spotřeby, ať už jde o datový sklad nebo cloud, je více kontaktních bodů.

O jakých aspektech dat mluvíme? Jaké vlastnosti dat přispívají k jejich kvalitě? Ke kvalitě dat přispívá šest prvků. Každá z nich jsou celé disciplíny. 

  • Včasnost
    • Data jsou připravena a použitelná, když je potřeba.
    • Data jsou k dispozici pro přehledy na konci měsíce například během prvního týdne následujícího měsíce.
  • Platnost
    • Data mají v databázi správný datový typ. Text je text, data jsou data a čísla jsou čísla.
    • Hodnoty jsou v očekávaných rozmezích. Například, zatímco 212 stupňů Fahrenheita je skutečná měřitelná teplota, není to platná hodnota pro lidskou teplotu.  
    • Hodnoty mají správný formát. 1.000000 nemá stejný význam jako 1.
  • Konzistence
    • Data jsou vnitřně konzistentní
    • Neexistují žádné duplikáty záznamů
  • Integrita
    • Vztahy mezi tabulkami jsou spolehlivé.
    • Není neúmyslně změněno. Hodnoty lze vysledovat až k jejich původu. 
  • Úplnost
    • V datech nejsou žádné „díry“. Všechny prvky záznamu mají hodnoty.  
    • Nejsou žádné hodnoty NULL.
  • Přesnost
    • Data v reportovacím nebo analytickém prostředí – datovém skladu, ať už on-prem nebo v cloudu – odrážejí zdrojové systémy nebo systémy nebo záznamy.
    • Data jsou z ověřitelných zdrojů.

Souhlasíme tedy s tím, že problém kvality dat je starý jako data sama, problém je všudypřítomný a je nutné jej vyřešit. Takže, co s tím uděláme? Považujte svůj program kvality dat za dlouhodobý, nikdy nekončící projekt.  

Kvalita dat přesně odpovídá tomu, jak přesně tato data reprezentují realitu. Abych byl upřímný, některá data jsou důležitější než jiná. Vědět, jaká data jsou zásadní pro solidní obchodní rozhodnutí a úspěch organizace. Začněte tam. Zaměřte se na tato data.  

Jako Data Quality 101 je tento článek úvodem k tématu na úrovni prváka: historie, současné události, výzva, proč je to problém a přehled na vysoké úrovni, jak řešit kvalitu dat v organizaci. Dejte nám vědět, pokud máte zájem o hlubší prozkoumání některého z těchto témat v článku na 200 úrovních nebo na úrovni absolventů. Pokud ano, v následujících měsících se ponoříme hlouběji do specifik.