Ukážky
Kdy jsme poprvé viděli data?
- Polovina dvacátého století
- Jako nástupce Vulcana, Spocku
- 18,000 BC
- Kdo ví?
Kam až můžeme jít do objevené historie, nacházíme lidi, kteří používají data. Zajímavé je, že data dokonce předcházejí psaná čísla. Některé z nejranějších příkladů ukládání dat pocházejí z doby kolem 18,000 2 př. n. l., kdy naši předkové na africkém kontinentu používali značky na tyčích jako formu účetnictví. Odpovědi 4 a 21 budou také akceptovány. Bylo to však v polovině dvacátého století, kdy byla Business Intelligence poprvé definována tak, jak ji chápeme dnes. BI se rozšířilo až téměř na přelomu XNUMX. století.
Výhody kvality dat jsou zřejmé.
- Věřte. Uživatelé budou lépe důvěřovat datům. “75 % vedoucích pracovníků nedůvěřuje svým datům"
- Lepší rozhodnutí. Budete moci používat analytiku proti datům, abyste mohli činit chytřejší rozhodnutí. Kvalita dat je jednou ze dvou největších výzev, kterým organizace přijímající AI čelí. (Dalším jsou sady dovedností zaměstnanců.)
- Konkurenční výhoda. Kvalita dat ovlivňuje provozní efektivitu, zákaznický servis, marketing a konečný výsledek – výnosy.
- úspěch. Kvalita dat je silně spojena s podnikáním úspěch.
6 klíčových prvků kvality dat
Pokud svým údajům nemůžete věřit, jak můžete respektovat jejich rady?
Kvalita dat je dnes zásadní pro platnost rozhodnutí, která podniky učiní pomocí nástrojů BI, analytiky, strojového učení a umělé inteligence. Nejjednodušší je, že kvalita dat jsou data, která jsou platná a úplná. Možná jste viděli problémy s kvalitou dat v titulcích:
- Vylepšení dat CDC COVID-19 – „V průběhu pandemie CDC zdokonalovalo včasnost, úplnost a kvalitu kritických dat pro reakci.“
- Smetí dovnitř, odpadky ven; městský hlídací pes najde znepokojivý vzorec nespolehlivé kvality dat – „Nová zpráva generálního inspektora [Chicaga] říká, že „problémy s kvalitou dat“ ovlivňují „objektivitu, užitečnost a integritu“ informací používaných k alokaci zdrojů, měření výkonu zaměstnanců a monitorování řady programů.“
- GAO najde problémy s kvalitou dat během zavádění EHR VA – „VA nezajistila kvalitu dat migrovaných do svého nového systému Cerner EHR.“
V některých ohledech – dokonce i ve třetím desetiletí Business Intelligence – je dosažení a udržení kvality dat ještě obtížnější. Některé z výzev, které přispívají k neustálému boji o udržení kvality dat, zahrnují:
- Fúze a akvizice, které se snaží spojit různé systémy, procesy, nástroje a data z více subjektů.
- Interní sila dat bez standardů pro sladění integrace dat.
- Levné úložiště usnadnilo zachycení a uchování velkého množství dat. Zachycujeme více dat, než můžeme analyzovat.
- Složitost datových systémů vzrostla. Mezi systémem evidence, kam se zadávají data a místem spotřeby, ať už jde o datový sklad nebo cloud, je více kontaktních bodů.
O jakých aspektech dat mluvíme? Jaké vlastnosti dat přispívají k jejich kvalitě? Ke kvalitě dat přispívá šest prvků. Každá z nich jsou celé disciplíny.
- Včasnost
- Data jsou připravena a použitelná, když je potřeba.
- Data jsou k dispozici pro přehledy na konci měsíce například během prvního týdne následujícího měsíce.
- Platnost
- Data mají v databázi správný datový typ. Text je text, data jsou data a čísla jsou čísla.
- Hodnoty jsou v očekávaných rozmezích. Například, zatímco 212 stupňů Fahrenheita je skutečná měřitelná teplota, není to platná hodnota pro lidskou teplotu.
- Hodnoty mají správný formát. 1.000000 nemá stejný význam jako 1.
- Konzistence
- Data jsou vnitřně konzistentní
- Neexistují žádné duplikáty záznamů
- Integrita
- Vztahy mezi tabulkami jsou spolehlivé.
- Není neúmyslně změněno. Hodnoty lze vysledovat až k jejich původu.
- Úplnost
- V datech nejsou žádné „díry“. Všechny prvky záznamu mají hodnoty.
- Nejsou žádné hodnoty NULL.
- Přesnost
- Data v reportovacím nebo analytickém prostředí – datovém skladu, ať už on-prem nebo v cloudu – odrážejí zdrojové systémy nebo systémy nebo záznamy.
- Data jsou z ověřitelných zdrojů.
Souhlasíme tedy s tím, že problém kvality dat je starý jako data sama, problém je všudypřítomný a je nutné jej vyřešit. Takže, co s tím uděláme? Považujte svůj program kvality dat za dlouhodobý, nikdy nekončící projekt.
Kvalita dat přesně odpovídá tomu, jak přesně tato data reprezentují realitu. Abych byl upřímný, některá data jsou důležitější než jiná. Vědět, jaká data jsou zásadní pro solidní obchodní rozhodnutí a úspěch organizace. Začněte tam. Zaměřte se na tato data.
Jako Data Quality 101 je tento článek úvodem k tématu na úrovni prváka: historie, současné události, výzva, proč je to problém a přehled na vysoké úrovni, jak řešit kvalitu dat v organizaci. Dejte nám vědět, pokud máte zájem o hlubší prozkoumání některého z těchto témat v článku na 200 úrovních nebo na úrovni absolventů. Pokud ano, v následujících měsících se ponoříme hlouběji do specifik.