Ugratások
Mikor láttunk először adatokat?
- A huszadik század közepe
- A Vulcan utódjaként Spock
- 18,000 BC
- Ki tudja?
Amennyire visszamegyünk a felfedezett történelemben, találunk embereket adatok felhasználásával. Érdekes módon az adatok még az írott számokat is megelőzik. Az adatok tárolásának legkorábbi példái a Kr.e. 18,000 2 körüli időkből valók, amikor az afrikai kontinensen élő őseink a pálcákon jeleket használtak könyvelési formaként. A 4. és 21. választ is elfogadjuk. A huszadik század közepe volt, amikor először határozták meg az üzleti intelligenciát, ahogyan ma értjük. A BI csak a XNUMX. század fordulójáig terjedt el.
Az adatminőség előnyei nyilvánvalóak.
- Bízzon. A felhasználók jobban megbíznak az adatokban. "A vezetők 75%-a nem bízik az adataiban"
- Jobb döntések. Az adatok elemzésével okosabb döntéseket hozhat. Adat minőség az egyike a két legnagyobb kihívásnak, amellyel az AI-t alkalmazó szervezeteknek szembe kell nézniük. (A másik a személyzeti készségkészlet.)
- Versenyelőny. Az adatok minősége befolyásolja a működési hatékonyságot, az ügyfélszolgálatot, a marketinget és a lényeget – a bevételt.
- Siker. Az adatminőség szorosan összefügg az üzlettel siker.
6 Az adatminőség kulcselemei
Ha nem bízhat az adataiban, hogyan tudja tiszteletben tartani a tanácsait?
Manapság az adatok minősége kritikus fontosságú a vállalkozások által a BI-eszközökkel, elemzésekkel, gépi tanulással és mesterséges intelligenciával hozott döntések érvényessége szempontjából. A legegyszerűbben az adatminőség az érvényes és teljes adat. Láthattad már az adatminőséggel kapcsolatos problémákat a címszavakban:
- A CDC COVID-19 adatfejlesztése – „A járvány során a CDC javította a válaszadáshoz szükséges kritikus adatok időszerűségét, teljességét és minőségét.”
- Szemet be, szemét ki; A városfigyelő aggasztó mintát talált a megbízhatatlan adatminőség miatt – „A [Chicago] megbízott főfelügyelőjének új jelentése szerint az „adatminőségi problémák” befolyásolják az erőforrások elosztására, az alkalmazottak teljesítményének mérésére és számos program nyomon követésére használt információk „objektivitását, hasznosságát és integritását”.
- A GAO adatminőségi problémákat talál a VA EHR bevezetése során – „A VA nem biztosította az új Cerner EHR rendszerébe migrált adatok minőségét.”
Bizonyos szempontból – még az üzleti intelligencia harmadik évtizedében is – az adatok minőségének elérése és fenntartása még nehezebb. Az adatminőség fenntartásáért folytatott folyamatos küzdelemhez hozzájáruló kihívások közül néhány:
- Összeolvadások és felvásárlások, amelyek különböző rendszereket, folyamatokat, eszközöket és adatokat próbálnak összehozni több entitástól.
- Belső adatsilók az adatok integrációját összeegyeztető szabványok nélkül.
- Az olcsó tárolás megkönnyítette a nagy mennyiségű adat rögzítését és megőrzését. Több adatot rögzítünk, mint amennyit elemezni tudunk.
- Az adatrendszerek összetettsége nőtt. Több érintkezési pont van az adatbeviteli rendszer és a fogyasztási pont között, legyen az adattárház vagy felhő.
Milyen adatelemekről beszélünk? Milyen tulajdonságai járulnak hozzá az adatok minőségéhez? Hat elem van, amely hozzájárul az adatok minőségéhez. Ezek mindegyike teljes tudományág.
- időszerűség
- Az adatok készen állnak és felhasználhatók, amikor szükség van rájuk.
- Az adatok például a következő hónap első hetében állnak rendelkezésre a hónap végi jelentésekhez.
- Érvényesség
- Az adatok a megfelelő adattípussal rendelkeznek az adatbázisban. A szöveg szöveg, a dátumok dátumok, a számok pedig számok.
- Az értékek a várt tartományon belül vannak. Például míg a 212 Fahrenheit-fok ténylegesen mérhető hőmérséklet, emberi hőmérsékletre nem érvényes érték.
- Az értékek megfelelő formátumúak. 1.000000 nem ugyanazt jelenti, mint 1.
- Következetesség
- Az adatok belsőleg konzisztensek
- Nincsenek ismétlődő rekordok
- Sértetlenség
- A táblák közötti kapcsolatok megbízhatóak.
- Nem véletlenül változtatják meg. Az értékek eredetükre vezethetők vissza.
- Teljesség
- Az adatokban nincsenek „lyukak”. A rekord minden elemének értéke van.
- Nincsenek NULL értékek.
- Pontosság
- A jelentéskészítő vagy elemző környezetben – az adattárházban, akár helyszíni, akár felhőben – lévő adatok a forrásrendszereket, rendszereket vagy rekordokat tükrözik.
- Az adatok ellenőrizhető forrásból származnak.
Egyetértünk tehát abban, hogy az adatminőség kihívása egyidős, mint maguk az adatok, a probléma mindenütt jelen van, és létfontosságú a megoldása. Szóval, mit tegyünk ellene? Tekintse adatminőségi programját hosszú távú, véget nem érő projektnek.
Az adatok minősége pontosan tükrözi, hogy az adatok mennyire pontosan tükrözik a valóságot. Őszintén szólva néhány adat fontosabb, mint más adatok. Tudja, hogy mely adatok kritikusak a szilárd üzleti döntések és a szervezet sikere szempontjából. Kezdje ott. Koncentrálj azokra az adatokra.
Adatminőség 101 néven ez a cikk egy újonc szintű bevezető a témába: az előzmények, a jelenlegi események, a kihívás, miért jelent ez problémát, és magas szintű áttekintést nyújt arról, hogyan lehet kezelni az adatminőséget egy szervezeten belül. Ossza meg velünk, ha szeretne mélyebben megvizsgálni e témák bármelyikét egy 200 szintű vagy diplomás szintű cikkben. Ha igen, akkor az elkövetkező hónapokban mélyebbre merülünk a részletekben.