Du vill ha datakvalitet, men du använder inte kvalitetsdata

by Augusti 24, 2022BI/Analytics0 kommentarer

teasers

När såg vi data för första gången?

  1. Mitten av nittonhundratalet
  2. Som en efterträdare till Vulcan, Spock
  3. 18,000 BC
  4. Vem vet?  

Så långt tillbaka som vi kan gå i den upptäckta historien hittar vi människor som använder data. Intressant nog går data till och med före skrivna siffror. Några av de tidigaste exemplen på att lagra data är från omkring 18,000 2 f.Kr. där våra förfäder på den afrikanska kontinenten använde märken på pinnar som en form av bokföring. Svar 4 och 21 kommer också att accepteras. Det var dock mitten av nittonhundratalet när Business Intelligence först definierades som vi förstår det idag. BI blev inte utbredd förrän nästan i början av XNUMX-talet.

Fördelarna med datakvalitet är uppenbara. 

  • Litar. Användare kommer att lita bättre på data. "75 % av cheferna litar inte på sina uppgifter"
  • Bättre beslut. Du kommer att kunna använda analyser mot data för att fatta smartare beslut.  Datakvalitet är en av de två största utmaningarna för organisationer som använder AI. (Den andra är personalens färdigheter.)
  • Konkurrensfördel.  Kvaliteten på data påverkar operativ effektivitet, kundservice, marknadsföring och slutresultatet – intäkter.
  • framgång. Datakvalitet är starkt kopplat till affärer framgång.

 

6 nyckelelement för datakvalitet

Om du inte kan lita på dina uppgifter, hur kan du då respektera dess råd?

 

Idag är kvaliteten på data avgörande för giltigheten av beslut som företag fattar med BI-verktyg, analys, maskininlärning och artificiell intelligens. Som enklast är datakvalitet data som är giltiga och fullständiga. Du kanske har sett problemen med datakvalitet i rubrikerna:

På vissa sätt – även långt in på det tredje decenniet av Business Intelligence – är det ännu svårare att uppnå och upprätthålla kvaliteten på data. Några av utmaningarna som bidrar till den ständiga kampen för att upprätthålla datakvaliteten inkluderar:

  • Sammanslagningar och förvärv som försöker sammanföra olika system, processer, verktyg och data från flera enheter. 
  • Interna silos av data utan standarder för att förena integrationen av data.            
  • Billig lagring har gjort det enklare att fånga och lagra stora mängder data. Vi samlar in mer data än vi kan analysera.
  • Datasystemens komplexitet har ökat. Det finns fler kontaktpunkter mellan registreringssystemet där data läggs in och konsumtionspunkten, oavsett om det är datalagret eller molnet.

Vilka aspekter av data pratar vi om? Vilka egenskaper hos datan bidrar till dess kvalitet? Det finns sex element som bidrar till datakvaliteten. Var och en av dessa är hela discipliner. 

  • aktualitet
    • Data är redo och användbar när den behövs.
    • Uppgifterna är tillgängliga för månadsslutsrapportering till exempel under den första veckan i följande månad.
  • Giltighet
    • Datan har rätt datatyp i databasen. Text är text, datum är datum och siffror är siffror.
    • Värdena ligger inom förväntade intervall. Till exempel, medan 212 grader Fahrenheit är en faktisk mätbar temperatur, är det inte ett giltigt värde för en mänsklig temperatur.  
    • Värden har rätt format. 1.000000 har inte samma betydelse som 1.
  • Konsistens
    • Uppgifterna är internt konsekventa
    • Det finns inga dubbletter av poster
  • Integritet
    • Relationer mellan tabeller är tillförlitliga.
    • Det ändras inte oavsiktligt. Värden kan spåras till deras ursprung. 
  • Fullständighet
    • Det finns inga "hål" i data. Alla element i en post har värden.  
    • Det finns inga NULL-värden.
  • Noggrannhet
    • Data i rapporterings- eller analysmiljön – datalagret, oavsett om det är lokalt eller i molnet – återspeglar källsystemen, systemen eller posten
    • Data kommer från verifierbara källor.

Vi är alltså överens om att utmaningen med datakvalitet är lika gammal som själva data, problemet är allestädes närvarande och viktigt att lösa. Så vad gör vi åt det? Se ditt datakvalitetsprogram som ett långsiktigt, aldrig sinande projekt.  

Kvaliteten på data representerar nära hur exakt dessa data representerar verkligheten. För att vara ärlig, vissa data är viktigare än andra data. Vet vilken data som är avgörande för solida affärsbeslut och organisationens framgång. Börja där. Fokusera på den datan.  

Som Data Quality 101 är den här artikeln en introduktion på Freshman-nivå till ämnet: historiken, aktuella händelser, utmaningen, varför det är ett problem och en översikt på hög nivå av hur man hanterar datakvalitet inom en organisation. Låt oss veta om du är intresserad av att ta en djupare titt på något av dessa ämnen i en artikel på 200 nivåer eller forskarnivå. Om så är fallet kommer vi att dyka djupare in i detaljerna under de kommande månaderna.