Du vil ha datakvalitet, men du bruker ikke kvalitetsdata

by August 24, 2022BI/Analytics0 kommentarer

teasers

Når så vi data for første gang?

  1. Midten av det tjuende århundre
  2. Som en etterfølger av Vulcan, Spock
  3. 18,000 BC
  4. Hvem vet?  

Så langt tilbake som vi kan gå i oppdaget historie finner vi mennesker som bruker data. Interessant nok går data til og med før skrevne tall. Noen av de tidligste eksemplene på lagring av data er fra rundt 18,000 2 f.Kr. hvor våre forfedre på det afrikanske kontinentet brukte merker på pinner som en form for bokføring. Svar 4 og 21 vil også bli akseptert. Det var imidlertid midten av det tjuende århundre da Business Intelligence først ble definert slik vi forstår det i dag. BI ble ikke utbredt før nesten begynnelsen av det XNUMX. århundre.

Fordelene med datakvalitet er åpenbare. 

  • Stol. Brukere vil bedre stole på dataene. "75 % av lederne stoler ikke på dataene sine"
  • Bedre beslutninger. Du vil kunne bruke analyser mot dataene for å ta smartere beslutninger.  Datakvalitet er en av de to største utfordringene for organisasjoner som tar i bruk AI. (Den andre er personalets ferdigheter.)
  • Konkurransefordel.  Kvaliteten på data påvirker operasjonell effektivitet, kundeservice, markedsføring og bunnlinjen – inntekter.
  • Suksess. Datakvalitet er sterkt knyttet til virksomhet suksess.

 

6 nøkkelelementer for datakvalitet

Hvis du ikke kan stole på dataene dine, hvordan kan du respektere rådene dine?

 

I dag er kvaliteten på data avgjørende for gyldigheten av beslutninger bedrifter tar med BI-verktøy, analyser, maskinlæring og kunstig intelligens. På det enkleste er datakvalitet data som er gyldige og fullstendige. Du har kanskje sett problemene med datakvalitet i overskriftene:

På noen måter – selv langt inn i det tredje tiåret med Business Intelligence – er det enda vanskeligere å oppnå og opprettholde kvaliteten på data. Noen av utfordringene som bidrar til den konstante kampen for å opprettholde datakvaliteten inkluderer:

  • Fusjoner og oppkjøp som prøver å bringe sammen ulike systemer, prosesser, verktøy og data fra flere enheter. 
  • Interne siloer av data uten standarder for å forene integrering av data.            
  • Billig lagring har gjort fangst og oppbevaring av store datamengder enklere. Vi fanger opp mer data enn vi kan analysere.
  • Kompleksiteten til datasystemer har vokst. Det er flere kontaktpunkter mellom registreringssystemet der data legges inn og forbrukspunktet, enten det er datavarehuset eller skyen.

Hvilke aspekter ved data snakker vi om? Hvilke egenskaper ved dataene bidrar til kvaliteten? Det er seks elementer som bidrar til datakvaliteten. Hver av disse er hele disipliner. 

  • aktualitet
    • Data er klare og brukbare når det trengs.
    • Dataene er tilgjengelige for månedssluttrapportering innen den første uken i påfølgende måned, for eksempel.
  • Gyldighet
    • Dataene har riktig datatype i databasen. Tekst er tekst, datoer er datoer og tall er tall.
    • Verdiene er innenfor forventede områder. For eksempel, mens 212 grader fahrenheit er en faktisk målbar temperatur, er det ikke en gyldig verdi for en menneskelig temperatur.  
    • Verdier har riktig format. 1.000000 har ikke samme betydning som 1.
  • Konsistens
    • Dataene er internt konsistente
    • Det er ingen duplikater av poster
  • Integritet
    • Relasjoner mellom tabeller er pålitelige.
    • Det er ikke utilsiktet endret. Verdier kan spores til deres opprinnelse. 
  • fullstendighet
    • Det er ingen "hull" i dataene. Alle elementene i en post har verdier.  
    • Det er ingen NULL-verdier.
  • Nøyaktighet
    • Data i rapporterings- eller analysemiljøet – datavarehuset, enten det er lokalt eller i skyen – gjenspeiler kildesystemene, systemene eller posten
    • Data er fra kontrollerbare kilder.

Vi er altså enige om at utfordringen med datakvalitet er like gammel som dataene i seg selv, problemet er allestedsnærværende og viktig å løse. Så hva gjør vi med det? Betrakt datakvalitetsprogrammet ditt som et langsiktig, uendelig prosjekt.  

Kvaliteten på data representerer tett hvor nøyaktig disse dataene representerer virkeligheten. For å være ærlig er noen data viktigere enn andre data. Vet hvilke data som er avgjørende for solide forretningsbeslutninger og suksessen til organisasjonen. Start der. Fokuser på disse dataene.  

Som Data Quality 101 er denne artikkelen en introduksjon på førsteårsnivå til emnet: historien, aktuelle hendelser, utfordringen, hvorfor det er et problem og en oversikt på høyt nivå over hvordan man adresserer datakvalitet i en organisasjon. Gi oss beskjed hvis du er interessert i å ta en dypere titt på noen av disse emnene i en artikkel på 200-nivå eller høyere nivå. I så fall vil vi dykke dypere inn i detaljene i løpet av de kommende månedene.