Voleu la qualitat de les dades, però no les feu servir

by Agost 24, 2022BI/Analítica0 comentaris

teasers

Quan vam veure les dades per primera vegada?

  1. Mitjans segle XX
  2. Com a successor del Vulcà, Spock
  3. 18,000 BC
  4. Qui sap?  

Tan lluny com podem remuntar a la història descoberta, trobem humans utilitzant dades. Curiosament, les dades fins i tot precedeixen els números escrits. Alguns dels primers exemples d'emmagatzematge de dades són de l'any 18,000 aC, on els nostres avantpassats del continent africà utilitzaven marques en pals com a forma de comptabilitat. També s'acceptaran les respostes 2 i 4. Va ser a mitjans del segle XX, però, quan la Business Intelligence es va definir per primera vegada tal com l'entenem avui. La BI no es va generalitzar fins gairebé el tombant del segle XXI.

Els beneficis de la qualitat de les dades són evidents. 

  • Confia. Els usuaris confiaran millor en les dades. “El 75% dels executius no confien en les seves dades"
  • Millors decisions. Podreu utilitzar analítiques contra les dades per prendre decisions més intel·ligents.  Qualitat de les dades és un dels dos reptes més grans als quals s'enfronten les organitzacions que adopten la IA. (L'altre són els conjunts d'habilitats del personal.)
  • Avantatge competitiu.  La qualitat de les dades afecta l'eficiència operativa, el servei al client, el màrqueting i el resultat final: els ingressos.
  • Success. La qualitat de les dades està molt lligada al negoci èxit.

 

6 elements clau de la qualitat de les dades

Si no pots confiar en les teves dades, com pots respectar-ne els consells?

 

Avui dia, la qualitat de les dades és fonamental per a la validesa de les decisions que prenen les empreses amb eines de BI, anàlisi, aprenentatge automàtic i intel·ligència artificial. En la seva manera més senzilla, la qualitat de les dades són dades vàlides i completes. Potser heu vist els problemes de qualitat de les dades als titulars:

D'alguna manera, fins i tot ben entrada la tercera dècada de Business Intelligence, aconseguir i mantenir la qualitat de les dades és encara més difícil. Alguns dels reptes que contribueixen a la lluita constant per mantenir la qualitat de les dades inclouen:

  • Fusions i adquisicions que intenten reunir sistemes, processos, eines i dades dispars de múltiples entitats. 
  • Sitges internes de dades sense els estàndards per conciliar la integració de dades.            
  • L'emmagatzematge econòmic ha facilitat la captura i la retenció de grans quantitats de dades. Captem més dades de les que podem analitzar.
  • La complexitat dels sistemes de dades ha crescut. Hi ha més punts de contacte entre el sistema de registre on s'introdueixen les dades i el punt de consum, ja sigui el magatzem de dades o el núvol.

De quins aspectes de les dades estem parlant? Quines propietats de les dades contribueixen a la seva qualitat? Hi ha sis elements que contribueixen a la qualitat de les dades. Cadascuna d'aquestes són disciplines senceres. 

  • oportunitat
    • Les dades estan a punt i es poden utilitzar quan calgui.
    • Les dades estan disponibles per als informes de final de mes durant la primera setmana del mes següent, per exemple.
  • Validesa
    • Les dades tenen el tipus de dades correcte a la base de dades. El text és text, les dates són dates i els números són números.
    • Els valors estan dins dels intervals esperats. Per exemple, mentre que 212 graus Fahrenheit és una temperatura real mesurable, no és un valor vàlid per a una temperatura humana.  
    • Els valors tenen el format correcte. 1.000000 no té el mateix significat que 1.
  • Consistència
    • Les dades són coherents internament
    • No hi ha duplicats de registres
  • integritat
    • Les relacions entre taules són fiables.
    • No es canvia sense voler. Els valors es poden rastrejar fins als seus orígens. 
  • Completitud
    • No hi ha "forats" a les dades. Tots els elements d'un registre tenen valors.  
    • No hi ha valors NULL.
  • Precisió
    • Les dades de l'entorn d'informes o d'anàlisi (el magatzem de dades, ja sigui local o al núvol) reflecteixen els sistemes d'origen, els sistemes o el registre.
    • Les dades provenen de fonts verificables.

Estem d'acord, doncs, que el repte de la qualitat de les dades és tan antic com les mateixes dades, el problema és omnipresent i és vital per resoldre. Aleshores, què en fem? Considereu el vostre programa de qualitat de dades com un projecte a llarg termini i sense fi.  

La qualitat de les dades representa de prop amb quina precisió aquestes dades representen la realitat. Per ser honest, algunes dades són més importants que altres. Coneix quines dades són fonamentals per prendre decisions empresarials sòlides i per a l'èxit de l'organització. Comença per aquí. Centra't en aquestes dades.  

Com a Data Quality 101, aquest article és una introducció a nivell de primer any del tema: la història, els esdeveniments actuals, el repte, per què és un problema i una visió general d'alt nivell de com abordar la qualitat de les dades dins d'una organització. Fes-nos saber si estàs interessat a aprofundir en algun d'aquests temes en un article de nivell 200 o de grau. Si és així, aprofundirem en els detalls en els propers mesos.   

BI/Analíticasense categoria
Desglosseu els vostres coneixements: una guia per a la neteja de primavera d'Analytics

Desglosseu els vostres coneixements: una guia per a la neteja de primavera d'Analytics

Desordena els teus coneixements Una guia per a la neteja de primavera d'Analytics L'any nou comença amb una explosió; Els informes de final d'any es creen i s'examinen, i després tothom s'estableix en un calendari de treball coherent. A mesura que els dies s'allarguen i els arbres i les flors floreixen,...

Més...