Vi Volas Kvaliton de Datumoj, Sed Vi Ne Uzas Kvalitajn Datumojn

by Aug 24, 2022BI/Analitiko0 komentoj

incitemuloj

Kiam ni unue vidis datumojn?

  1. Meze de la dudeka jarcento
  2. Kiel posteulo al la Vulcan, Spock
  3. 18,000 BC
  4. Kiu scias?  

Tiel malproksime kiel ni povas iri en malkovrita historio ni trovas homojn uzante datumojn. Interese, datumoj eĉ antaŭas skribitajn nombrojn. Kelkaj el la plej fruaj ekzemploj de konservado de datumoj estas de ĉirkaŭ 18,000 a.K. kie niaj prapatroj sur la afrika kontinento uzis markojn sur bastonoj kiel formo de librotenado. Ankaŭ la respondoj 2 kaj 4 estos akceptataj. Tamen estis meze de la dudeka jarcento, kiam Komerca Inteligenteco unue estis difinita kiel ni komprenas ĝin hodiaŭ. BI ne iĝis ĝeneraligita ĝis preskaŭ la turno de la 21-a jarcento.

La avantaĝoj de datumkvalito estas evidentaj. 

  • trust. Uzantoj pli bone fidos la datumojn. “75% de oficuloj ne fidas siajn datumojn"
  • Pli bonaj decidoj. Vi povos uzi analizojn kontraŭ la datumoj por fari pli inteligentajn decidojn.  Kvalito de datumoj estas unu el la du plej grandaj defioj alfrontantaj organizojn adoptantajn AI. (La alia estas dungitaro-lerteco.)
  • Konkurenciva Avantaĝo.  La kvalito de datumoj influas funkcian efikecon, klientan servon, merkatadon kaj la fundon - enspezon.
  • sukceso. Datuma kvalito estas forte ligita al komerco sukceso.

 

6 Ŝlosilaj Elementoj de Datuma Kvalito

Se vi ne povas fidi viajn datumojn, kiel vi povas respekti ĝiajn konsilojn?

 

Hodiaŭ, la kvalito de datumoj estas kritika por la valideco de decidoj kiujn entreprenoj faras per BI-iloj, analizoj, maŝinlernado kaj artefarita inteligenteco. Plej simple, datumkvalito estas datumoj validaj kaj kompletaj. Vi eble vidis la problemojn de datumkvalito en la titoloj:

Iel-maniere - eĉ bone en la tria jardeko de Komerca Inteligenteco - atingi kaj konservi la kvaliton de datumoj estas eĉ pli malfacila. Iuj el la defioj, kiuj kontribuas al la konstanta lukto por konservi datumkvaliton, inkluzivas:

  • Fuzioj kaj akiroj kiuj provas kunigi malsimilajn sistemojn, procezojn, ilojn kaj datumojn de pluraj entoj. 
  • Internaj siloj de datumoj sen la normoj por akordigi la integriĝon de datumoj.            
  • Malmultekosta stokado faciligis la kapton kaj retenon de grandaj kvantoj da datumoj. Ni kaptas pli da datumoj ol ni povas analizi.
  • La komplekseco de datumsistemoj kreskis. Estas pli da tuŝpunktoj inter la sistemo de registro kie datumoj estas enigitaj kaj la punkto de konsumo, ĉu tio estas la datumstokejo aŭ nubo.

Pri kiuj aspektoj de datumoj ni parolas? Kiuj propraĵoj de la datumoj kontribuas al ĝia kvalito? Estas ses elementoj kiuj kontribuas al datumkvalito. Ĉiu el ĉi tiuj estas tutaj disciplinoj. 

  • Oportuneco
    • Datumoj estas pretaj kaj uzeblaj kiam ĝi estas bezonata.
    • La datumoj haveblas por monata raportado ene de la unua semajno de la sekva monato, ekzemple.
  • valideco
    • La datumoj havas la ĝustan datumtipo en la datumbazo. Teksto estas teksto, datoj estas datoj kaj nombroj estas nombroj.
    • Valoroj estas ene de atendataj intervaloj. Ekzemple, dum 212 gradoj Fahrenheit estas fakta mezurebla temperaturo, ĝi ne estas valida valoro por homa temperaturo.  
    • Valoroj havas la ĝustan formaton. 1.000000 ne havas la saman signifon kiel 1.
  • konsistenco
    • La datumoj estas interne konsekvencaj
    • Ne estas duplikatoj de rekordoj
  • integreco
    • Rilatoj inter tabeloj estas fidindaj.
    • Ĝi ne estas senintence ŝanĝita. Valoroj povas esti spuritaj al siaj originoj. 
  • Pleneco
    • Ne estas "truoj" en la datumoj. Ĉiuj elementoj de rekordo havas valorojn.  
    • Ne estas NULL-valoroj.
  • ĝusteco
    • Datumoj en la raporta aŭ analiza medio - la datumstokejo, ĉu surloke aŭ en la nubo - reflektas la fontsistemojn, aŭ sistemojn aŭ rekordon.
    • Datumoj estas de kontroleblaj fontoj.

Ni konsentas, do, ke la defio de datumkvalito estas same malnova kiel datumoj mem, la problemo estas ĉiea kaj esenca por solvi. Do, kion ni faru pri ĝi? Konsideru vian datumkvalitan programon kiel longdaŭran, senfinan projekton.  

La kvalito de datumoj proksime reprezentas kiom precize tiuj datumoj reprezentas realecon. Por esti honesta, iuj datumoj estas pli gravaj ol aliaj datumoj. Sciu, kiaj datumoj estas kritikaj por solidaj komercaj decidoj kaj la sukceso de la organizo. Komencu tie. Fokuso sur tiuj datumoj.  

Kiel Datuma Kvalito 101, ĉi tiu artikolo estas Unuajarulo-nivela enkonduko al la temo: la historio, aktualaĵoj, la defio, kial ĝi estas problemo kaj altnivela superrigardo de kiel trakti datumkvaliton ene de organizo. Informu nin, ĉu vi interesiĝas pri pli profunde rigardi iun el ĉi tiuj temoj en 200-nivela aŭ diplomiĝintnivela artikolo. Se jes, ni pliprofundiĝos en la specifaĵoj en la venontaj monatoj.