Gusto Mo ng Kalidad ng Data, Ngunit Hindi Ka Gumagamit ng De-kalidad na Data

by Agosto 24, 2022BI/Analytics0 komento

Mga Teasers

Kailan tayo unang nakakita ng data?

  1. Kalagitnaan ng ikadalawampu siglo
  2. Bilang kahalili sa Vulcan, Spock
  3. 18,000 BC
  4. Sino ang nakakaalam?  

Sa abot ng ating makakaya sa natuklasang kasaysayan, makikita natin ang mga tao na gumagamit ng data. Kapansin-pansin, ang data ay nauuna pa sa mga nakasulat na numero. Ang ilan sa mga pinakaunang halimbawa ng pag-iimbak ng data ay mula sa humigit-kumulang 18,000 BC kung saan ang ating mga ninuno sa kontinente ng Africa ay gumamit ng mga marka sa mga stick bilang isang paraan ng bookkeeping. Ang mga sagot 2 at 4 ay tatanggapin din. Noong kalagitnaan ng ikadalawampu siglo, gayunpaman, nang unang tinukoy ang Business Intelligence ayon sa pagkakaintindi natin ngayon. Ang BI ay hindi naging laganap hanggang sa halos pagliko ng ika-21 siglo.

Ang mga benepisyo ng kalidad ng data ay halata. 

  • Pagkatiwalaan. Mas magtitiwala ang mga user sa data. “75% ng mga Executive ay Hindi Nagtitiwala sa Kanilang Data"
  • Mas mahusay na mga desisyon. Magagawa mong gumamit ng analytics laban sa data upang makagawa ng mas matalinong mga pagpapasya.  Kalidad ng data ay isa sa dalawang pinakamalaking hamon na kinakaharap ng mga organisasyong gumagamit ng AI. (Ang isa pa ay mga set ng kasanayan sa kawani.)
  • Kakumpitensyang kalamangan.  Ang kalidad ng data ay nakakaapekto sa kahusayan sa pagpapatakbo, serbisyo sa customer, marketing at sa ilalim na linya - kita.
  • Tagumpay. Ang kalidad ng data ay lubos na naka-link sa negosyo tagumpay.

 

6 Pangunahing Elemento ng Kalidad ng Data

Kung hindi mo mapagkakatiwalaan ang iyong data, paano mo igagalang ang payo nito?

 

Sa ngayon, ang kalidad ng data ay kritikal sa validity ng mga desisyong ginagawa ng mga negosyo gamit ang BI tools, analytics, machine learning, at artificial intelligence. Sa pinakasimpleng nito, ang kalidad ng data ay ang data na wasto at kumpleto. Maaaring nakita mo ang mga problema sa kalidad ng data sa mga headline:

Sa ilang mga paraan - kahit na sa ikatlong dekada ng Business Intelligence - ang pagkamit at pagpapanatili ng kalidad ng data ay mas mahirap. Ang ilan sa mga hamon na nag-aambag sa patuloy na pakikibaka sa pagpapanatili ng kalidad ng data ay kinabibilangan ng:

  • Mga pagsasanib at pagkuha na sumusubok na pagsama-samahin ang magkakaibang sistema, proseso, tool at data mula sa maraming entity. 
  • Panloob na silos ng data nang walang mga pamantayan upang magkasundo ang pagsasama ng data.            
  • Pinadali ng murang storage ang pagkuha at pagpapanatili ng malaking halaga ng data. Kumuha kami ng higit pang data kaysa sa maaari naming pag-aralan.
  • Ang pagiging kumplikado ng mga sistema ng data ay lumago. Mayroong higit pang mga touchpoint sa pagitan ng system of record kung saan ipinasok ang data at ang punto ng pagkonsumo, maging iyon man ang data warehouse o cloud.

Anong mga aspeto ng data ang pinag-uusapan natin? Anong mga katangian ng data ang nakakatulong sa kalidad nito? Mayroong anim na elemento na nag-aambag sa kalidad ng data. Ang bawat isa sa mga ito ay buong disiplina. 

  • pagkanasapanahon
    • Ang data ay handa at magagamit kapag ito ay kinakailangan.
    • Ang data ay magagamit para sa pagtatapos ng buwan na pag-uulat sa loob ng unang linggo ng susunod na buwan, halimbawa.
  • Bisa
    • Ang data ay may tamang uri ng data sa database. Ang teksto ay teksto, ang mga petsa ay mga petsa at ang mga numero ay mga numero.
    • Ang mga halaga ay nasa loob ng inaasahang saklaw. Halimbawa, habang ang 212 degrees fahrenheit ay isang aktwal na nasusukat na temperatura, hindi ito wastong halaga para sa temperatura ng tao.  
    • May tamang format ang mga value. Ang 1.000000 ay walang katulad na kahulugan sa 1.
  • Hindi pagbabago
    • Ang data ay panloob na pare-pareho
    • Walang mga duplicate ng mga tala
  • Integridad
    • Ang mga ugnayan sa pagitan ng mga talahanayan ay maaasahan.
    • Ito ay hindi sinasadyang nabago. Ang mga halaga ay maaaring masubaybayan sa kanilang mga pinagmulan. 
  • Pagkumpleto
    • Walang mga "butas" sa data. Ang lahat ng mga elemento ng isang talaan ay may mga halaga.  
    • Walang mga NULL na halaga.
  • Ganap na kawastuan
    • Ang data sa pag-uulat o analytic na kapaligiran – ang data warehouse, nasa prem man o nasa cloud – ay sumasalamin sa mga source system, o system o record
    • Ang data ay mula sa mga nabe-verify na mapagkukunan.

Sumasang-ayon kami, kung gayon, na ang hamon ng kalidad ng data ay kasingtanda ng data mismo, ang problema ay nasa lahat ng dako at mahalagang lutasin. Kaya, ano ang gagawin natin dito? Isaalang-alang ang iyong programa sa kalidad ng data bilang isang pangmatagalan, walang katapusang proyekto.  

Ang kalidad ng data ay malapit na kumakatawan sa kung gaano katumpak ang data na iyon ay kumakatawan sa katotohanan. Sa totoo lang, mas mahalaga ang ilang data kaysa sa ibang data. Alamin kung anong data ang kritikal sa matatag na desisyon sa negosyo at tagumpay ng organisasyon. Magsimula doon. Tumutok sa data na iyon.  

Bilang Data Quality 101, ang artikulong ito ay isang panimula sa antas ng Freshman sa paksa: ang kasaysayan, mga kasalukuyang kaganapan, ang hamon, kung bakit ito isang problema at isang mataas na antas na pangkalahatang-ideya kung paano tugunan ang kalidad ng data sa loob ng isang organisasyon. Ipaalam sa amin kung interesado ka sa mas malalim na pagtingin sa alinman sa mga paksang ito sa isang 200-level o graduate-level na artikulo. Kung gayon, sumisid kami nang mas malalim sa mga detalye sa mga darating na buwan.   

BI/AnalyticsWalang Kategorya
Alisin ang Iyong Mga Insight: Isang Gabay sa Analytics Spring Cleaning

Alisin ang Iyong Mga Insight: Isang Gabay sa Analytics Spring Cleaning

Unclutter Your Insights Isang Gabay sa Analytics Spring Cleaning Nagsisimula ang bagong taon sa isang malakas na putok; Ang mga ulat sa pagtatapos ng taon ay nilikha at sinusuri, at pagkatapos ay ang lahat ay naaayos sa isang pare-parehong iskedyul ng trabaho. Habang humahaba ang mga araw at namumukadkad ang mga puno at bulaklak,...

Magbasa Pa

BI/AnalyticsWalang Kategorya
NY Style vs. Chicago Style Pizza: Isang Masarap na Debate

NY Style vs. Chicago Style Pizza: Isang Masarap na Debate

Kapag binibigyang-kasiyahan ang ating mga pananabik, ilang bagay ang maaaring karibal sa saya ng isang mainit na hiwa ng pizza. Ang debate sa pagitan ng New York-style at Chicago-style na pizza ay nagdulot ng madamdaming talakayan sa loob ng mga dekada. Ang bawat istilo ay may sariling natatanging katangian at tapat na tagahanga....

Magbasa Pa

BI/Analytics
Mga Catalog ng Analytics – Isang Rising Star sa Analytics Ecosystem

Mga Catalog ng Analytics – Isang Rising Star sa Analytics Ecosystem

Panimula Bilang Chief Technology Officer (CTO), palagi akong nagbabantay sa mga umuusbong na teknolohiya na nagbabago sa paraan ng paglapit namin sa analytics. Ang isang ganoong teknolohiya na nakakuha ng aking pansin sa nakalipas na ilang taon at may napakalaking pangako ay ang Analytics...

Magbasa Pa