Teasadairean
Cuin a chunnaic sinn dàta an toiseach?
- Meadhan an fhicheadamh linn
- Mar neach-leantainn an Vulcan, Spock
- 18,000 BC
- Cò a tha fiosach?
Cho fada air ais ‘s as urrainn dhuinn a dhol ann an eachdraidh a chaidh a lorg lorg sinn daoine a’ cleachdadh dàta. Gu inntinneach, tha dàta eadhon ro àireamhan sgrìobhte. Tha cuid de na h-eisimpleirean as tràithe de stòradh dàta bho timcheall air 18,000 RC far an do chleachd ar sinnsearan air mòr-thìr Afraganach comharran air maidean mar dhòigh air cumail leabhraichean. Gabhar ri freagairtean 2 agus 4 cuideachd. B’ e meadhan an fhicheadamh linn, ge-tà, nuair a chaidh Business Intelligence a mhìneachadh an toiseach mar a thuigeas sinn e an-diugh. Cha do dh'fhàs BI farsaing gu faisg air toiseach an 21mh linn.
Tha buannachdan càileachd dàta follaiseach.
- Urras. Bidh earbsa nas fheàrr aig luchd-cleachdaidh san dàta. “Chan eil earbsa aig 75% de luchd-gnìomh san dàta aca"
- Co-dhùnaidhean nas fheàrr. Bidh e comasach dhut anailisean an-aghaidh an dàta a chleachdadh gus co-dhùnaidhean nas buige a dhèanamh. Càileachd dàta Is e seo aon den dà dhùbhlan as motha a tha mu choinneamh bhuidhnean a tha a’ gabhail ri AI. (Is e am fear eile seataichean sgilean luchd-obrach.)
- Buannachd Farpaiseach. Tha càileachd an dàta a’ toirt buaidh air èifeachdas obrachaidh, seirbheis teachdaiche, margaidheachd agus a’ bhun-loidhne – teachd a-steach.
- Success. Tha càileachd dàta ceangailte gu mòr ri gnìomhachas soirbheachadh.
6 Prìomh eileamaidean de chàileachd dàta
Mura h-urrainn dhut earbsa a bhith agad san dàta agad, ciamar a bheir thu spèis don chomhairle aige?
An-diugh, tha càileachd an dàta deatamach do dhligheachd cho-dhùnaidhean a nì gnìomhachasan le innealan BI, anailisean, ionnsachadh innealan, agus inntleachd fuadain. Aig an ìre as sìmplidhe, is e càileachd dàta dàta a tha dligheach agus coileanta. Is dòcha gu bheil thu air duilgheadasan càileachd dàta fhaicinn anns na cinn-naidheachd:
- Leasachadh dàta COVID-19 CDC - “Thar cùrsa a’ ghalair lèir-sgaoilte, tha CDC air a bhith ag adhartachadh ùinealachd, iomlanachd agus càileachd dàta èiginneach airson an fhreagairt. ”
- Sguab a-steach, sgudal a-mach; buidheann faire a’ bhaile a’ lorg pàtran trioblaideach de chàileachd dàta neo-earbsach - “Tha aithisg ùr bhon neach-sgrùdaidh coitcheann an gnìomh [Chicago] ag ràdh gu bheil “cùisean càileachd dàta” a’ toirt buaidh air “oibseact, goireasachd agus ionracas” an fhiosrachaidh a thathar a’ cleachdadh gus goireasan a riarachadh, coileanadh luchd-obrach a thomhas agus sùil a chumail air grunn phrògraman.”
- Bidh GAO a’ lorg cùisean càileachd dàta aig àm sgaoileadh EHR VA - “Cha do rinn an VA cinnteach gun deach càileachd an dàta a ghluasad chun t-siostam ùr Cerner EHR aca."
Ann an cuid de dhòighean - eadhon fada a-steach don treas deichead de Eòlas Gnìomhachais - tha e eadhon nas duilghe càileachd dàta a choileanadh agus a chumail suas. Am measg cuid de na dùbhlain a tha a’ cur ris an strì leantainneach a thaobh cumail suas càileachd dàta tha:
- Co-aonaidhean agus buannachdan a bhios a’ feuchainn ri siostaman, pròiseasan, innealan agus dàta eadar-dhealaichte a thoirt còmhla bho ioma-bhuidheann.
- Seilos dàta a-staigh às aonais na h-inbhean gus amalachadh dàta a rèiteachadh.
- Tha stòradh saor air a dhèanamh nas fhasa glacadh agus glèidheadh tòrr dàta. Bidh sinn a’ glacadh barrachd dàta na as urrainn dhuinn a sgrùdadh.
- Tha iom-fhillteachd nan siostaman dàta air fàs. Tha barrachd phuingean suathaidh eadar an siostam clàraidh far a bheil dàta air a chuir a-steach agus an ìre caitheamh, ge bith an e sin an taigh-bathair dàta no an sgòth.
Dè na taobhan den dàta air a bheil sinn a’ bruidhinn? Dè na feartan a th’ aig an dàta a tha a’ cur ri càileachd an dàta? Tha sia eileamaidean ann a tha a’ cur ri càileachd dàta. Tha gach aon dhiubh sin nan cuspairean iomlan.
- Uair
- Tha an dàta deiseil agus faodar a chleachdadh nuair a bhios feum air.
- Tha an dàta ri fhaighinn airson aithris deireadh-mìosa taobh a-staigh a’ chiad seachdain den ath mhìos, mar eisimpleir.
- Validity
- Tha an seòrsa dàta ceart aig an dàta san stòr-dàta. Is e teacsa teacsa, is e cinn-latha cinn-latha agus is e àireamhan àireamhan.
- Tha luachan taobh a-staigh raointean ris a bheil dùil. Mar eisimpleir, ged a tha 212 ceum fahrenheit na fhìor theodhachd a ghabhas tomhas, chan e luach dligheach a th’ ann airson teòthachd daonna.
- Tha an cruth ceart aig luachan. Chan eil an aon chiall aig 1.000000 ri 1.
- Co-chòrdadh
- Tha an dàta co-chòrdail a-staigh
- Chan eil lethbhreacan de chlàran ann
- ionracas
- Tha an dàimh eadar bùird earbsach.
- Chan eil e air atharrachadh gu mì-fhortanach. Faodar luachan a lorg a rèir an tùs.
- Iomlanachd
- Chan eil “tuill” anns an dàta. Tha luachan aig gach eileamaid de chlàr.
- Chan eil luachan NULL ann.
- mionaideachd
- Tha dàta san àrainneachd aithris no anailis - an taigh-bathair dàta, ge bith an ann air-prem no san sgòth - a’ nochdadh na siostaman stòr, no siostaman no clàr
- Tha an dàta bho thùsan dearbhaidh.
Tha sinn ag aontachadh, ma-thà, gu bheil an dùbhlan a thaobh càileachd dàta cho sean ris an dàta fhèin, gu bheil an duilgheadas uile-làthaireach agus deatamach airson fuasgladh. Mar sin, dè a nì sinn mu dheidhinn? Beachdaich air a’ phrògram càileachd dàta agad mar phròiseact fad-ùine gun chrìoch.
Tha càileachd an dàta gu dlùth a’ riochdachadh cho ceart agus a tha an dàta sin a’ riochdachadh fìrinn. Gus a bhith onarach, tha cuid de dhàta nas cudromaiche na dàta eile. Biodh fios agad dè an dàta a tha deatamach airson co-dhùnaidhean gnìomhachais làidir agus soirbheachas na buidhne. Tòisich an sin. Fòcas air an dàta sin.
Mar Data Quality 101, tha an artaigil seo na ro-ràdh aig ìre Freshman air a’ chuspair: an eachdraidh, tachartasan làithreach, an dùbhlan, carson a tha e na dhuilgheadas agus tar-shealladh àrd-ìre air mar a dhèiligeas tu ri càileachd dàta taobh a-staigh buidheann. Leig fios dhuinn ma tha ùidh agad ann a bhith a’ toirt sùil nas doimhne air gin de na cuspairean sin ann an artaigil aig ìre 200 no ceumnaiche. Ma tha, thèid sinn nas doimhne a-steach do na mion-fhiosrachadh anns na mìosan a tha romhainn.