Analytics breug

by Aug 31, 2022BI/Anailis0 beachdan

Analytics breug

Claonadh Mion-sgrùdadh

 

Thuirt Mark Twain gu mì-chinnteach rudeigin mar, “Tha trì seòrsaichean bhreugan ann: breugan, breugan damnaichte agus anailisean. " 

Tha sinn a’ gabhail ris gu bheil anailis a’ toirt dhuinn seallaidhean feumail, gnìomhach. Is e an rud nach bi sinn gu tric a’ tuigsinn mar a tha ar claon-bhreith fhèin agus claonadh dhaoine eile a’ toirt buaidh air na freagairtean a gheibh sinn le eadhon am bathar-bog agus na siostaman as ionnsaichte. Aig amannan, faodaidh sinn a bhith air ar làimhseachadh gu mì-onarach, ach, mar as trice, is dòcha gur e claonaidhean seòlta agus neo-fhiosrachail a bhios a’ sruthadh a-steach don anailis againn. Tha iomadach adhbhar air cùlaibh mion-sgrùdadh claon. Aig amannan bidh buaidh aig na toraidhean neo-chlaon a tha sinn a’ sùileachadh bho shaidheans le 1) roghainnean seòlta a thaobh mar a tha an dàta air a thaisbeanadh, 2) dàta neo-chunbhalach no neo-riochdachail, 3) mar a tha siostaman AI air an trèanadh, 4) aineolas, neo-chomas luchd-rannsachaidh no feadhainn eile a tha a’ feuchainn. gus an sgeulachd innse, 5) an anailis fhèin.    

Tha an taisbeanadh claon

Tha cuid de bhreugan nas fhasa am faicinn na cuid eile. Nuair a bhios fios agad dè a choimheadas tu is dòcha gum bi thu nas fhasa a lorg grafaichean agus clàran meallta. 

Tha co-dhiù còig dòighean air dàta a thaisbeanadh gu meallta: 1) Seall seata dàta cuingealaichte, 2). Seall co-dhàimhean neo-cheangailte, 3) Seall dàta gu mearachdach, 4) Seall dàta gu neo-ghnàthach, no 5). Seall dàta ro-shìmplidh.

Seall seata dàta cuibhrichte

Le bhith a 'cuingealachadh an dàta, no le bhith a' taghadh earrann neo-thuairmeasach den dàta, faodaidh e sgeulachd innse nach eil co-chòrdail ris an dealbh mhòr. Is e droch samplachadh, no togail cherry, nuair a bhios an anailisiche a’ cleachdadh sampall neo-riochdachail gus buidheann nas motha a riochdachadh. 

Sa Mhàrt 2020, Roinn Slàinte Poblach Georgia fhoillseachadh a’ chairt seo mar phàirt den aithisg inbhe làitheil aca. Tha e dha-rìribh a’ togail barrachd cheistean na tha e a’ freagairt.  

Is e aon de na rudan a tha a dhìth co-theacsa. Mar eisimpleir, bhiodh e cuideachail fios a bhith agad dè an àireamh sa cheud den àireamh-sluaigh airson gach buidheann aoise. Is e cùis eile leis a’ chlàr-cearcaill le coltas sìmplidh na buidhnean aoise neo-chòmhnard. Tha 0 bliadhna aig 17-18, tha 18 aig 59-42, tha 60+ ceann fosgailte, ach tha timcheall air 40 bliadhna aige. Is e an co-dhùnadh, leis a’ chlàr seo a-mhàin, gu bheil a’ mhòr-chuid de chùisean anns a’ bhuidheann aoise 18-59. Tha coltas nach bi cùisean COVID a’ toirt buaidh cho mòr air a’ bhuidheann aois 60+. Ach chan e seo an sgeulachd gu lèir.

Airson coimeas a dhèanamh, tha an seata dàta eadar-dhealaichte seo air an Làrach-lìn CDC a’ clàradh chùisean COVID a rèir buidheann aoise leis an dàta a bharrachd air an àireamh sa cheud de shluagh na SA a tha anns gach raon aoise.  

Tha seo nas fheàrr. Tha barrachd co-theacsa againn. Chì sinn gu bheil àireamh sa cheud nas àirde de chùisean aig buidhnean aoise 18-29, 30-39, 40-49 na an àireamh sa cheud den bhuidheann aoise san t-sluagh. Tha cuid de bhuidhnean aois neo-chothromach ann fhathast. Carson a tha 16-17 na bhuidheann aoise air leth? Ach chan e seo an sgeulachd gu lèir, ach tha pundits air colbhan a sgrìobhadh, air ro-innse agus òrdughan a dhèanamh air nas lugha na seo. Gu dearbh, le COVID, tha mòran caochladairean ann a bharrachd air aois a bheir buaidh air a bhith air an cunntadh mar chùis adhartach: inbhe banachdach, cothrom air deuchainnean, an àireamh de thursan a chaidh a dhearbhadh, comorbidities, agus mòran eile. Tha an àireamh de chùisean, fhèin, a 'toirt seachad dealbh neo-choileanta. Bidh a’ mhòr-chuid de dh’eòlaichean cuideachd a’ coimhead air Àireamh de bhàsan, no ceudad de bhàsan gach 100,000 sluagh, no bàsan cùise gus coimhead air mar a bheir COVID buaidh air gach buidheann aoise.

Seall co-dhàimhean neo-cheangailte

Gu follaiseach, tha a co-dhàimh làidir eadar caiteachas na SA air saidheans, àite, agus teicneòlas agus an àireamh de Suicides le bhith a’ crochadh, a’ tachdadh agus a’ mùchadh. Tha an Co-dhàimh aig 99.79%, cha mhòr na gheama foirfe.  

Cò, ge-tà, a dhèanadh a’ chùis gu bheil iad sin càirdeach dòigh air choireigin, no gu bheil aon ag adhbhrachadh an neach eile? Tha eisimpleirean eile ann nach eil cho fìor, ach nach eil cho brosnachail. Tha co-dhàimh làidir coltach ri chèile eadar Litrichean ann am Winning Word of Scripps National Spelling Bee agus Àireamh dhaoine air am marbhadh le damhain-allaidh Venomous. Co-thuiteamas? Bidh thu a’ co-dhùnadh.

Is e dòigh eile air an dàta seo a chlàradh a dh’ fhaodadh a bhith cho meallta a bhith a’ toirt a-steach neoni air an dà thuagh Y.

Seall dàta gu mearachdach

bho Mar a sheallas tu dàta gu dona, thug Stàit Georgia na SA an àireamh as motha de chùisean COVID-5 dearbhte dha na 19 siorrachdan as fheàrr.

A’ coimhead legit, ceart? Tha e soilleir gu bheil gluasad sìos de chùisean COVID-19 dearbhte. An leugh thu an X-axis? Tha an X-axis a’ riochdachadh ùine. Mar as trice, bidh cinn-latha ag àrdachadh bho chlì gu deas. An seo, chì sinn beagan siubhail ùine air an X-axis: 

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

Fuirich? Dè? Chan eil an X-axis air a sheòrsachadh a rèir eachdraidh. Mar sin, cho math sa dh’ fhaodadh an gluasad a bhith a’ coimhead, chan urrainn dhuinn co-dhùnaidhean sam bith a tharraing. Ma thèid na cinn-latha òrdachadh, tha na bàraichean airson an àireamh de chùisean a’ nochdadh barrachd de phàtran sawtooth na seòrsa sam bith de ghluasad.

Is e am fuasgladh furasta an seo na cinn-latha a sheòrsachadh mar a nì mìosachan.

Seall dàta gu neo-ghnàthach

Tha sinn uile trang. Tha ar n-eanchainn air ar teagasg gus breithneachaidhean sgiobalta a dhèanamh stèidhichte air barailean a tha air a bhith cunbhalach san t-saoghal againn. Mar eisimpleir, tha a h-uile graf a chunnaic mi a-riamh a 'sealltainn na h-aiseagan x agus y- a' coinneachadh aig neoni, no luachan as ìsle. A’ coimhead air a’ chairt seo gu h-aithghearr, dè na co-dhùnaidhean as urrainn dhut a tharraing a thaobh buaidh Florida “Seas do lagh talmhainn.”? Tha nàire orm aideachadh, ach chuir an graf seo dragh orm an toiseach. Tha do shùil air a tharraing gu goireasach chun teacsa agus saighead ann am meadhan a’ ghrafaig. Tha shìos suas sa ghraf seo. Is dòcha nach e breug a th’ ann - tha an dàta ceart an sin. Ach, feumaidh mi smaoineachadh gur e mealladh a th’ ann. Mura h-eil thu air fhaicinn fhathast, tha neoni air an y-axis aig a’ mhullach. Mar sin, mar a bhios dàta a’ dol sìos, tha sin a’ ciallachadh barrachd bhàsan. Tha a' chairt seo a' sealltainn gu bheil an àireamh de mhurt a' cleachdadh ghunnaichean meudachadh às deidh 2005, air a chomharrachadh leis a’ ghluasad a tha a’ dol sìos.

Seall an dàta ro-shìmplidh

Chithear aon eisimpleir de thar-sìmplidh an dàta nuair a bhios luchd-anailis a’ gabhail brath air Simpson's Paradox. Is e iongantas a tha seo a thachras nuair a tha coltas gu bheil dàta cruinnichte a’ nochdadh co-dhùnadh eadar-dhealaichte seach nuair a tha e air a sgaradh ann am fo-bhuidhnean. Tha e furasta a dhol a-steach don ribe seo nuair a thathar a’ coimhead air ceudadan cruinnichte àrd-ìre. Tha aon de na dealbhan as soilleire de Simpson's Paradox aig an obair co-cheangailte ri cuibheasachd batting.  

An seo chì sinn gu bheil cuibheasachd batadh iomlan nas àirde aig Derek Jeter na David Justice airson ràithean 1995 agus 1996. Bidh am paradocs a’ tighinn a-steach nuair a thuigeas sinn gur e Ceartas a b’ fheàrr le Jeter ann a bhith a’ faighinn a-mach cuibheasachd an dà bhliadhna sin. Ma sheallas tu gu faiceallach, tha e ciallach nuair a thuigeas tu gun robh timcheall air 4x a bharrachd at-ialtagan (an t-ainmiche) aig Jeter ann an 1996 aig cuibheasachd nas ìsle de .007 ann an 1996. Ach, bha timcheall air 10x an àireamh de ialtagan aig Ceartas a-mhàin. 003 cuibheasach nas àirde ann an 1995.

Tha coltas gu bheil an taisbeanadh sìmplidh, ach tha Simpson's Paradox, gu h-eòlach, no gun fhios dha, air leantainn gu co-dhùnaidhean ceàrr. O chionn ghoirid, tha eisimpleirean air a bhith ann de Simpson's Paradox anns na naidheachdan agus air na meadhanan sòisealta co-cheangailte ri banachdachan agus bàsmhorachd COVID. Aon chart a’ sealltainn graf loidhne a’ dèanamh coimeas eadar ìrean bàis eadar a’ bhanachdach agus gun bhanachdach airson daoine aois 10-59 bliadhna a dh’aois. Tha an clàr a’ sealltainn gu bheil ìre bàsmhorachd nas ìsle gu cunbhalach aig daoine gun bhanachdach. Dè tha dol an seo?  

Tha a’ chùis coltach ris an fhear a chì sinn le cuibheasachd batadh. Is e an seòrsaiche sa chùis seo an àireamh de dhaoine fa leth anns gach buidheann aoise. Tha an graf a’ cothlamadh bhuidhnean aig a bheil builean eadar-dhealaichte. Ma choimheadas sinn air a’ bhuidheann aoise as sine, 50-59 , fa leth, chì sinn gu bheil a’ bhanachdach nas fheàrr. Mar an ceudna, ma choimheadas sinn air 10-49, chì sinn cuideachd gu bheil am faradh banachdach nas fheàrr. Gu paradocsaigeach, nuair a choimheadas tu air an t-seata aonaichte, tha coltas gu bheil toradh nas miosa aig gun bhanachdach. San dòigh seo, bidh e comasach dhut cùis a thogail airson argamaidean eile a’ cleachdadh an dàta.

Tha an dàta claon

Chan urrainnear earbsa a bhith ann an dàta an-còmhnaidh. Eadhon anns a’ choimhearsnachd shaidheansail, dh’aidich còrr air trian den luchd-rannsachaidh a chaidh an sgrùdadh “cleachdaidhean rannsachaidh ceasnachail.”  Another rannsachadh foill ag ràdh, “Tha coltas ann gu bheil tòrr a bharrachd foill ann an dàta - clàran, grafaichean loidhne, dàta sreathachaidh [- na tha sinn a’ faighinn a-mach]. Faodaidh duine sam bith a tha nan suidhe aig bòrd a’ chidsin aca àireamhan a chuir air cliath-dhuilleag agus graf-loidhne a dhèanamh a tha a’ coimhead cinnteach.”

A 'chiad fhear mar eisimpleir tha e coltach gun do rinn cuideigin dìreach sin. Chan eil mi ag ràdh gur e foill a tha seo, ach mar sgrùdadh, chan eil e dìreach a’ gineadh dàta sam bith a chuireas ri co-dhùnadh fiosraichte. Tha e coltach gun do dh’ fhaighnich an suirbhidh do luchd-freagairt mun bheachd aca air cofaidh stèisean gas, no tachartas gnàthach buntainneach eile. 

  1. Sgoinneil 
  2. Sgoinneil
  3. Glè mhath 

Tha mi air am post Twitter a bhuain gus iomraidhean mun phàrtaidh ciontach a thoirt air falbh, ach is e seo an fhìor chairt iomlan de thoraidhean deireannach an sgrùdaidh. Chan eil sgrùdaidhean mar seo neo-chumanta. Gu follaiseach, seallaidh clàr sam bith a chaidh a chruthachadh bhon dàta a thig bho na freagairtean nach eil a’ chofaidh sin ri ionndrainn.  

'S e an duilgheadas a th' ann nam biodh tu air an t-suirbhidh seo a thoirt dhut agus nach do lorg thu freagairt a fhreagras air do bheachd, gun leumadh tu thairis air an t-suirbhidh. Dh’ fhaodadh seo a bhith na fhìor eisimpleir air mar as urrainnear dàta neo-earbsach a chruthachadh. Ach faodaidh droch dhealbhadh suirbhidh leantainn gu nas lugha de fhreagairtean agus chan eil ach aon bheachd aig an fheadhainn a fhreagair, chan eil ann ach beagan ìre. Tha an dàta claon.

Tha an dàrna eisimpleir seo de chlaonadh dàta bho na faidhlichean aig “Grafan meallta COVID 19 as miosa. " 

A-rithist, tha seo seòlta agus chan eil e gu tur follaiseach. Tha an graf bàr a’ sealltainn crìonadh rèidh - cha mhòr ro rèidh - anns an àireamh sa cheud de chùisean adhartach COVID-19 thar ùine airson siorrachd ann am Florida. Dh’ fhaodadh tu a thighinn gu co-dhùnadh gu furasta gu bheil cùisean a’ dol sìos. Tha sin sgoinneil, tha an lèirsinn a’ riochdachadh an dàta gu ceart. Tha an duilgheadas anns an dàta. Mar sin, tha e na chlaonadh nas brùideil oir chan fhaic thu e. Tha e air a bhocadh a-steach don dàta. Am measg nan ceistean a dh’ fheumas tu faighneachd, tha, cò a tha fo dheuchainn? Ann am briathran eile, dè an seòrsaiche, no an sluagh air a bheil sinn a 'coimhead air ceudad. Thathas den bheachd gur e an sluagh gu lèir a th’ ann, no co-dhiù, sampall riochdachail.

Ach, rè na h-ùine seo, anns an t-siorrachd seo, cha deach deuchainnean a thoirt seachad ach do àireamh chuingealaichte de dhaoine. B’ fheudar dhaibh comharraidhean coltach ri COVID a bhith aca, no bha iad air siubhal o chionn ghoirid gu dùthaich air an liosta de dh’ àiteachan teth. A bharrachd air an sin is e na toraidhean a th’ ann gu bheil an fhìrinn gun deach gach deuchainn adhartach a chunntadh agus gun deach gach deuchainn àicheil a chunntadh. Mar as trice, nuair a rinn neach deuchainn dearbhach, dhèanadh iad deuchainn a-rithist nuair a ruith am bhìoras a chùrsa agus dhèanadh iad deuchainn àicheil. Mar sin, ann an dòigh, airson gach cùis adhartach, tha cùis deuchainn àicheil ann a chuireas dheth e. Tha a’ mhòr-chuid de dheuchainnean àicheil agus chaidh deuchainnean àicheil gach neach a chunntadh. Chì thu mar a tha an dàta claon agus nach eil gu sònraichte feumail airson co-dhùnaidhean a dhèanamh. 

Tha Cur-a-steach agus Trèanadh AI Claonadh

Tha co-dhiù dà dhòigh anns an urrainn do AI leantainn gu toraidhean claon: a’ tòiseachadh le dàta claon, no a’ cleachdadh algoirmean claon gus dàta dligheach a phròiseasadh.  

Cur a-steach claon

Tha mòran againn fon bheachd gum faodar earbsa a bhith ann an AI gus na h-àireamhan a phronnadh, na h-algorithms aige a chuir an sàs, agus sgrùdadh earbsach a chuir a-mach air an dàta. Chan urrainn dha Artificial Intelligence a bhith ach cho sgiobalta sa tha e air a thrèanadh. Ma tha an dàta air a bheil e air a thrèanadh neo-fhoirfe, cha bhith e comasach earbsa a bhith anns na toraidhean no na co-dhùnaidhean, nas motha. Coltach ris a 'chùis gu h-àrd de chlaonadh suirbhidh, tha grunn dhòighean ann anns am faod dàta a bhith deiseil ann an ionnsachadh inneal:.  

  • Claonadh sampall - chan eil an stòr-dàta trèanaidh a’ riochdachadh an t-sluaigh gu lèir.
  • Claonadh às-dùnadh - uaireannan tha na tha coltas gu bheil iad a-muigh dligheach, no, far am bi sinn a’ tarraing na loidhne air na bu chòir a thoirt a-steach (còdan zip, cinn-latha, msaa).
  • Claonadh tomhais - is e an àbhaist a bhith an-còmhnaidh a’ tomhas bho mheadhan is bonn a’ mheasg-làimhe, mar eisimpleir, nuair a bhios tu a’ tomhas lioftaichean ann am flasgaichean tomhas-lìonaidh no tiùban deuchainn (ach a-mhàin airgead-beò.)
  • Claonadh cuimhne - nuair a tha rannsachadh an urra ri cuimhne chom-pàirtichean.
  • Claonadh neach-amhairc - tha luchd-saidheans, mar a h-uile duine, nas dualtaich faicinn dè tha iad an dùil fhaicinn.
  • Claonadh gnèitheasach agus gràin-cinnidh - faodaidh gnè no cinneadh a bhith cus no neo-riochdaichte.  
  • Claonadh comainn - tha an dàta a’ daingneachadh stereotypes

Airson AI toraidhean earbsach a thilleadh, feumaidh an dàta trèanaidh aige an fhìor shaoghal a riochdachadh. Mar a bhruidhinn sinn ann an artaigil blog roimhe, tha ullachadh dàta deatamach agus coltach ri pròiseact dàta sam bith eile. Faodaidh dàta neo-earbsach an leasan ceàrr a theagasg do shiostaman ionnsachaidh innealan agus thig e gu co-dhùnadh ceàrr. Thuirt sin, “Tha an dàta gu lèir claon. Chan e paranoia a tha seo. Tha seo na fhìrinn.” - Dr Sanjiv M. Narayan, Sgoil Leigheas Oilthigh Stanford.

Tha cleachdadh dàta claon airson trèanadh air leantainn gu grunn fhàilligidhean AI sònraichte. (eisimpleirean an seo agus an seo, rannsachadh an seo..)

Algorithms claon

Is e seata de riaghailtean a th’ ann an algorithm a tha a’ gabhail ri cuir a-steach agus a’ cruthachadh toradh gus duilgheadas gnìomhachais a fhreagairt. Gu tric tha iad nan craobhan co-dhùnaidh air an deagh mhìneachadh. Bidh algorithms a’ faireachdainn mar bhogsaichean dubha. Chan eil duine cinnteach ciamar a tha iad ag obair, gu tric, chan eil eadhon an companaidhean a bhios gan cleachdadh. O, agus gu tric bidh iad nan sealbhadairean. Tha an nàdar dìomhair agus iom-fhillte aca mar aon de na h-adhbharan gu bheil algorithms claon cho brùideil. . 

Beachdaich air algorithms AI ann an cungaidh-leigheis, HR no ionmhas a bheir aire do rèis. Ma tha rèis na adhbhar, chan urrainn don algairim a bhith dall gu cinneadail. Chan eil seo teòiridheach. Chaidh duilgheadasan mar seo a lorg san fhìor shaoghal a’ cleachdadh AI ann an a 'fastadh, ride-share, tagradh iasads, agus tar-chuir dubhagan

Is e an loidhne gu h-ìosal ma tha an dàta no na h-algorithms agad dona, nas miosa na gun fheum, faodaidh iad a bhith cunnartach. Tha leithid de rud ann ri “sgrùdadh algorithmach.” Is e an t-amas buidhnean a chuideachadh gus na cunnartan a dh’ fhaodadh a bhith co-cheangailte ris an algairim a chomharrachadh mar a tha e a’ buntainn ri cothromachd, claon-bhreith agus leth-bhreith. An àite eile, Facebook a’ cleachdadh AI gus cuir an-aghaidh claonadh ann an AI.

Tha daoine claon

Tha daoine againn air gach taobh den cho-aontar. Tha daoine ag ullachadh an anailis agus tha daoine a’ faighinn an fhiosrachaidh. Tha luchd-rannsachaidh ann agus tha luchd-leughaidh ann. Ann an conaltradh sam bith, faodaidh duilgheadasan a bhith ann an tar-chuir no fàilteachadh.

Gabh an aimsir, mar eisimpleir. Dè tha “cothrom uisge” a’ ciallachadh? An toiseach, dè tha meteorologists a’ ciallachadh nuair a tha iad ag ràdh gu bheil teans uisge ann? A rèir riaghaltas na SA Seirbheis Aimsir Nàiseanta, cothrom uisge, no mar a chanas iad coltach ri Sileadh (PoP), aon de na h-eileamaidean as lugha a thuigeas tu ann an ro-aithris na sìde. Tha mìneachadh àbhaisteach aige: “Is e coltachd sileadh dìreach coltachd staitistigeil de 0.01 ″ òirleach [sic] de [sic] barrachd sileadh aig àite sònraichte san raon ro-shealladh ainmichte san ùine a chaidh a shònrachadh.” Is e an “raon ainmichte” an raon ro-aithris, neo broadsgìre tilgeadh. Tha sin a' ciallachadh gu bheil coltachd oifigeil sileadh an crochadh air a' mhisneachd gum bi uisge ann am badeigin san sgìre agus an ceudad den sgìre a dh'fhàsas fliuch. Ann am faclan eile, ma tha an meteorologist cinnteach gu bheil e a’ dol a dh’ uisgeachadh anns an raon ro-aithris (Misneachd = 100%), tha am PoP a’ riochdachadh a’ chuibhreann den sgìre a gheibh uisge.  

Sràid Pharis; Latha Rainy, Gustave Caillebote (1848-1894) Raon Poblach Institiùd Ealain Chicago

Tha an cothrom uisge an urra ri gach cuid misneachd agus sgìre. Cha robh fios agam air sin. Tha amharas agam nach eil daoine eile eòlach air sin, nas motha. Tha timcheall air 75% den t-sluagh nach eil a’ tuigsinn gu ceart mar a tha PoP air a thomhas, no dè a thathar an dùil a riochdachadh. Mar sin, a bheil sinn air ar sàrachadh, no, an e duilgheadas beachd a tha seo. Canaidh sinn beachd sileadh ris. An cuir sinn a’ choire air neach-aithris na h-aimsire? Gus a bhith cothromach, tha cuid ann mearachd am measg luchd-aithris na sìde cuideachd. Ann an aon suirbhidh, Thuirt 43% de na meteorologists a chaidh an sgrùdadh nach eil mòran cunbhalachd anns a’ mhìneachadh air PoP.

Tha an Mion-sgrùdadh fhèin Claonadh

De na còig factaran buaidh, is dòcha gur e am mion-sgrùdadh fhèin an rud as iongantaiche. Ann an rannsachadh saidheansail a bheir gu buil pàipear ath-sgrùdaichte fhoillseachadh, mar as trice tha teòiridh air a bheachdachadh, tha dòighean air am mìneachadh gus am beachd-bharail a dhearbhadh, tha dàta air a chruinneachadh, agus an uairsin thèid an dàta a sgrùdadh. Chan eil an seòrsa mion-sgrùdadh a thèid a dhèanamh agus mar a thèid a dhèanamh air a thuigsinn gu leòr a thaobh mar a bheir e buaidh air na co-dhùnaidhean. Ann an a pàipear fhoillseachadh na bu thràithe am-bliadhna (Faoilleach 2022), anns an International Journal of Cancer, rinn na h-ùghdaran measadh an robh toraidhean deuchainnean fo smachd air thuaiream agus sgrùdaidhean ath-shealladh. Cho-dhùin na co-dhùnaidhean aca, gun robh,

Le bhith ag atharrachadh roghainnean anailis ann an rannsachadh èifeachd coimeasach, chruthaich sinn toraidhean eile. Tha na co-dhùnaidhean againn a’ moladh gum faodadh cuid de sgrùdaidhean ath-shealladh lorg làimhseachadh a’ leasachadh builean dha euslaintich, agus dh’ fhaodadh sgrùdadh eile den aon seòrsa faighinn a-mach nach eil, dìreach stèidhichte air roghainnean anailis.

San àm a dh’ fhalbh, nuair a leughas tu artaigil ann an iris shaidheansail, ma tha thu coltach riumsa, is dòcha gu bheil thu air smaoineachadh gu bheil na toraidhean no na co-dhùnaidhean uile mun dàta. A-nis, tha e coltach gum faodadh na toraidhean, no a bheil a’ chiad bheachd-bharail air a dhearbhadh no air a dhiùltadh, cuideachd a bhith an urra ris an dòigh sgrùdaidh.

Another sgrùdadh lorg toraidhean coltach ris. An t-artaigil, Mòran sgrùdairean, aon sheata dàta: A’ dèanamh follaiseach mar a bheir caochlaidhean ann an roghainnean anailis buaidh air toraidhean, ag innse mar a thug iad an aon sheata dàta do 29 sgiobaidhean eadar-dhealaichte airson mion-sgrùdadh. Tha mion-sgrùdadh dàta gu tric air fhaicinn mar phròiseas teann, air a dheagh mhìneachadh a tha a’ leantainn gu aon cho-dhùnadh.  

A dh'aindeoin beachdan luchd-eòlais, tha e furasta dearmad a dhèanamh air an fhìrinn gum faodadh toraidhean a bhith an urra ris an ro-innleachd anailis a chaidh a thaghadh, a tha ann fhèin làn de theòiridh, barailean, agus puingean roghainn. Ann an iomadh cùis, tha mòran dhòighean reusanta (agus mòran mì-reusanta) ann airson measadh dàta a tha a’ buntainn ri ceist rannsachaidh.

Fhuair an luchd-rannsachaidh mion-sgrùdadh air an dàta agus thàinig iad chun cho-dhùnadh gu bheil a h-uile rannsachadh a’ toirt a-steach co-dhùnaidhean cuspaireil - a’ toirt a-steach dè an seòrsa mion-sgrùdadh a bu chòir a chleachdadh - a bheir buaidh air toradh deireannach an sgrùdaidh.

Moladh neach eile rannsachaidh a rinn mion-sgrùdadh air an sgrùdadh gu h-àrd a bhith faiceallach nuair a bhios tu a’ cleachdadh aon phàipear ann a bhith a’ tighinn gu co-dhùnaidhean no a’ tighinn gu co-dhùnaidhean.

A’ dèiligeadh ri Bias ann an Analytics

Is e dìreach sgeulachd rabhaidh a tha seo. Faodaidh eòlas ar dìon bho bhith air ar toirt a-steach le sgamannan. Mar as motha a mhothaicheas tu dòighean a dh’ fhaodadh sganair a chleachdadh gus ar mealladh, is ann as dualtaiche a tha sinn a bhith air ar toirt a-steach, can, le, can, mì-stiùireadh pòcaid-pòcaid, no còmhradh rèidh air dealbh-chluich Ponzi. Mar sin is ann le bhith a’ tuigsinn agus ag aithneachadh claonaidhean a dh’fhaodadh a bhith a’ toirt buaidh air ar mion-anailis. Ma tha sinn mothachail air buaidhean a dh’ fhaodadh a bhith ann, is dòcha gum bi e comasach dhuinn an sgeulachd a thaisbeanadh nas fheàrr agus aig a’ cheann thall co-dhùnaidhean nas fheàrr a dhèanamh.  

BI/AnailisUncategorized
Carson a tha Microsoft Excel na inneal anailis #1
Carson a tha Excel na inneal anailis # 1?

Carson a tha Excel na inneal anailis # 1?

  Tha e saor agus furasta. Is dòcha gu bheil am bathar-bog spreadsheet Microsoft Excel air a chuir a-steach mu thràth air coimpiutair neach-cleachdaidh a’ ghnìomhachais. Agus tha mòran de luchd-cleachdaidh an-diugh air a bhith fosgailte do bhathar-bog Microsoft Office bhon àrd-sgoil no eadhon nas tràithe. Tha am freagairt glùin seo a thaobh ...

Leugh Tuilleadh

BI/AnailisUncategorized
Cuir às do bheachdan: Iùl air glanadh an earraich

Cuir às do bheachdan: Iùl air glanadh an earraich

Unclutter Your Insights Iùl airson Analytics Glanadh an Earraich Bidh a’ bhliadhna ùr a’ tòiseachadh le brag; bidh aithisgean deireadh-bliadhna air an cruthachadh agus air an sgrùdadh, agus an uairsin bidh a h-uile duine a’ socrachadh a-steach do chlàr obrach cunbhalach. Mar a bhios na làithean a’ fàs nas fhaide agus na craobhan agus na flùraichean a’ fàs, bidh...

Leugh Tuilleadh

BI/AnailisUncategorized
Stoidhle NY vs Pizza Stoidhle Chicago: Deasbad Delicious

Stoidhle NY vs Pizza Stoidhle Chicago: Deasbad Delicious

Nuair a bhios sinn a’ sàsachadh ar n-ana-miannan, is e glè bheag de rudan a dh’ fhaodadh a bhith an-aghaidh toileachas pìos piotsa teth pìobaireachd. Tha an deasbad eadar pizza ann an stoidhle New York agus stoidhle Chicago air còmhraidhean dìoghrasach a bhrosnachadh airson deicheadan. Tha na feartan sònraichte fhèin aig gach stoidhle agus luchd-leantainn dealasach ....

Leugh Tuilleadh

BI/AnailisCognos Analytics
Stiùidio ceist Cognos
Tha an luchd-cleachdaidh agad ag iarraidh an Stiùidio Ceist aca

Tha an luchd-cleachdaidh agad ag iarraidh an Stiùidio Ceist aca

Nuair a chaidh IBM Cognos Analytics 12 a leigeil ma sgaoil, chaidh an ìsleachadh a chaidh ainmeachadh o chionn fhada de Query Studio and Analysis Studio a lìbhrigeadh mu dheireadh le dreach de Cognos Analytics às aonais na stiùidiothan sin. Ged nach bu chòir seo a bhith na iongnadh don mhòr-chuid de dhaoine a tha an sàs ann an ...

Leugh Tuilleadh

BI/AnailisUncategorized
A bheil buaidh Taylor Swift fìor?

A bheil buaidh Taylor Swift fìor?

Tha cuid de luchd-càineadh a’ moladh gu bheil i ag àrdachadh prìsean tiogaid Super Bowl Tha dùil gum bi Super Bowl na deireadh-sheachdain seo mar aon de na 3 tachartasan as motha a thathas a’ coimhead ann an eachdraidh telebhisean. Is dòcha nas motha na na h-àireamhan a chaidh a chlàradh an-uiridh agus is dòcha eadhon barrachd air gealach 1969 ...

Leugh Tuilleadh

BI/Anailis
Catalogan Analytics - Rionnag ag èirigh anns an Eag-shiostam Analytics

Catalogan Analytics - Rionnag ag èirigh anns an Eag-shiostam Analytics

Ro-ràdh Mar Phrìomh Oifigear Teicneòlais (CTO), tha mi an-còmhnaidh a’ coimhead airson teicneòlasan a tha a’ tighinn am bàrr a bheir cruth-atharrachadh air an dòigh sa bheil sinn a’ dèiligeadh ri mion-sgrùdadh. Is e aon de theicneòlas den leithid a ghlac m ’aire thar nam beagan bhliadhnaichean a dh’ fhalbh agus a tha gu math gealltanach an Analytics ...

Leugh Tuilleadh