Celwydd Dadansoddeg

by Awst 31, 2022BI/Dadansoddegsylwadau 0

Celwydd Dadansoddeg

Tuedd Dadansoddi

 

Dywedodd Mark Twain rywbeth tebyg yn ddadleuol, “Mae tri math o gelwyddau: celwyddau, celwydd damnedig a chelwydd analytics. " 

Rydym yn cymryd yn ganiataol bod dadansoddeg yn rhoi mewnwelediadau defnyddiol y gellir gweithredu arnynt. Yr hyn nad ydym yn sylweddoli'n aml yw sut mae ein rhagfarnau ni a rhagfarnau eraill yn dylanwadu ar yr atebion a gawn gan hyd yn oed y meddalwedd a'r systemau mwyaf soffistigedig. Weithiau, efallai y byddwn yn cael ein trin yn anonest, ond, yn fwy cyffredin, gall fod yn rhagfarnau cynnil ac anymwybodol sy'n ymledu i'n dadansoddeg. Mae'r cymhelliant y tu ôl i ddadansoddeg ragfarnllyd yn niferus. Weithiau mae’r canlyniadau diduedd a ddisgwyliwn gan wyddoniaeth yn cael eu dylanwadu gan 1) dewisiadau cynnil o ran sut mae’r data’n cael ei gyflwyno, 2) data anghyson neu ddata nad yw’n gynrychioliadol, 3) sut mae systemau AI yn cael eu hyfforddi, 4) anwybodaeth, anallu ymchwilwyr neu eraill sy’n ceisio i adrodd y stori, 5) y dadansoddiad ei hun.    

Mae'r Cyflwyniad yn Tueddol

Mae rhai o'r celwyddau yn haws i'w gweld nag eraill. Pan fyddwch chi'n gwybod beth i chwilio amdano efallai y byddwch chi'n ei ganfod yn haws o bosibl graffiau a siartiau camarweiniol. 

Mae yna o leiaf pum ffordd o arddangos data yn gamarweiniol: 1) Dangos set ddata gyfyngedig, 2). Dangos cydberthnasau digyswllt, 3) Dangos data'n anghywir, 4) Dangos data yn anghonfensiynol, neu 5). Dangos data wedi'i orsymleiddio.

Dangos set ddata gyfyngedig

Gall cyfyngu ar y data, neu ddewis adran o'r data nad yw ar hap â llaw, yn aml adrodd stori nad yw'n gyson â'r darlun mawr. Samplu gwael, neu gasglu ceirios, yw pan fydd y dadansoddwr yn defnyddio sampl nad yw'n gynrychioliadol i gynrychioli grŵp mwy. 

Ym mis Mawrth 2020, Adran Iechyd y Cyhoedd Georgia cyhoeddi'r siart hwn fel rhan o'i adroddiad statws dyddiol. Mewn gwirionedd mae'n codi mwy o gwestiynau nag y mae'n eu hateb.  

Un o'r pethau sydd ar goll yw cyd-destun. Er enghraifft, byddai'n ddefnyddiol gwybod beth yw canran y boblogaeth ar gyfer pob grŵp oedran. Mater arall gyda'r siart cylch syml yw'r grwpiau oedran anwastad. Mae gan y 0-17 18 mlynedd, mae gan 18-59 42, mae 60+ yn benagored, ond mae ganddo tua 40 mlynedd. Y casgliad, o ystyried y siart hwn yn unig, yw bod mwyafrif yr achosion yn y grŵp oedran 18-59 oed. Mae'n edrych fel bod y grŵp oedran 60+ oed yn cael ei effeithio'n llai difrifol gan achosion COVID. Ond nid dyma'r stori gyfan.

Er mwyn cymharu, mae hyn yn wahanol set ddata ar y Gwefan CDC siartio achosion COVID yn ôl grŵp oedran gyda'r data ychwanegol ar ganran Poblogaeth yr UD sydd ym mhob ystod oedran.  

Mae hyn yn well. Mae gennym ni fwy o gyd-destun. Gallwn weld bod gan grwpiau oedran 18-29, 30-39, 40-49 i gyd ganran uwch o achosion na chanran y grŵp oedran yn y boblogaeth. Mae rhai grwpiau oedran anwastad o hyd. Pam fod 16-17 yn grŵp oedran ar wahân? Eto nid dyma'r stori gyfan, ond mae pynditiaid wedi ysgrifennu colofnau, wedi gwneud rhagfynegiadau a mandadau ar lai na hyn. Yn amlwg, gyda COVID, mae yna lawer o newidynnau yn ogystal ag oedran sy'n effeithio ar gael eich cyfrif fel achos cadarnhaol: statws brechu, argaeledd profion, nifer yr amseroedd a brofwyd, cyd-forbidrwydd, a llawer o rai eraill. Nifer yr achosion, ei hun, yn rhoi darlun anghyflawn. Mae'r rhan fwyaf o arbenigwyr hefyd yn edrych ar Nifer y marwolaethau, neu ganrannau'r marwolaethau fesul 100,000 o'r boblogaeth, neu farwolaethau achosion i edrych ar sut mae COVID yn effeithio ar bob grŵp oedran.

Dangos cydberthnasau digyswllt

Yn amlwg, mae a cydberthynas gref rhwng gwariant yr Unol Daleithiau ar wyddoniaeth, y gofod, a thechnoleg a nifer yr Hunanladdiadau trwy grogi, tagu a mygu. Mae'r Gydberthynas yn 99.79%, bron yn cyfateb yn berffaith.  

Pwy, fodd bynnag, a fyddai'n dadlau bod y rhain yn perthyn i ryw fodd, neu fod y naill yn achosi'r llall? Mae yna enghreifftiau eraill llai eithafol, ond dim llai annelwig. Mae cydberthynas gref debyg rhwng Llythyrau yn Winning Word of Scripps National Spelling Bee a Nifer y Bobl a Lladdwyd gan Brynnod Gwenwynig. Cyd-ddigwyddiad? Chi sy'n penderfynu.

Ffordd arall o olrhain y data hwn a allai fod yn llai camarweiniol fyddai cynnwys sero ar y ddwy echelin Y.

Dangos data yn anghywir

O Sut i Arddangos Data'n Wael, cyflwynodd Talaith Georgia yn yr UD y Nifer Mwyaf o Achosion COVID-5 wedi'u Cadarnhau i'r 19 Sir Uchaf.

Edrych yn gyfreithlon, iawn? Mae'n amlwg bod tuedd ar i lawr o achosion COVID-19 wedi'u cadarnhau. Allwch chi ddarllen yr echel X? Mae'r echel X yn cynrychioli amser. Yn nodweddiadol, bydd dyddiadau'n cynyddu o'r chwith i'r dde. Yma, gwelwn ychydig o deithio amser ar yr echel X: 

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

Aros? Beth? Nid yw'r echel X wedi'i didoli'n gronolegol. Felly, er mor braf ag y gallai'r duedd edrych, ni allwn ddod i unrhyw gasgliadau. Os caiff y dyddiadau eu harchebu, mae'r bariau ar gyfer nifer yr achosion yn dangos mwy o batrwm sawtooth nag unrhyw fath o duedd.

Yr ateb hawdd yma yw trefnu'r dyddiadau fel y mae calendr yn ei wneud.

Dangos data yn anghonfensiynol

Rydyn ni i gyd yn brysur. Mae ein hymennydd wedi ein dysgu i wneud dyfarniadau cyflym yn seiliedig ar ragdybiaethau sydd wedi bod yn gyson yn ein byd. Er enghraifft, mae pob graff a welais erioed yn dangos yr echelinau x ac y- yn cwrdd ar sero, neu werthoedd isaf. O edrych ar y siart hwn yn fyr, pa gasgliadau allwch chi ddod iddynt am effaith Florida “Safwch eich cyfraith sylfaenol.”? Mae gen i gywilydd i gyfaddef, ond fe wnaeth y graff hwn fy nhwyllo ar y dechrau. Mae'ch llygad yn cael ei dynnu'n gyfleus at y testun a'r saeth yng nghanol y graffig. Down i fyny yn y graff hwn. Efallai nad yw'n gelwydd - mae'r data i gyd yno. Ond, mae'n rhaid i mi feddwl ei fod i fod i dwyllo. Os nad ydych wedi ei weld eto, mae sero ar yr echelin-y ar y brig. Felly, wrth i dueddiadau data ostwng, mae hynny'n golygu mwy o farwolaethau. Mae'r siart hwn yn dangos nifer y llofruddiaethau sy'n defnyddio drylliau cynyddu ar ôl 2005, a nodir gan y duedd sy'n mynd i lawr.

Dangos y data wedi'i or-symleiddio

Gellir gweld un enghraifft o or-symleiddio'r data pan fydd dadansoddwyr yn manteisio ar Simpson's Paradox. Mae hon yn ffenomen sy'n digwydd pan ymddengys bod data cyfanredol yn dangos casgliad gwahanol na phan gaiff ei wahanu'n is-setiau. Mae'n hawdd cwympo i'r trap hwn wrth edrych ar ganrannau agregedig lefel uchel. Mae un o'r darluniau cliriaf o Simpson's Paradox yn y gwaith yn gysylltiedig â cyfartaleddau batio.  

Yma gwelwn fod gan Derek Jeter gyfartaledd batio cyffredinol uwch na David Justice ar gyfer tymhorau 1995 a 1996. Daw'r paradocs i mewn pan sylweddolwn fod Justice wedi rhoi'r gorau i Jeter mewn batio ar gyfartaledd y ddwy flynedd honno. Os edrychwch yn ofalus, mae'n gwneud synnwyr pan sylweddolwch fod gan Jeter tua 4x yn fwy o at-ystlumod (yr enwadur) ym 1996 ar gyfartaledd o .007 yn is ym 1996. Tra, roedd gan Justice tua 10x nifer yr at-ystlumod yn unig. 003 cyfartaledd uwch yn 1995.

Mae'r cyflwyniad yn ymddangos yn syml, ond mae Simpson's Paradox, yn ddirgel, neu'n ddiarwybod, wedi arwain at gasgliadau anghywir. Yn ddiweddar, bu enghreifftiau o Simpson's Paradox yn y newyddion ac ar gyfryngau cymdeithasol yn ymwneud â brechlynnau a marwolaethau COVID. Un Siart yn dangos graff llinell sy'n cymharu cyfraddau marwolaeth rhwng pobl 10-59 oed sydd wedi'u brechu a heb eu brechu. Mae'r siart yn dangos bod gan y rhai sydd heb eu brechu gyfradd marwolaethau is yn gyson. Beth sy'n digwydd yma?  

Mae'r mater yn debyg i'r un a welwn gyda chyfartaleddau batio. Yr enwadur yn yr achos hwn yw nifer yr unigolion ym mhob grŵp oedran. Mae'r graff yn cyfuno grwpiau sydd â chanlyniadau gwahanol. Os edrychwn ar y grŵp oedran hŷn, 50-59 , ar wahân, gwelwn fod y brechiad yn gwneud yn well. Yn yr un modd, os edrychwn ar 10-49, rydym hefyd yn gweld bod y brechiad yn gwneud yn well. Yn baradocsaidd, wrth edrych ar y set gyfunol, mae'n ymddangos bod canlyniad gwaeth heb ei frechu. Yn y modd hwn, gallwch gyflwyno achos dros ddadleuon croes gan ddefnyddio'r data.

Mae'r Data yn Tuedd

Ni ellir ymddiried yn y data bob amser. Hyd yn oed yn y gymuned wyddonol, cyfaddefodd dros draean o'r ymchwilwyr a holwyd i “arferion ymchwil amheus.”  Arall ditectif twyll ymchwil yn dweud, “Mae’n debygol iawn bod llawer mwy o dwyll mewn data – tablau, graffiau llinell, data dilyniannu [– nag yr ydym yn ei ddarganfod mewn gwirionedd]. Gall unrhyw un sy’n eistedd wrth fwrdd eu cegin roi rhai rhifau mewn taenlen a gwneud graff llinell sy’n edrych yn argyhoeddiadol.”

Mae hyn yn gyntaf enghraifft Mae'n edrych fel bod rhywun wedi gwneud hynny. Dydw i ddim yn dweud mai twyll yw hwn, ond fel arolwg, nid yw'n cynhyrchu unrhyw ddata sy'n cyfrannu at benderfyniad gwybodus. Mae’n debyg bod yr arolwg wedi gofyn i ymatebwyr am eu barn am goffi gorsaf nwy, neu ryw ddigwyddiad cyfredol perthnasol arall. 

  1. Superb 
  2. Great
  3. Da iawn 

Rwyf wedi tocio'r post Twitter i ddileu cyfeiriadau at y parti euog, ond dyma'r siart cyfan o ganlyniadau terfynol yr arolwg. Nid yw arolygon fel hyn yn anghyffredin. Yn amlwg, bydd unrhyw siart a grëir o’r data sy’n deillio o’r ymatebion yn dangos na ddylid colli’r coffi dan sylw.  

Y broblem yw petaech wedi cael yr arolwg hwn a heb ddod o hyd i ymateb sy'n cyd-fynd â'ch meddwl, byddech yn hepgor yr arolwg. Gall hyn fod yn enghraifft eithafol o sut y gellir creu data annibynadwy. Fodd bynnag, gall cynllun arolwg gwael arwain at lai o ymatebion a dim ond un farn sydd gan y rhai sy'n ymateb, dim ond mater o raddau ydyw. Mae'r data yn rhagfarnllyd.

Daw'r ail enghraifft hon o ragfarn data o'r ffeiliau o “Graffiau Camarweiniol gwaethaf COVID 19. " 

Unwaith eto, mae hyn yn gynnil ac nid yn gwbl amlwg. Mae'r graff bar yn dangos dirywiad llyfn - bron yn rhy esmwyth - yng nghanran yr achosion COVID-19 positif dros amser ar gyfer sir yn Florida. Gallech yn hawdd ddod i’r casgliad bod achosion yn dirywio. Mae hynny'n wych, mae'r delweddu yn cynrychioli'r data yn gywir. Mae'r broblem yn y data. Felly, mae'n ogwydd mwy llechwraidd oherwydd ni allwch ei weld. Mae'n cael ei bobi i mewn i'r data. Mae’r cwestiynau y mae angen ichi eu gofyn yn cynnwys, pwy sy’n cael ei brofi? Mewn geiriau eraill, beth yw'r enwadur, neu'r boblogaeth yr ydym yn edrych ar ganran ohoni. Y dybiaeth yw ei bod yn boblogaeth gyfan, neu o leiaf, yn sampl cynrychioliadol.

Fodd bynnag, yn ystod y cyfnod hwn, yn y sir hon, ni roddwyd profion ond i nifer cyfyngedig o bobl. Roedd yn rhaid iddyn nhw gael symptomau tebyg i COVID, neu roedden nhw wedi teithio'n ddiweddar i wlad ar y rhestr o fannau poeth. Yn ogystal â drysu'r canlyniadau mae'r ffaith bod pob prawf positif yn cael ei gyfrif a phob prawf negyddol yn cael ei gyfrif. Yn nodweddiadol, pan brofodd unigolyn yn bositif, byddent yn profi eto pan fyddai'r firws wedi rhedeg ei gwrs a byddai'n profi'n negyddol. Felly, mewn ffordd, ar gyfer pob achos cadarnhaol, mae achos prawf negyddol sy'n ei ddileu. Mae mwyafrif helaeth y profion yn negyddol a chafodd profion negyddol pob unigolyn eu cyfrif. Gallwch weld sut mae'r data yn rhagfarnllyd ac nid yw'n arbennig o ddefnyddiol ar gyfer gwneud penderfyniadau. 

Mae Mewnbwn a Hyfforddiant AI yn Tueddol

Mae o leiaf dwy ffordd y gall AI arwain at ganlyniadau rhagfarnllyd: gan ddechrau gyda data rhagfarnllyd, neu ddefnyddio algorithmau rhagfarnllyd i brosesu data dilys.  

Mewnbwn Tueddol

Mae llawer ohonom dan yr argraff y gellir ymddiried yn AI i wasgu'r niferoedd, cymhwyso ei algorithmau, a phoeri dadansoddiad dibynadwy o'r data. Gall Deallusrwydd Artiffisial ond fod mor smart ag y mae wedi'i hyfforddi. Os yw'r data y mae wedi'i hyfforddi arno yn amherffaith, ni fydd modd ymddiried yn y canlyniadau na'r casgliadau, chwaith. Yn debyg i'r achos uchod o duedd arolwg, mae yna nifer o ffyrdd y gall data fod yn dueddol mewn dysgu peirianyddol:.  

  • Tuedd sampl – nid yw’r set ddata hyfforddiant yn cynrychioli’r boblogaeth gyfan.
  • Tuedd gwaharddiad – weithiau mae’r hyn sy’n ymddangos yn allgleifion yn ddilys mewn gwirionedd, neu, lle rydym yn tynnu’r llinell ar yr hyn i’w gynnwys (codau zip, dyddiadau, ac ati).
  • Tuedd mesur – y confensiwn yw mesur bob amser o ganol a gwaelod y menisws, er enghraifft, wrth fesur hylifau mewn fflasgiau cyfeintiol neu diwbiau profi (ac eithrio mercwri.)
  • Tuedd adalw – pan fydd ymchwil yn dibynnu ar gof y cyfranogwyr.
  • Tuedd sylwedydd – mae gwyddonwyr, fel pob bod dynol, yn fwy tueddol o weld yr hyn y maent yn disgwyl ei weld.
  • Tuedd rhywiaethol a hiliol - gall rhyw neu hil gael ei or-gynrychioli neu ei dangynrychioli.  
  • Tuedd cysylltiad – mae’r data’n atgyfnerthu stereoteipiau

Er mwyn i AI ddychwelyd canlyniadau dibynadwy, mae angen i'w ddata hyfforddi gynrychioli'r byd go iawn. Fel rydym wedi trafod mewn erthygl blog blaenorol, mae paratoi data yn hollbwysig ac fel unrhyw brosiect data arall. Gall data annibynadwy ddysgu'r wers anghywir i systemau dysgu peirianyddol a bydd yn arwain at y casgliad anghywir. Wedi dweud hynny, “Mae'r holl ddata yn rhagfarnllyd. Nid paranoia yw hyn. Mae hyn yn ffaith.” - Sanjiv M. Narayan, Ysgol Feddygaeth Prifysgol Stanford.

Mae defnyddio data rhagfarnllyd ar gyfer hyfforddiant wedi arwain at nifer o fethiannau AI nodedig. (Enghreifftiau yma ac yma, ymchwil yma..)

Algorithmau rhagfarnllyd

Mae algorithm yn set o reolau sy'n derbyn mewnbwn ac yn creu allbwn i ateb problem busnes. Maent yn aml yn goed penderfynu wedi'u diffinio'n dda. Algorithmau yn teimlo fel blychau du. Does neb yn siŵr sut maen nhw'n gweithio, yn aml, ddim hyd yn oed y cwmnïau sy'n eu defnyddio. O, ac maen nhw'n aml yn berchnogol. Eu natur ddirgel a chymhleth yw un o'r rhesymau pam mae algorithmau rhagfarnllyd mor llechwraidd. . 

Ystyriwch algorithmau AI mewn meddygaeth, adnoddau dynol neu gyllid sy'n ystyried hil. Os yw hil yn ffactor, ni all yr algorithm fod yn hiliol ddall. Nid yw hyn yn ddamcaniaethol. Mae problemau fel y rhain wedi'u darganfod yn y byd go iawn gan ddefnyddio AI yn llogi, reid-rhannu, cais am fenthyciads, ac trawsblaniadau arennau

Y gwir amdani yw, os yw'ch data neu'ch algorithmau'n ddrwg, yn waeth na diwerth, gallant fod yn beryglus. Mae y fath beth â “archwiliad algorithmig.” Y nod yw helpu sefydliadau i nodi'r risgiau posibl sy'n gysylltiedig â'r algorithm mewn perthynas â thegwch, rhagfarn a gwahaniaethu. Mewn man arall, Facebook yn defnyddio AI i frwydro yn erbyn rhagfarn mewn AI.

Mae pobl yn rhagfarnllyd

Mae gennym ni bobl ar ddwy ochr yr hafaliad. Mae pobl yn paratoi'r dadansoddiad ac mae pobl yn derbyn y wybodaeth. Mae yna ymchwilwyr ac mae yna ddarllenwyr. Mewn unrhyw gyfathrebu, gall fod problemau yn y trosglwyddiad neu dderbynfa.

Cymerwch y tywydd, er enghraifft. Beth mae “siawns o law” yn ei olygu? Yn gyntaf, beth mae meteorolegwyr yn ei olygu pan ddywedant fod siawns o law? Yn ôl llywodraeth yr Unol Daleithiau Gwasanaeth Tywydd Cenedlaethol, siawns o law, neu’r hyn maen nhw’n ei alw’n Tebygolrwydd Dyodiad (PoP), yw un o’r elfennau sy’n cael ei deall leiaf mewn rhagolygon tywydd. Mae ganddo ddiffiniad safonol: “Yn syml, mae tebygolrwydd dyodiad yn debygolrwydd ystadegol o 0.01″ modfedd [sic] o [sic] mwy o wlybaniaeth mewn ardal benodol yn yr ardal ragolwg benodol yn y cyfnod amser a nodir.” Yr “ardal a roddwyd” yw ardal y rhagolwg, neu broadardal cast. Mae hynny'n golygu bod y Tebygolrwydd o Ddyodiad swyddogol yn dibynnu ar yr hyder y bydd hi'n bwrw glaw yn rhywle yn yr ardal a'r canran o'r ardal a fydd yn gwlychu. Mewn geiriau eraill, os yw'r meteorolegydd yn hyderus ei fod yn mynd i law yn yr ardal a ragwelir (Hyder = 100%), yna mae'r PoP yn cynrychioli'r rhan o'r ardal a fydd yn derbyn glaw.  

Stryd Paris; Diwrnod glawog, Gustave Caillebote (1848-1894) Parth Cyhoeddus Sefydliad Celf Chicago

Mae'r siawns o law yn dibynnu ar hyder ac ardal. doeddwn i ddim yn gwybod hynny. Rwy'n amau ​​​​nad yw pobl eraill yn gwybod hynny, chwaith. Nid yw tua 75% o'r boblogaeth yn deall yn gywir sut y cyfrifir PoP, na'r hyn y mae i fod i'w gynrychioli. Felly, a ydym yn cael ein twyllo, neu, a yw hyn yn broblem o ganfyddiad. Gadewch i ni ei alw'n ganfyddiad dyddodiad. Ydyn ni'n beio'r daroganwr tywydd? A bod yn deg, mae yna rai dryswch ymhlith rhagolygon y tywydd hefyd. Mewn un arolwg, Dywedodd 43% o'r meteorolegwyr a holwyd mai ychydig iawn o gysondeb sydd yn y diffiniad o PoP.

Mae'r Dadansoddiad Ei Hun yn Ddiduedd

O'r pum ffactor sy'n dylanwadu, efallai mai'r dadansoddiad ei hun yw'r syndod mwyaf. Mewn ymchwil wyddonol sy'n arwain at gyhoeddi papur wedi'i adolygu, fel arfer damcaniaethir damcaniaeth, diffinnir dulliau i brofi'r rhagdybiaeth, cesglir data, yna dadansoddir y data. Nid yw’r math o ddadansoddiad a wneir a sut y caiff ei wneud yn cael ei werthfawrogi’n ddigonol o ran sut mae’n effeithio ar y casgliadau. Mewn papur a gyhoeddwyd yn gynharach eleni (Ionawr 2022), yn y International Journal of Cancer, gwerthusodd yr awduron a oedd canlyniadau hap-dreialon rheoledig ac astudiaethau arsylwi ôl-weithredol. Daeth eu canfyddiadau i’r casgliad,

Trwy amrywio dewisiadau dadansoddol mewn ymchwil effeithiolrwydd cymharol, fe wnaethom gynhyrchu canlyniadau croes. Mae ein canlyniadau’n awgrymu y gallai rhai astudiaethau arsylwadol ôl-weithredol ganfod bod triniaeth yn gwella canlyniadau i gleifion, tra bod astudiaeth debyg arall yn canfod nad yw, yn seiliedig ar ddewisiadau dadansoddol yn unig.

Yn y gorffennol, wrth ddarllen erthygl mewn cyfnodolyn gwyddonol, os ydych chi fel fi, efallai eich bod wedi meddwl bod y canlyniadau neu'r casgliadau i gyd yn ymwneud â'r data. Nawr, mae'n ymddangos y gallai'r canlyniadau, neu a yw'r rhagdybiaeth gychwynnol yn cael ei chadarnhau neu ei gwrthbrofi, hefyd ddibynnu ar y dull dadansoddi.

Arall astudio dod o hyd i ganlyniadau tebyg. Yr erthygl, Llawer o Ddadansoddwyr, Un Set Ddata: Gwneud Yn Dryloyw Sut Mae Amrywiadau mewn Dewisiadau Dadansoddol yn Effeithio ar Ganlyniadau, yn disgrifio sut y rhoesant yr un set ddata i 29 o dimau gwahanol eu dadansoddi. Mae dadansoddi data yn aml yn cael ei weld fel proses lem, wedi'i diffinio'n dda sy'n arwain at un casgliad.  

Er gwaethaf honiadau methodolegwyr, mae'n hawdd anwybyddu'r ffaith y gall canlyniadau ddibynnu ar y strategaeth ddadansoddol a ddewiswyd, sydd ei hun wedi'i thrwytho â theori, rhagdybiaethau, a phwyntiau dewis. Mewn llawer o achosion, mae llawer o ddulliau rhesymol (a llawer afresymol) o werthuso data sy'n berthnasol i gwestiwn ymchwil.

Daeth yr ymchwilwyr o ffynonellau torfol i ddadansoddi’r data a daethant i’r casgliad bod yr holl ymchwil yn cynnwys penderfyniadau goddrychol – gan gynnwys pa fath o ddadansoddiad i’w ddefnyddio – a all effeithio ar ganlyniad terfynol yr astudiaeth.

Argymhelliad un arall ymchwilydd a ddadansoddodd yr astudiaeth uchod i fod yn ofalus wrth ddefnyddio un papur wrth wneud penderfyniadau neu ddod i gasgliadau.

Mynd i'r afael â Tuedd mewn Dadansoddeg

Yn syml, stori rybuddiol yw hon. Gall gwybodaeth ein hamddiffyn rhag cael ein cymryd i mewn gan sgamiau. Po fwyaf ymwybodol o ddulliau posibl y gallai sganiwr eu defnyddio i'n twyllo, y lleiaf tebygol yw hi o gael ein cymryd i mewn, dyweder, trwy, dyweder, camgyfeiriad pigwrn, neu siarad llyfn drama Ponzi. Felly gyda deall a chydnabod rhagfarnau posibl sy'n effeithio ar ein dadansoddeg. Os ydym yn ymwybodol o ddylanwadau posibl, efallai y byddwn yn gallu cyflwyno'r stori yn well ac yn y pen draw wneud penderfyniadau gwell.  

BI/DadansoddegUncategorized
Tacluswch Eich Mewnwelediadau: Canllaw i Ddadansoddeg Glanhau'r Gwanwyn

Tacluswch Eich Mewnwelediadau: Canllaw i Ddadansoddeg Glanhau'r Gwanwyn

Tacluso Eich Mewnwelediadau Canllaw i Ddadansoddeg Glanhau'r Gwanwyn Mae'r flwyddyn newydd yn dechrau gyda chlec; adroddiadau diwedd blwyddyn yn cael eu creu a chraffu arnynt, ac yna mae pawb yn setlo i amserlen waith gyson. Wrth i'r dyddiau fynd yn hirach ac i'r coed a'r blodau flodeuo,...

Darllenwch fwy