Väärteabe levitamine kohutavate armatuurlaudade abil

by August 17, 2022BI/Analytics0 kommentaarid

Kuidas levitate kohutavate armatuurlaudade abil desinformatsiooni

 

 

Numbreid on iseenesest raske lugeda ja veelgi raskem on neist sisulisi järeldusi teha. Sageli juhtub, et andmete visualiseerimine erinevate graafikute ja diagrammidena on vajalik tõelise andmeanalüüsi tegemiseks. 

Kui olete aga kulutanud vähegi aega erinevate graafikute vaatamisele, olete ühest asjast juba ammu aru saanud – mitte kõik andmevisualisatsioonid pole võrdsed.

See on kiire kokkuvõte kõige levinumatest vigadest, mida inimesed teevad diagrammide loomisel, et esitada andmeid kiiresti ja hõlpsasti seeditavalt.

Halvad kaardid

Jälgides xkcd-d alguses, on tõesti tavaline, et andmed on kaardile kantud kohutaval ja kasutul viisil. Üks suurimaid ja levinumaid rikkujaid on koomiksis näidatud. 

Ebahuvitavad rahvastikujaotused

Nagu selgub, elavad inimesed tänapäeval pigem linnades. 

Peaksite kaardi näitamisega vaeva nägema ainult siis, kui eeldatav jaotus, mida jälgite, ei ühti USA kogurahvastiku jaotusega.

Näiteks kui müüksite külmutatud tacosid ja avastaksite, et üle poole teie müügist pärineb Lääne-Virginia toidupoodidest, hoolimata nende olemasolust üleriigilistel turgudel, oleks see üsna tähelepanuväärne.

Kasulikku teavet võib anda kaardi näitamine, mis näitab seda ja kus mujal tacod populaarsed on. 

Samamoodi, kui müüte toodet, mis on täielikult inglise keeles, peaksite eeldama, et teie klientide jaotus ühtlustub inglise keelt kõnelevate inimeste levikuga kogu maailmas. 

Halb tera suurus

Teine võimalus kaarti segi ajada on valida kehv viis maa geograafiliseks jagamiseks tükkideks. See õige väikseima üksuse leidmise probleem on levinud kogu BI-s ja visualiseerimine pole erand.

Et oleks selgem, millest ma räägin, vaatame kahte näidet sama tera suuruse kohta, millel on kaks väga erinevat mõju.

Esiteks, vaatame kedagi, kes koostab Ameerika Ühendriikide topograafilise kaardi, varjutades iga maakonna kõrgeima kõrguse punkti määratud võtmes erineva värviga. 

 

 

Kuigi see on idaranniku jaoks mõnevõrra tõhus, on see tõesti ainult müra, kui jõuate Kaljumäestiku servale.

Geograafiast ei saa te väga head pilti, sest (keerulistel ajaloolistel põhjustel) kipuvad maakondade suurused suurenema, mida kaugemale läände lähete. Nad räägivad lugu, mitte ainult geograafiaga seotud. 

Võrrelge seda usulise kuuluvuse kaardiga maakondade kaupa.

 

 

See kaart on täiesti tõhus, hoolimata sellest, et kasutatakse täpselt sama tera suurust. Suudame teha kiireid, täpseid ja sisukaid järeldusi USA piirkondade kohta, kuidas neid piirkondi tajutakse, mida seal elavad inimesed endast ja ülejäänud riigist arvata võivad.

Tõhusa kaardi koostamine visuaalse abivahendina võib, kuigi keeruline, olla väga kasulik ja selgitav. Mõelge kindlasti sellele, mida teie kaart üritab edastada.

Halvad tulpdiagrammid

Tulpdiagrammid on üldiselt levinumad kui kaardil esitatud teave. Neid on lihtne lugeda, lihtne luua ja need on üldiselt üsna elegantsed.

Kuigi neid on lihtne teha, on mõned tavalised vead, mida inimesed võivad jalgratast uuesti leiutada. 

Eksitavad kaalud

Üks levinumaid halbade tulpdiagrammide näiteid on see, kui keegi teeb vasaku teljega midagi ebasoodsat. 

See on eriti salakaval probleem ja raske anda üldisi juhiseid. Et seda probleemi oleks kergem seedida, arutleme mõne näite üle. 

Kujutagem ette ettevõtet, mis toodab kolme toodet; Alfa-, beeta- ja gammavidinad. Juht soovib teada, kui hästi nad üksteisega võrreldes müüvad, ja BI-tiim koostab nende jaoks graafiku. 

 

 

Esimesel pilgul jääb juhile mulje, et Alpha vidinad müüvad konkurentidest kõvasti üle, kuigi tegelikkuses müüvad nad Gamma vidinaid vaid umbes 20% – mitte 500% võrra, nagu visualiseerimises vihjatakse.

See on näide väga ilmselgelt kohutavast moonutusest – või on? Kas me kujutaksime ette juhtumit, kus see täpselt sama moonutus oleks kasulikum kui vanilje 0–50,000 XNUMX telg?

Kujutagem näiteks ette sama ettevõtet, välja arvatud juhul, kui praegu soovib juht teada midagi muud.

Sel juhul teenib iga vidin kasumit ainult siis, kui müüb vähemalt 45,000 XNUMX ühikut. Et teada saada, kui hästi igal tootel üksteisega võrreldes ja selle põrandaga võrreldes läheb, asub BI-meeskond tööle ja esitab järgmise visualiseerimise. 

 

 

Thei, kõik on absoluutarvudes teineteisest 20% kaugusel, aga kui lähedal on nad olulisele 45,000 XNUMX piirile? 

Näib, et Gamma vidinad on veidi alla jäänud, kuid kas beetavidinad on? 45,000 XNUMX rida pole isegi märgistatud.

Graafiku suurendamine selle võtmetelje ümber oleks antud juhul väga informatiivne. 

Sellised juhtumid muudavad üldise nõu andmise väga keeruliseks. Parim on olla ettevaatlik. Analüüsige hoolikalt iga olukorda, enne kui venitate ja kärpite y-telge hoolimatu hülgamisega. 

Trikipulgad

Palju vähem hirmutav ja lihtne tulpdiagrammide väärkasutus on see, kui inimesed püüavad oma visualiseeringutega liiga armsaks saada. On tõsi, et vanilje tulpdiagramm võib olla veidi igav, seega on mõistlik, et inimesed prooviksid seda vürtsitada.

Tuntud näide on kurikuulus Läti hiiglaslike naiste juhtum.

 

 

Mõnes mõttes on see seotud mõne eelmises jaotises käsitletud probleemiga. Kui graafiku koostaja oleks kaasanud kogu y-telje kuni 0'0'', siis ei näeks India naised hiiglaslike lätlastega võrreldes välja nagu plikakesed. 

Muidugi, kui nad oleksid lihtsalt kange kasutanud, kaoks see probleem ka ära. Need on igavad, kuid samas ka tõhusad.  

Halvad sektordiagrammid

Sektordiagrammid on inimkonna vaenlane. Nad on peaaegu igas mõttes kohutavad. See on midagi enamat kui autori kirglik arvamus, see on objektiivne teaduslik fakt.

Sektordiagrammide eksitamiseks on rohkem võimalusi kui nende õigeks muutmiseks. Neil on äärmiselt kitsad rakendused ja isegi nende puhul on küsitav, kas need on selle töö jaoks kõige tõhusamad vahendid. 

Nagu öeldud, räägime lihtsalt kõige kohutavamatest eksimustest.

Ülerahvastatud graafikud

See viga ei ole väga levinud, kuid see on äärmiselt tüütu, kui see ilmneb. See näitab ka ühte pi diagrammide põhiprobleemi.

Vaatame järgmist näidet, sektordiagrammi, mis näitab tähesageduse jaotust kirjalikus inglise keeles. 

 

 

Kas arvate, et seda diagrammi vaadates võite kindlalt väita, et mina on tavalisem kui R? Või O? See eirab seda, et mõned viilud on liiga väikesed, et neile isegi silt mahutada. 

Võrdleme seda armsa lihtsa tulpdiagrammiga. 

 

 

Luule!

Saate mitte ainult kohe näha iga tähte kõigi teiste suhtes, vaid saate täpse intuitsiooni nende sageduste kohta ja hõlpsasti nähtava telje, mis näitab tegelikke protsente.

See eelmine graafik? Parandamatu. Muutujaid on lihtsalt liiga palju. 

3D Charts

Veel üks ränk sektordiagrammide kuritarvitamine on see, kui inimesed teevad neid 3D-vormingus, sageli kallutades neid ebapühade nurkade alla. 

Vaatame näidet.

 

 

Lühidalt näeb sinine "EUL-NGL" välja umbes samasugune kui punane "S&D", kuid see pole nii. Kui me kallet vaimselt korrigeerime, on erinevus palju suurem, kui tundub.

Ei ole vastuvõetavat olukorda, kus selline 3D-graafik toimiks, see eksisteerib ainult selleks, et lugejat suhteliste skaalade osas eksitada. 

Lamedad sektordiagrammid näevad suurepärased välja. 

Halvad värvivalikud

Viimane viga, mida inimesed kipuvad tegema, on kaalutlematute värvilahenduste valimine. See on teistega võrreldes väike punkt, kuid see võib inimeste jaoks palju muuta. 

Mõelge järgmisele diagrammile. 

 

 

Tõenäoliselt tundub see teile hea. Kõik on selgelt märgistatud, suurustel on piisavalt suured lahknevused, et on hästi näha, kuidas müük üksteisega võrreldes on.

Kui teil on aga värvipimedus, on see tõenäoliselt väga tüütu. 

Üldreeglina ei tohi punast ja rohelist kunagi kasutada samal graafikul, eriti kõrvuti. 

Muud värviskeemi vead peaksid olema kõigile ilmsed, näiteks 6 erineva kerge tooni või punase valimine.

Takeaways

Andmete visualiseerimiste loomiseks on palju, palju rohkem viise, mis on kohutavad ja takistavad seda, kui hästi inimesed suudavad andmeid mõista. Neid kõiki saab vähese läbimõeldusega vältida.

Oluline on arvestada, kuidas keegi teine ​​graafikut näeb, keegi, kes pole andmetega lähedalt kursis. Teil peab olema sügav arusaam sellest, mis on andmete vaatamise eesmärk ja kuidas neid osi kõige paremini esile tõsta inimesi eksimata.