Spredning af misinformation med frygtelige dashboards

by August 17, 2022BI/Analytik0 kommentarer

Hvordan du spreder misinformation med frygtelige dashboards

 

 

Tal i sig selv er svære at læse, og endnu sværere at drage meningsfulde slutninger fra. Det er ofte sådan, at visualisering af dataene i form af forskellige grafikker og diagrammer er nødvendigt for at foretage en reel dataanalyse. 

Men hvis du har brugt noget tid på at kigge på forskellige grafer, har du indset én ting for længe siden – ikke alle datavisualiseringer er skabt lige.

Dette vil være en hurtig gennemgang af nogle af de mest almindelige fejl, folk begår, når de opretter diagrammer for at repræsentere dataene på en hurtigt og let fordøjelig måde.

Dårlige kort

Ved at følge op på xkcd'en i starten er det virkelig almindeligt at se data sat på et kort på en måde, der er forfærdelig og ubrugelig. En af de største og mest almindelige lovovertrædere er den, der vises i tegneserien. 

Uinteressante befolkningsfordelinger

Som det viser sig, har folk en tendens til at bo i byer i disse dage. 

Du bør kun gider at vise et kort, hvis den forventede fordeling, du observerer, ikke stemmer overens med fordelingen af ​​den samlede befolkning i USA.

For eksempel, hvis du solgte frosne tacos og fandt ud af, at over halvdelen af ​​dit salg kom fra dagligvarebutikker i West Virginia på trods af deres tilstedeværelse på markeder i hele landet, ville det være ret bemærkelsesværdigt.

Visning af et kort, der angiver dette, samt hvor andre tacos er populære, kunne give nyttige oplysninger. 

På samme måde, hvis du sælger et produkt, der udelukkende er på engelsk, skal du forvente, at din distribution af kunder stemmer overens med distributionen af ​​engelsktalende på verdensplan. 

Dårlig kornstørrelse

En anden måde at ødelægge et kort på er ved at vælge en dårlig måde at opdele landet geografisk i bidder. Dette problem med at finde den rigtige mindste enhed er almindeligt i hele BI, og visualiseringer er ikke en undtagelse.

For at gøre det mere klart, hvad jeg taler om, lad os se på to eksempler på, at den samme kornstørrelse har to meget forskellige effekter.

Lad os først se på nogen, der laver et topografisk kort over USA ved at skygge punktet med højeste højde i hvert amt i en anden farve langs en defineret nøgle. 

 

 

Selvom det er noget effektivt for østkysten, men når du først rammer kanten af ​​Rockies, er det egentlig bare alt støj.

Man får ikke et særligt godt billede af geografien, fordi (af komplicerede historiske årsager) amtsstørrelser har en tendens til at blive større, jo længere mod vest man kommer. De fortæller en historie, bare ikke en, der er relevant for geografi. 

Sammenlign dette med et kort over religiøst tilhørsforhold efter amt.

 

 

Dette kort er fuldstændig effektivt, på trods af at du bruger nøjagtig samme kornstørrelse. Vi er i stand til at lave hurtige, præcise og meningsfulde slutninger om regioner i USA, hvordan disse regioner kan opfattes, hvad de mennesker, der bor der, kan tænke om sig selv og resten af ​​landet.

At lave et effektivt kort som en visuel hjælp, selvom det er svært, kan være meget nyttigt og opklarende. Bare sørg for at tænke lidt over, hvad dit kort forsøger at kommunikere.

Dårlige søjlediagrammer

Søjlediagrammer er generelt mere almindelige end oplysninger præsenteret på et kort. De er nemme at læse, nemme at lave og generelt ret slanke.

Selvom de er nemme at lave, er der nogle almindelige fejl, folk kan begå, mens de forsøger at genopfinde hjulet. 

Vildledende skalaer

Et af de mest almindelige eksempler på dårlige søjlediagrammer er, når nogen gør noget forkert med venstre akse. 

Dette er et særligt snigende problem, og det er svært at give generelle retningslinjer. For at gøre dette problem lidt lettere at fordøje, lad os diskutere nogle eksempler. 

Lad os forestille os en virksomhed, der laver tre produkter; Alfa-, beta- og gamma-widgets. Direktøren vil gerne vide, hvor godt de sælger i forhold til hinanden, og BI-teamet laver en graf for dem. 

 

 

Umiddelbart ville lederen få det indtryk, at Alpha Widgets langt oversælger konkurrenterne, mens de i virkeligheden sælger Gamma-widgets med kun omkring 20 % – ikke 500 %, som det antydes i visualiseringen.

Dette er et eksempel på en meget åbenlyst afskyelig forvrængning - eller er det? Kunne vi forestille os et tilfælde, hvor denne nøjagtig samme forvrængning ville være mere nyttig end en vanilje 0 – 50,000 akse?

Lad os f.eks. forestille os den samme virksomhed, undtagen nu vil direktøren vide noget andet.

I dette tilfælde giver hver widget kun en fortjeneste, hvis de sælger mindst 45,000 enheder. For at finde ud af, hvor godt hvert produkt klarer sig i forhold til hinanden og i forhold til denne etage, går BI-teamet i gang og sender følgende visualisering. 

 

 

Thej er alle, i absolutte tal, inden for et 20%-vindue fra hinanden, men hvor tæt er de på det vigtige 45,000-mærke? 

Det ser ud til, at Gamma-widgets kommer lidt til kort, men er Beta-widgets? 45,000-linjen er ikke engang mærket.

At forstørre grafen omkring den nøgleakse, i dette tilfælde, ville være meget informativt. 

Sager som disse gør det meget vanskeligt at give generelle råd. Det er bedst at udvise forsigtighed. Analyser omhyggeligt hver situation, før du strækker og beskærer y-aksen med hensynsløs opgivelse. 

Gimmick barer

Et meget mindre skræmmende og simpelt misbrug af søjlediagrammer er, når folk prøver at blive for søde med deres visualiseringer. Det er rigtigt, at et vaniljesøjlediagram kan være lidt kedeligt, så det giver mening, at folk vil prøve at pifte det op.

Et velkendt eksempel er den berygtede sag om de gigantiske lettiske kvinder.

 

 

På nogle måder er dette relevant for nogle spørgsmål, der er diskuteret i det foregående afsnit. Hvis skaberen af ​​grafen havde inkluderet hele y-aksen helt til 0'0'', så ville indiske kvinder ikke ligne nisser sammenlignet med gigantiske letterne. 

Hvis de bare havde brugt stænger, ville problemet selvfølgelig også forsvinde. De er kedelige, men de er også effektive.  

Dårlige cirkeldiagrammer

Cirkeldiagrammer er menneskehedens fjende. De er forfærdelige på næsten alle måder. Dette er mere end en lidenskabelig mening, som forfatteren støtter, dette er objektivt, videnskabeligt faktum.

Der er flere måder at få cirkeldiagrammer forkerte på, end der er til at få dem rigtige. De har ekstremt snævre applikationer, og selv i dem er det tvivlsomt, om de er det mest effektive værktøj til jobbet. 

Når det er sagt, lad os lige tale om de mest alvorlige fejltrin.

Overfyldte diagrammer

Denne fejl er ikke ekstremt almindelig, men den er ekstremt irriterende, når den dukker op. Det viser også et af de grundlæggende problemer med pi-diagrammer.

Lad os se på følgende eksempel, et cirkeldiagram, der viser fordelingen af ​​bogstavsfrekvens på skriftlig engelsk. 

 

 

Ser du på dette diagram, tror du, at du med tillid kan sige, at I er mere almindelig end R? Eller O? Dette er at ignorere, at nogle af skiverne er for små til overhovedet at passe en etiket på dem. 

Lad os sammenligne dette med et smukt, enkelt søjlediagram. 

 

 

Poesi!

Ikke alene kan du umiddelbart se hvert bogstav i forhold til alle de andre, men du får en nøjagtig intuition om deres frekvenser og en let synlig akse, der viser de faktiske procenter.

Det forrige diagram? Uoprettelig. Der er simpelthen for mange variabler. 

3D Charts

Et andet voldsomt misbrug af cirkeldiagrammer er, når folk laver dem i 3D, ofte vipper dem i uhellige vinkler. 

Lad os se på et eksempel.

 

 

Umiddelbart ser den blå "EUL-NGL" omtrent det samme ud som den røde "S&D", men det er ikke tilfældet. Hvis vi mentalt korrigerer for tilt, er forskellen meget meget større, end det ser ud til.

Der er ingen acceptabel situation, hvor denne form for 3D-graf vil fungere, den eksisterer kun for at vildlede læseren med hensyn til de relative skalaer. 

Flade cirkeldiagrammer ser fint ud. 

Dårlige farvevalg

Den sidste fejl, folk har tendens til at begå, er at vælge hensynsløse farveskemaer. Dette er en lille pointe i forhold til de andre, men det kan gøre en stor forskel for folk. 

Overvej følgende diagram. 

 

 

Chancerne er, at dette ser fint ud for dig. Alt er tydeligt mærket, størrelserne har store nok uoverensstemmelser til, at det er nemt at se, hvordan salget sammenlignes med hinanden.

Men hvis du lider af farveblindhed, er dette sandsynligvis meget irriterende. 

Som en generel regel bør rød og grøn aldrig bruges på den samme graf, især ved siden af ​​hinanden. 

Andre farveskemafejl bør være indlysende for alle, såsom at vælge 6 forskellige svage nuancer eller røde.

Takeaways

Der er mange, mange flere måder at skabe datavisualiseringer på, der er forfærdelige og hindrer, hvor godt folk er i stand til at forstå data. Alle af dem kan undgås med en lille smule omtanke.

Det er vigtigt at overveje, hvordan en anden vil se grafen, en person, der ikke er fortrolig med dataene. Du skal have en dyb forståelse af, hvad målet med at se på dataene er, og hvordan du bedst fremhæver disse dele uden at vildlede folk.