Difundir información errónea con paneis terribles

by Agosto 17, 2022BI/Analíticacomentarios 0

Como difundes información errónea con paneis terribles

 

 

Os números por si só son difíciles de ler, e aínda máis difícil de extraer inferencias significativas. Moitas veces é necesario visualizar os datos en formas de varios gráficos e gráficos para facer unha análise de datos real. 

Non obstante, se pasaches algún tempo mirando varios gráficos, entenderás unha cousa hai moito tempo: non todas as visualizacións de datos se crean iguais.

Este será un resumo rápido dalgúns dos erros máis comúns que cometen as persoas ao crear gráficos para representar os datos dunha forma rápida e facilmente dixerible.

Mapas malos

Seguindo o xkcd ao principio, é moi común ver datos colocados nun mapa dun xeito terrible e inútil. Un dos delincuentes máis grandes e comúns é o que se mostra no cómic. 

Distribucións poboacionais pouco interesantes

Polo que se ve, a xente adoita vivir nas cidades hoxe en día. 

Só deberías molestarte en mostrar un mapa se a distribución esperada que observas non se aliña coa distribución da poboación total dos EUA.

Por exemplo, se estiveses a vender tacos conxelados e descubrises que máis da metade das túas vendas proviñan de supermercados en West Virginia a pesar da súa presenza nos mercados de todo o país, iso sería bastante notable.

Amosar un mapa que indique isto, así como onde máis son populares os tacos, podería proporcionar información útil. 

De xeito similar, se vendes un produto totalmente en inglés, deberías esperar que a túa distribución de clientes se aliña coa distribución de falantes de inglés en todo o mundo. 

Tamaño de gran malo

Outra forma de estropear un mapa é elixir unha forma pobre de dividir a terra xeograficamente en anacos. Este problema de atopar a unidade máis pequena correcta é común en toda a BI e as visualizacións non son unha excepción.

Para que quede máis claro do que falo, vexamos dous exemplos do mesmo tamaño de gran que teñen dous efectos moi diferentes.

En primeiro lugar, vexamos a alguén que fai un mapa topográfico dos Estados Unidos sombreando o punto de maior elevación de cada condado cunha cor diferente ao longo dunha clave definida. 

 

 

Aínda que é algo efectivo para a costa leste, pero unha vez que chegas ao bordo das Montañas Rochosas, en realidade é só ruído.

Non tes unha moi boa imaxe da xeografía porque (por complicadas razóns históricas) os tamaños dos concellos tenden a ser máis grandes canto máis ao oeste vai. Contan unha historia, pero non unha relevante para a xeografía. 

Contrasta isto cun mapa de filiación relixiosa por concello.

 

 

Este mapa é totalmente efectivo, a pesar de usar o mesmo tamaño de gran. Somos capaces de facer inferencias rápidas, precisas e significativas sobre rexións dos Estados Unidos, como se poden percibir estas rexións, o que a xente que vive alí pode pensar de si mesma e do resto do país.

Facer un mapa eficaz como axuda visual, aínda que é difícil, pode ser moi útil e dilucidador. Só asegúrate de pensar algo no que o teu mapa está a tentar comunicar.

Gráficos de barras malos

Os gráficos de barras son xeralmente máis comúns que a información presentada nun mapa. Son sinxelos de ler, sinxelos de crear e, en xeral, bastante elegantes.

Aínda que son fáciles de facer, hai algúns erros comúns que a xente pode cometer ao tentar reinventar a roda. 

Escalas enganosas

Un dos exemplos máis comúns de malos gráficos de barras é cando alguén fai algo negativo co eixe esquerdo. 

Este é un problema particularmente insidioso e difícil de dar pautas xerais. Para que este problema sexa un pouco máis doado de dixerir, imos comentar algúns exemplos. 

Imaxinemos unha empresa que fabrique tres produtos; Widgets Alpha, Beta e Gamma. O executivo quere saber o ben que se están a vender en comparación entre eles, e o equipo de BI elabora un gráfico para eles. 

 

 

Nunha ollada, o executivo terá a impresión de que os widgets Alpha están a vender moito máis que a competencia, cando en realidade, venden máis que os widgets Gamma en apenas un 20%, non o 500% como se implica na visualización.

Este é un exemplo dunha distorsión moi obviamente atroz, ou é? Poderíamos imaxinar un caso no que esta mesma distorsión sexa máis útil que un eixe de vainilla 0 - 50,000?

Por exemplo, imaxinemos a mesma empresa excepto que agora o executivo quere saber algo diferente.

Neste caso, cada widget só obtén beneficios se venden polo menos 45,000 unidades. Para saber o ben que está a facer cada produto en comparación entre si e en relación a este piso, o equipo de BI ponse a traballar e envía a seguinte visualización. 

 

 

TEstán todos, en termos absolutos, dentro dunha xanela do 20% entre si, pero ¿qué tan preto están da marca tan importante dos 45,000? 

Parece que os widgets Gamma están un pouco curtos, pero son os widgets beta? A liña de 45,000 nin sequera está etiquetada.

Ampliar o gráfico arredor dese eixe clave, neste caso, sería moi informativo. 

Casos como estes dificultan moito dar consellos generales. É mellor ter precaución. Analiza coidadosamente cada situación antes de estirar e recortar o eixe y con abandono temerario. 

Barras de trucos

Un mal uso moito menos asustado e sinxelo dos gráficos de barras é cando a xente intenta ser demasiado bonita coas súas visualizacións. É certo que un gráfico de barras de vainilla pode ser un pouco aburrido, polo que ten sentido que a xente intente condimentalo.

Un exemplo ben coñecido é o infame caso das mulleres xigantes letonas.

 

 

Dalgunha maneira, isto é relevante para algunhas cuestións tratadas na sección anterior. Se o creador da gráfica incluíse todo o eixe y ata 0'0'', entón as mulleres indias non se verían como duendes en comparación coas xigantes letonas. 

Por suposto, se acabasen de usar barras, o problema tamén desaparecería. Son aburridos, pero tamén son efectivos.  

Gráficos circulares malos

Os gráficos circulares son o inimigo da humanidade. Son terribles en case todos os sentidos. Isto é máis que unha opinión apaixonada que defende o autor, é un feito obxectivo, científico.

Hai máis formas de equivocar os gráficos circulares que de acertalos. Teñen aplicacións extremadamente limitadas, e mesmo nesas, é cuestionable se son a ferramenta máis eficaz para o traballo. 

Dito isto, imos falar só dos erros máis flagrantes.

Gráficos superpoblados

Este erro non é moi común, pero é moi molesto cando aparece. Tamén demostra un dos problemas fundamentais dos gráficos pi.

Vexamos o seguinte exemplo, un gráfico circular que mostra a distribución da frecuencia das letras en inglés escrito. 

 

 

Mirando este gráfico, cres que poderías dicir con seguridade que I é máis común que R? Ou O? Isto é ignorar que algunhas das porcións son demasiado pequenas para caber unha etiqueta nelas. 

Comparemos isto cun fermoso e sinxelo gráfico de barras. 

 

 

Poesía!

Non só podes ver inmediatamente cada letra en relación con todas as outras, senón que obtén unha intuición precisa sobre as súas frecuencias e un eixe facilmente visible que mostra as porcentaxes reais.

Ese gráfico anterior? Insoluble. Simplemente hai demasiadas variables. 

Gráficos 3D

Outro abuso flagrante dos gráficos circulares é cando a xente os fai en 3D, moitas veces inclinándoos en ángulos profanos. 

Vexamos un exemplo.

 

 

Nunha ollada, o "EUL-NGL" azul parece máis ou menos o mesmo que o "S&D" vermello, pero non é o caso. Se corriximos mentalmente a inclinación, a diferenza é moito maior do que parece.

Non hai unha situación aceptable onde este tipo de gráfico 3D funcione, só existe para enganar ao lector sobre as escalas relativas. 

Os gráficos circulares planos vense ben. 

Pobre elección de cores

O último erro que a xente adoita cometer é escoller esquemas de cores desconsiderados. Este é un pequeno punto en comparación cos outros, pero pode marcar unha gran diferenza para as persoas. 

Considere o seguinte cadro. 

 

 

É probable que isto che pareza ben. Todo está claramente etiquetado, os tamaños teñen discrepancias o suficientemente grandes como para que sexa fácil ver como as vendas se comparan entre si.

Non obstante, se padece daltonismo, é probable que isto sexa moi molesto. 

Como regra xeral, o vermello e o verde nunca deberían usarse no mesmo gráfico, especialmente un adxacente ao outro. 

Outros erros de esquema de cores deberían ser obvios para todos, como escoller 6 tons lixeiros ou vermellos diferentes.

Takeaways

Hai moitas, moitas máis formas de crear visualizacións de datos que son terribles e dificultan o ben que as persoas son capaces de entender os datos. Todos eles pódense evitar cun pouco de consideración.

É importante ter en conta como vai ver o gráfico outra persoa, alguén que non estea moi familiarizado cos datos. Debes ter unha comprensión profunda de cal é o obxectivo de ver os datos e da mellor forma de destacar esas partes sen enganar á xente.