Difundir información errónea con tableros terribles

by 17 de Agosto, 2022BI/Analítica0 comentarios

Cómo propagas información errónea con tableros terribles

 

 

Los números en sí mismos son difíciles de leer y aún más difíciles de extraer de ellos. A menudo, es necesario visualizar los datos en forma de varios gráficos y diagramas para realizar cualquier análisis de datos reales. 

Sin embargo, si ha pasado algún tiempo mirando varios gráficos, se habrá dado cuenta de una cosa hace mucho tiempo: no todas las visualizaciones de datos se crean de la misma manera.

Este será un resumen rápido de algunos de los errores más comunes que cometen las personas al crear gráficos para representar los datos de una manera rápida y fácil de digerir.

Malos mapas

Siguiendo con el xkcd al principio, es muy común ver datos colocados en un mapa de una manera terrible e inútil. Uno de los delincuentes más grandes y comunes es el que se muestra en el cómic. 

Distribuciones de población sin interés

Resulta que la gente tiende a vivir en ciudades en estos días. 

Solo debe molestarse en mostrar un mapa si la distribución esperada que observa no se alinea con la distribución de la población total en los EE. UU.

Por ejemplo, si estuviera vendiendo tacos congelados y descubriera que más de la mitad de sus ventas provenían de supermercados en West Virginia a pesar de su presencia en los mercados de todo el país, eso sería bastante notable.

Mostrar un mapa que indique esto, así como también dónde son populares los tacos, podría proporcionar información útil. 

De manera similar, si vende un producto completamente en inglés, debe esperar que su distribución de clientes se alinee con la distribución de hablantes de inglés en todo el mundo. 

Mal tamaño de grano

Otra forma de estropear un mapa es elegir una forma pobre de dividir la tierra geográficamente en partes. Este problema de encontrar la unidad más pequeña correcta es común en todo BI, y las visualizaciones no son una excepción.

Para que quede más claro de lo que estoy hablando, veamos dos ejemplos del mismo tamaño de grano que tiene dos efectos muy diferentes.

Primero, veamos a alguien que hace un mapa topográfico de los Estados Unidos sombreando el punto de mayor elevación en cada condado con un color diferente a lo largo de una clave definida. 

 

 

Si bien es algo efectivo para la costa este, pero una vez que llegas al borde de las Montañas Rocosas, en realidad todo es ruido.

No obtiene una imagen muy buena de la geografía porque (por razones históricas complicadas) el tamaño de los condados tiende a aumentar a medida que avanza hacia el oeste. Cuentan una historia, pero no una relevante para la geografía. 

Compare esto con un mapa de afiliación religiosa por condado.

 

 

Este mapa es totalmente efectivo, a pesar de usar exactamente el mismo tamaño de grano. Podemos hacer inferencias rápidas, precisas y significativas sobre las regiones de los Estados Unidos, cómo se pueden percibir estas regiones, lo que las personas que viven allí pueden pensar de sí mismas y del resto del país.

Hacer un mapa efectivo como ayuda visual, aunque es difícil, puede ser muy útil y esclarecedor. Solo asegúrese de pensar un poco en lo que su mapa está tratando de comunicar.

Gráficos de barras defectuosos

Los gráficos de barras son generalmente más comunes que la información presentada en un mapa. Son fáciles de leer, simples de crear y, en general, bastante elegantes.

Aunque son fáciles de hacer, hay algunos errores comunes que la gente puede cometer al tratar de reinventar la rueda. 

Escalas engañosas

Uno de los ejemplos más comunes de gráficos de barras defectuosos es cuando alguien hace algo incorrecto con el eje izquierdo. 

Este es un problema particularmente insidioso y difícil de dar pautas generales. Para hacer este problema un poco más fácil de digerir, analicemos algunos ejemplos. 

Imaginemos una empresa que fabrica tres productos; Widgets alfa, beta y gamma. El ejecutivo quiere saber qué tan bien se están vendiendo en comparación con los demás, y el equipo de BI elabora un gráfico para ellos. 

 

 

De un vistazo, el ejecutivo tendría la impresión de que Alpha Widgets se venden mucho más que la competencia, cuando en realidad, superan en ventas a los Gamma en solo un 20 %, no un 500 % como se insinúa en la visualización.

Este es un ejemplo de una distorsión muy obviamente atroz, ¿o no? ¿Podríamos imaginar un caso en el que exactamente esta misma distorsión sería más útil que un eje estándar de 0 a 50,000 XNUMX?

Por ejemplo, imaginemos la misma empresa excepto que ahora el ejecutivo quiere saber algo diferente.

En este caso, cada widget solo genera ganancias si vende al menos 45,000 unidades. Para averiguar qué tan bien está funcionando cada producto en comparación con los demás y en relación con este piso, el equipo de BI se pone a trabajar y envía la siguiente visualización. 

 

 

Ttodos están, en términos absolutos, dentro de una ventana del 20% entre sí, pero ¿qué tan cerca están de la importante marca de 45,000? 

Parece que los widgets Gamma se están quedando cortos, pero ¿son los widgets Beta? La línea de 45,000 ni siquiera está etiquetada.

Ampliar el gráfico alrededor de ese eje clave, en este caso, sería muy informativo. 

Casos como estos hacen que dar consejos generales sea muy difícil. Lo mejor es tener precaución. Analice cuidadosamente cada situación antes de estirar y recortar el eje y con un abandono imprudente. 

Barras de truco

Un mal uso mucho menos aterrador y simple de los gráficos de barras es cuando las personas intentan ser demasiado lindas con sus visualizaciones. Es cierto que un gráfico de barras de vainilla puede ser un poco aburrido, por lo que tiene sentido que la gente intente darle vida.

Un ejemplo bien conocido es el infame caso de las gigantescas mujeres letonas.

 

 

De alguna manera, esto es relevante para algunos temas discutidos en la sección anterior. Si el creador del gráfico hubiera incluido todo el eje y hasta 0'0'', las mujeres indias no se verían como duendes en comparación con las gigantas letonas. 

Por supuesto, si solo hubieran usado barras, el problema también desaparecería. Son aburridos, pero también son efectivos.  

Gráficos circulares defectuosos

Los gráficos circulares son el enemigo de la humanidad. Son terribles en casi todos los sentidos. Esto es más que una opinión apasionada expuesta por el autor, es un hecho científico objetivo.

Hay más formas de equivocarse en los gráficos circulares que de hacerlo bien. Tienen aplicaciones extremadamente limitadas, e incluso en ellas, es cuestionable si son la herramienta más efectiva para el trabajo. 

Dicho esto, hablemos de los errores más atroces.

Gráficos superpoblados

Este error no es muy común, pero es muy molesto cuando aparece. También demuestra uno de los problemas fundamentales con los gráficos pi.

Veamos el siguiente ejemplo, un gráfico circular que muestra la distribución de la frecuencia de letras en inglés escrito. 

 

 

Mirando este cuadro, ¿crees que podrías decir con confianza que I es más común que R? ¿O? Esto ignora que algunas de las rebanadas son demasiado pequeñas para colocarles una etiqueta. 

Comparemos esto con un hermoso y simple gráfico de barras. 

 

 

¡Poesía!

No solo puede ver inmediatamente cada letra en relación con todas las demás, sino que obtiene una intuición precisa sobre sus frecuencias y un eje fácilmente visible que muestra los porcentajes reales.

¿Ese gráfico anterior? Irreparable. Simplemente hay demasiadas variables. 

Gráficos 3D

Otro abuso atroz de los gráficos circulares es cuando las personas los hacen en 3D, a menudo inclinándolos en ángulos impíos. 

Veamos un ejemplo.

 

 

De un vistazo, el "EUL-NGL" azul se ve casi igual que el "S&D" rojo, pero ese no es el caso. Si corregimos mentalmente la inclinación, la diferencia es mucho mayor de lo que parece.

No existe una situación aceptable en la que este tipo de gráfico 3D funcione, solo existe para engañar al lector en cuanto a las escalas relativas. 

Los gráficos circulares planos se ven bien. 

Malas elecciones de color

El último error que la gente tiende a cometer es elegir esquemas de color desconsiderados. Este es un punto pequeño en comparación con los demás, pero puede marcar una gran diferencia para las personas. 

Considere el siguiente cuadro. 

 

 

Lo más probable es que esto te parezca bien. Todo está claramente etiquetado, los tamaños tienen discrepancias lo suficientemente grandes como para que sea fácil ver cómo se comparan las ventas entre sí.

Sin embargo, si sufre de daltonismo, es probable que esto sea muy molesto. 

Como regla general, el rojo y el verde nunca deben usarse en el mismo gráfico, particularmente uno al lado del otro. 

Otros errores de combinación de colores deberían ser obvios para todos, como elegir 6 tonos diferentes o rojo.

Takeaways

Hay muchas, muchas más formas de crear visualizaciones de datos que son terribles y dificultan la comprensión de los datos por parte de las personas. Todos ellos se pueden evitar con un poco de consideración.

Es importante considerar cómo alguien más verá el gráfico, alguien que no esté íntimamente familiarizado con los datos. Debe tener una comprensión profunda de cuál es el objetivo de mirar los datos y cuál es la mejor manera de resaltar esas partes sin engañar a las personas. 

 

BI/AnalíticaOtros
Por qué Microsoft Excel es la herramienta de análisis número uno
¿Por qué Excel es la herramienta de análisis número uno?

¿Por qué Excel es la herramienta de análisis número uno?

  Es barato y fácil. El software de hoja de cálculo Microsoft Excel probablemente ya esté instalado en la computadora del usuario empresarial. Y hoy en día muchos usuarios han estado expuestos al software de Microsoft Office desde la escuela secundaria o incluso antes. Esta respuesta instintiva en cuanto a...

Leer Más

BI/AnalíticaOtros
Ordene sus conocimientos: una guía para la limpieza de primavera de Analytics

Ordene sus conocimientos: una guía para la limpieza de primavera de Analytics

Ordene sus conocimientos Una guía para el análisis Limpieza de primavera El nuevo año comienza con una explosión; Los informes de fin de año se crean y analizan, y luego todos se adaptan a un horario de trabajo consistente. A medida que los días se hacen más largos y los árboles y las flores florecen,...

Leer Más

BI/AnalíticaOtros
Pizza estilo Nueva York versus pizza estilo Chicago: un delicioso debate

Pizza estilo Nueva York versus pizza estilo Chicago: un delicioso debate

A la hora de satisfacer nuestros antojos, pocas cosas pueden rivalizar con el placer de una porción de pizza bien caliente. El debate entre la pizza al estilo de Nueva York y la de Chicago ha provocado apasionados debates durante décadas. Cada estilo tiene sus propias características únicas y seguidores devotos....

Leer Más

BI/Analítica
Catálogos de análisis: una estrella en ascenso en el ecosistema de análisis

Catálogos de análisis: una estrella en ascenso en el ecosistema de análisis

Introducción Como director de tecnología (CTO), siempre estoy buscando tecnologías emergentes que transformen la forma en que abordamos la analítica. Una de esas tecnologías que me llamó la atención en los últimos años y que es inmensamente prometedora es Analytics...

Leer Más