Répandre la désinformation avec des tableaux de bord terribles

by 17 août 2022BI/Analytique0 commentaires

Comment vous propagez la désinformation avec des tableaux de bord terribles

 

 

Les nombres en eux-mêmes sont difficiles à lire et encore plus difficiles à tirer de déductions significatives. Il arrive souvent que la visualisation des données sous la forme de divers graphiques et diagrammes soit nécessaire pour effectuer une véritable analyse de données. 

Cependant, si vous avez passé du temps à regarder divers graphiques, vous aurez compris une chose il y a longtemps : toutes les visualisations de données ne sont pas créées égales.

Ce sera un bref aperçu de certaines des erreurs les plus courantes que les gens commettent lors de la création de graphiques pour représenter les données d'une manière rapide et facile à digérer.

Mauvaises cartes

En suivant le xkcd au début, il est très courant de voir des données mises sur une carte d'une manière terrible et inutile. L'un des délinquants les plus importants et les plus courants est celui présenté dans la bande dessinée. 

Distributions de population inintéressantes

Il s'avère que les gens ont tendance à vivre dans les villes ces jours-ci. 

Vous ne devriez prendre la peine de montrer une carte que si la distribution attendue que vous observez ne correspond pas à la distribution de la population totale aux États-Unis.

Par exemple, si vous vendiez des tacos surgelés et découvriez que plus de la moitié de vos ventes provenaient d'épiceries de Virginie-Occidentale malgré leur présence sur les marchés du pays, ce serait tout à fait remarquable.

Montrer une carte indiquant cela, ainsi que les autres endroits où les tacos sont populaires, pourrait fournir des informations utiles. 

Dans le même ordre d'idées, si vous vendez un produit entièrement en anglais, vous devez vous attendre à ce que votre répartition des clients s'aligne sur la répartition des anglophones dans le monde. 

Mauvaise taille de grain

Une autre façon de gâcher une carte consiste à choisir une mauvaise façon de diviser géographiquement le terrain en morceaux. Ce problème de recherche de la plus petite unité appropriée est courant dans toute la BI, et les visualisations ne font pas exception.

Pour mieux comprendre ce dont je parle, regardons deux exemples de la même taille de grain ayant deux effets très différents.

Tout d'abord, regardons quelqu'un faire une carte topographique des États-Unis en ombrant le point le plus élevé de chaque comté d'une couleur différente le long d'une clé définie. 

 

 

Bien que ce soit un peu efficace pour la côte est, mais une fois que vous avez atteint le bord des Rocheuses, ce n'est vraiment que du bruit.

Vous n'obtenez pas une très bonne image de la géographie car (pour des raisons historiques compliquées) la taille des comtés a tendance à s'agrandir à mesure que vous vous dirigez vers l'ouest. Ils racontent une histoire, mais pas une histoire pertinente pour la géographie. 

Comparez cela avec une carte d'appartenance religieuse par comté.

 

 

Cette carte est totalement efficace, malgré l'utilisation exacte de la même taille de grain. Nous sommes en mesure de faire des déductions rapides, précises et significatives sur les régions des États-Unis, comment ces régions pourraient être perçues, ce que les gens qui y vivent peuvent penser d'eux-mêmes et du reste du pays.

Faire une carte efficace comme aide visuelle, bien que difficile, peut être très utile et éclairant. Assurez-vous simplement de réfléchir à ce que votre carte essaie de communiquer.

Mauvais graphiques à barres

Les graphiques à barres sont généralement plus courants que les informations présentées sur une carte. Ils sont simples à lire, simples à créer et généralement assez élégants.

Même s'ils sont faciles à faire, il y a des erreurs courantes que les gens peuvent faire en essayant de réinventer la roue. 

Échelles trompeuses

L'un des exemples les plus courants de mauvais graphiques à barres est lorsque quelqu'un fait quelque chose de fâcheux avec l'axe de gauche. 

Il s'agit d'un problème particulièrement insidieux, et difficile de donner des directives générales. Pour rendre ce problème un peu plus facile à digérer, discutons de quelques exemples. 

Imaginons une entreprise qui fabrique trois produits ; Widgets Alpha, Bêta et Gamma. L'exécutif veut savoir comment ils se vendent les uns par rapport aux autres, et l'équipe BI leur prépare un graphique. 

 

 

En un coup d'œil, l'exécutif aurait l'impression que les widgets Alpha se vendent bien plus que la concurrence, alors qu'en réalité, ils se vendent plus que les widgets Gamma d'environ 20 % - et non de 500 % comme le laisse entendre la visualisation.

Ceci est un exemple d'une distorsion très manifestement odieuse - ou est-ce le cas ? Pourrions-nous imaginer un cas où cette même distorsion exacte serait plus utile qu'un axe vanille 0 - 50,000 XNUMX ?

Par exemple, imaginons la même entreprise, sauf que maintenant l'exécutif veut savoir quelque chose de différent.

Dans ce cas, chaque widget ne réalise un profit que s'il vend au moins 45,000 XNUMX unités. Pour savoir comment chaque produit se comporte les uns par rapport aux autres et par rapport à cet étage, l'équipe BI se met au travail et soumet la visualisation suivante. 

 

 

Tils sont tous, en termes absolus, dans une fenêtre de 20 % les uns des autres, mais à quel point sont-ils proches de la barre des 45,000 XNUMX ? 

Il semble que les widgets Gamma soient un peu à la traîne, mais sont-ils des widgets Beta ? La ligne 45,000 XNUMX n'est même pas étiquetée.

Agrandir le graphique autour de cet axe clé, dans ce cas, serait très instructif. 

Des cas comme ceux-ci rendent très difficile de donner des conseils généraux. Il vaut mieux faire preuve de prudence. Analysez soigneusement chaque situation avant d'étirer et de recadrer l'axe y avec un abandon téméraire. 

Barres gadgets

Une mauvaise utilisation beaucoup moins effrayante et simple des graphiques à barres est lorsque les gens essaient de devenir trop mignons avec leurs visualisations. Il est vrai qu'un graphique à barres vanille peut être un peu ennuyeux, il est donc logique que les gens essaient de le pimenter.

Un exemple bien connu est le tristement célèbre cas des femmes lettones géantes.

 

 

À certains égards, cela est pertinent pour certaines questions abordées dans la section précédente. Si le créateur du graphique avait inclus tout l'axe y jusqu'à 0'0'', alors les femmes indiennes ne ressembleraient pas à des pixies comparées aux géantes lettones. 

Bien sûr, s'ils venaient d'utiliser des barres, le problème disparaîtrait également. Ils sont ennuyeux, mais ils sont aussi efficaces.  

Mauvais camemberts

Les camemberts sont l'ennemi de l'humanité. Ils sont terribles à presque tous les égards. C'est plus qu'une opinion passionnée de l'auteur, c'est un fait scientifique objectif.

Il existe plus de façons de se tromper dans les camemberts que de les corriger. Ils ont des applications extrêmement étroites, et même dans celles-ci, on peut se demander s'ils sont l'outil le plus efficace pour le travail. 

Cela étant dit, parlons simplement des faux pas les plus flagrants.

Graphiques surchargés

Cette erreur n'est pas extrêmement courante, mais elle est extrêmement ennuyeuse lorsqu'elle se produit. Il démontre également l'un des problèmes fondamentaux des cartes pi.

Regardons l'exemple suivant, un graphique à secteurs montrant la distribution de la fréquence des lettres en anglais écrit. 

 

 

En regardant ce tableau, pensez-vous pouvoir dire avec certitude que I est plus courant que R ? Ou O? C'est ignorer que certaines des tranches sont trop petites pour même y apposer une étiquette. 

Comparons cela à un joli graphique à barres simple. 

 

 

Poésie!

Non seulement vous pouvez voir immédiatement chaque lettre par rapport à toutes les autres, mais vous obtenez une intuition précise de leurs fréquences et un axe facilement visible affichant les pourcentages réels.

Ce tableau précédent ? Inréparable. Il y a tout simplement trop de variables. 

3D Charts

Un autre abus flagrant des camemberts est lorsque les gens les créent en 3D, les inclinant souvent à des angles impies. 

Regardons un exemple.

 

 

En un coup d'œil, le "EUL-NGL" bleu ressemble à peu près au "S&D" rouge, mais ce n'est pas le cas. Si nous corrigeons mentalement l'inclinaison, la différence est beaucoup plus grande qu'il n'y paraît.

Il n'y a pas de situation acceptable où ce genre de graphique 3D fonctionnera, il n'existe que pour induire le lecteur en erreur quant aux échelles relatives. 

Les graphiques à secteurs plats semblent très bien. 

Mauvais choix de couleurs

La dernière erreur que les gens ont tendance à faire est de choisir des combinaisons de couleurs inconsidérées. C'est un petit point par rapport aux autres, mais cela peut faire une grande différence pour les gens. 

Considérez le tableau suivant. 

 

 

Il y a de fortes chances que cela vous semble très bien. Tout est clairement étiqueté, les tailles présentent des écarts suffisamment importants pour qu'il soit facile de voir comment les ventes se comparent les unes aux autres.

Cependant, si vous souffrez de daltonisme, cela est probablement très ennuyeux. 

En règle générale, le rouge et le vert ne doivent jamais être utilisés sur le même graphique, notamment adjacents l'un à l'autre. 

D'autres erreurs de combinaison de couleurs devraient être évidentes pour tout le monde, comme choisir 6 nuances légères ou rouges différentes.

Points clés à retenir

Il existe de nombreuses autres façons de créer des visualisations de données qui sont terribles et entravent la capacité des gens à comprendre les données. Tous peuvent être évités avec un peu de réflexion.

Il est important de considérer comment quelqu'un d'autre va voir le graphique, quelqu'un qui n'est pas intimement familier avec les données. Vous devez avoir une compréhension approfondie de l'objectif de l'examen des données et de la meilleure façon de mettre en évidence ces parties sans induire les gens en erreur. 

 

BI/AnalytiqueAutres
NY Style vs Chicago Style Pizza : un délicieux débat

NY Style vs Chicago Style Pizza : un délicieux débat

Pour satisfaire nos envies, peu de choses peuvent rivaliser avec la joie d’une part de pizza bien chaude. Le débat entre la pizza à la new-yorkaise et la pizza à la Chicago suscite des discussions passionnées depuis des décennies. Chaque style a ses propres caractéristiques uniques et ses fans dévoués....

En savoir plus

BI/Analytique
Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Catalogues Analytics – Une étoile montante dans l’écosystème Analytics

Introduction En tant que directeur de la technologie (CTO), je suis toujours à la recherche de technologies émergentes qui transforment notre façon d'aborder l'analyse. L'une de ces technologies qui a retenu mon attention au cours des dernières années et qui est immense et prometteuse est l'Analytics...

En savoir plus