用糟糕的仪表板传播错误信息

by 2022 年 8 月 17 日商业智能/分析0评论

你如何用糟糕的仪表板传播错误信息

 

 

数字本身很难阅读,甚至更难从中得出有意义的推论。 通常情况下,以各种图形和图表的形式将数据可视化是进行任何真实数据分析所必需的。 

但是,如果您花大量时间查看各种图表,您会很久以前就意识到一件事——并非所有数据可视化都是平等的。

这将简要介绍人们在创建图表以快速且易于理解的方式表示数据时所犯的一些最常见错误。

糟糕的地图

在开始时跟进 xkcd,看到数据以一种可怕且无用的方式放置在地图上是很常见的。 漫画中显示的最大和最常见的罪犯之一。 

无趣的人口分布

事实证明,如今人们往往住在城市里。 

如果您观察到的预期分布与美国的总人口分布不一致,您应该只费心展示地图。

例如,如果您正在销售冷冻玉米饼,并且发现您的一半以上的销售额来自西弗吉尼亚州的杂货店,尽管它们在全国市场都有销售,那将是非常了不起的。

显示一张表明这一点的地图,以及炸玉米饼流行的其他地方,可以提供有用的信息。 

同样,如果您销售的产品完全使用英语,您应该期望您的客户分布与全球英语使用者的分布保持一致。 

不良粒度

另一种弄乱地图的方法是选择一种糟糕的方式将土地从地理上分成几块。 寻找正确的最小单位的问题在整个 BI 中很常见,可视化也不例外。

为了更清楚我在说什么,让我们看两个具有两种截然不同效果的相同晶粒尺寸的示例。

首先,让我们看看某人通过沿定义的键将每个县的最高海拔点涂上不同的颜色来制作美国的地形图。 

 

 

虽然它对东海岸有点有效,但一旦你到达落基山脉的边缘,它真的只是所有的噪音。

您无法很好地了解地理情况,因为(由于复杂的历史原因)您向西走得越远,县的规模就会越大。 他们讲述了一个故事,只是与地理无关。 

将此与按县划分的宗教信仰地图进行对比。

 

 

尽管使用了完全相同的晶粒尺寸,但这张地图是完全有效的。 我们能够对美国的地区做出快速、准确和有意义的推论,这些地区可能会被如何看待,居住在那里的人们可能会如何看待自己和美国其他地区。

制作有效的地图作为视觉辅助虽然很困难,但可能非常有用和说明问题。 请务必考虑一下您的地图试图传达的内容。

糟糕的条形图

条形图通常比地图上显示的信息更常见。 它们易于阅读,易于创建,并且通常非常时尚。

尽管它们很容易犯,但人们在尝试重新发明轮子时可能会犯一些常见的错误。 

误导性尺度

坏条形图最常见的例子之一是当有人对左轴做了一些不愉快的事情时。 

这是一个特别隐蔽的问题,很难给出全面的指导。 为了让这个问题更容易理解,让我们讨论一些例子。 

让我们想象一家生产三种产品的公司; Alpha、Beta 和 Gamma 小部件。 高管想知道他们之间的销售情况,BI 团队为他们制作了一张图表。 

 

 

乍一看,主管会觉得 Alpha 小部件的销量远远超过竞争对手,而实际上,它们的销量仅比 Gamma 小部件高出约 20%,而不是可视化中暗示的 500%。

这是一个非常明显令人发指的扭曲的例子——或者是吗? 我们能想象这样一种情况,这种完全相同的失真会比普通的 0 – 50,000 轴更有用吗?

例如,让我们想象同一家公司,但现在主管想知道一些不同的事情。

在这种情况下,每个小部件只有在销售至少 45,000 件时才能盈利。 为了了解每个产品之间的比较以及与该楼层的关系,BI 团队开始工作并提交以下可视化。 

 

 

T就绝对而言,它们都在彼此 20% 的窗口内,但它们离所有重要的 45,000 大关有多近? 

看起来 Gamma 小部件有点不足,但 Beta 小部件是吗? 甚至没有标记 45,000 行。

在这种情况下,围绕该关键轴放大图表将提供大量信息。 

像这样的案例使得提供一揽子建议变得非常困难。 最好谨慎行事。 在不计后果地拉伸和裁剪 y 轴之前,请仔细分析每种情况。 

噱头酒吧

条形图的一个不那么可怕和简单的误用是当人们试图让他们的可视化变得太可爱时。 确实,香草条形图可能有点无聊,因此人们会尝试为它增添趣味是有道理的。

一个众所周知的例子是臭名昭著的拉脱维亚巨人妇女案。

 

 

在某些方面,这与上一节中讨论的一些问题有关。 如果图表的创建者将整个 y 轴一直包括到 0'0'',那么与女巨人拉脱维亚人相比,印度女性看起来就不会像小精灵了。 

当然,如果他们只是使用酒吧,问题也会消失。 它们很无聊,但也很有效。  

坏饼图

饼图是人类的敌人。 他们几乎在所有方面都很糟糕。 这不仅仅是作者所拥护的激情观点,这是客观的、科学的事实。

使饼图出错的方法比使它们正确的方法更多。 它们的应用范围极其狭窄,即使在这些应用中,它们是否是最有效的工作工具也是值得怀疑的。 

话虽如此,让我们谈谈最令人震惊的失误。

拥挤的图表

这个错误不是很常见,但是当它出现时非常烦人。 它还演示了 pi 图表的基本问题之一。

让我们看下面的例子,一个饼图显示了书面英语中字母频率的分布。 

 

 

看看这张图表,你认为你可以自信地说 I 比 R 更常见吗? 还是欧? 这忽略了一些切片太小,甚至无法在它们上面贴上标签。 

让我们将其与一个可爱、简单的条形图进行比较。 

 

 

诗歌!

您不仅可以立即看到每个字母与所有其他字母的关系,还可以准确直观地了解它们的频率,以及显示实际百分比的易于查看的轴。

之前的图表? 无法修复。 变量太多了。 

3D图表

饼图的另一个严重滥用是当人们以 3D 形式制作饼图时,通常会以不洁的角度倾斜它们。 

让我们来看一个例子。

 

 

乍一看,蓝色的“EUL-NGL”看起来与红色的“S&D”差不多,但事实并非如此。 如果我们在心理上纠正倾斜,则差异比看起来要大得多。

这种 3D 图形在没有可接受的情况下起作用,它的存在只是为了在相对比例上误导读者。 

扁平饼图看起来不错。 

糟糕的颜色选择

人们倾向于犯的最后一个错误是选择不考虑周到的配色方案。 与其他人相比,这是一个小问题,但它可以为人们带来很大的不同。 

考虑下面的图表。 

 

 

很有可能,这对你来说很好。 一切都清楚地标明,尺寸有足够大的差异,很容易看出销售额之间的比较。

但是,如果您患有色盲,这可能非常烦人。 

作为一般规则,红色和绿色永远不应该在同一个图表上使用,尤其是彼此相邻的图表。 

其他配色方案的错误应该对每个人都很明显,例如选择 6 种不同的浅色调或红色。

投资讯息

创建数据可视化的方法有很多很多,这些方法很糟糕,会阻碍人们理解数据的能力。 只要稍加考虑,所有这些都可以避免。

重要的是要考虑其他人将如何查看图表,即不熟悉数据的人。 您需要深入了解查看数据的目标是什么,以及如何在不误导人们的情况下最好地突出这些部分。