用糟糕的儀表板傳播錯誤信息

by 2022 年 8 月 17 日商業智能/分析0評論

你如何用糟糕的儀表板傳播錯誤信息

 

 

數字本身很難閱讀,甚至更難從中得出有意義的推論。 通常情況下,以各種圖形和圖表的形式將數據可視化是進行任何真實數據分析所必需的。 

但是,如果您花大量時間查看各種圖表,您會很久以前就意識到一件事——並非所有數據可視化都是平等的。

這將簡要介紹人們在創建圖表以快速且易於理解的方式表示數據時所犯的一些最常見錯誤。

糟糕的地圖

在開始時跟進 xkcd,看到數據以一種可怕且無用的方式放置在地圖上是很常​​見的。 漫畫中顯示的最大和最常見的罪犯之一。 

無趣的人口分佈

事實證明,如今人們往往住在城市裡。 

如果您觀察到的預期分佈與美國的總人口分佈不一致,您應該只費心展示地圖。

例如,如果您正在銷售冷凍玉米餅,並且發現您的銷售額中有一半以上來自西弗吉尼亞州的雜貨店,儘管它們在全國市場都有銷售,那將是非常了不起的。

顯示一張表明這一點的地圖,以及炸玉米餅流行的其他地方,可以提供有用的信息。 

同樣,如果您銷售的產品完全使用英語,您應該期望您的客戶分佈與全球英語使用者的分佈保持一致。 

不良粒度

另一種弄亂地圖的方法是選擇一種糟糕的方式將土地從地理上分成幾塊。 尋找正確的最小單位的問題在整個 BI 中很常見,可視化也不例外。

為了更清楚我在說什麼,讓我們看兩個具有兩種截然不同效果的相同晶粒尺寸的示例。

首先,讓我們看看某人製作了一張美國的地形圖,它通過沿定義的鍵為每個縣的最高海拔點塗上不同的顏色。 

 

 

雖然它對東海岸有點有效,但一旦你到達落基山脈的邊緣,它真的只是所有的噪音。

您無法很好地了解地理情況,因為(由於復雜的歷史原因)您向西走得越遠,縣的規模就會越大。 他們講述了一個故事,只是與地理無關。 

將此與按縣劃分的宗教信仰地圖進行對比。

 

 

儘管使用了完全相同的晶粒尺寸,但這張地圖是完全有效的。 我們能夠對美國的地區做出快速、準確和有意義的推斷,這些地區可能會被如何看待,居住在那裡的人們可能會如何看待自己和美國其他地區。

製作有效的地圖作為視覺輔助雖然很困難,但可能非常有用和說明問題。 請務必考慮一下您的地圖試圖傳達的內容。

糟糕的條形圖

條形圖通常比地圖上顯示的信息更常見。 它們易於閱讀,易於創建,並且通常非常時尚。

儘管它們很容易犯,但人們在嘗試重新發明輪子時可能會犯一些常見的錯誤。 

誤導性尺度

壞條形圖最常見的例子之一是當有人對左軸做了一些不愉快的事情時。 

這是一個特別隱蔽的問題,很難給出全面的指導。 為了讓這個問題更容易理解,讓我們討論一些例子。 

讓我們想像一家生產三種產品的公司; Alpha、Beta 和 Gamma 小部件。 高管想知道他們之間的銷售情況,BI 團隊為他們製作了一張圖表。 

 

 

乍一看,主管會覺得 Alpha 小部件的銷量遠遠超過競爭對手,而實際上,它們的銷量僅比 Gamma 小部件高出 20% 左右,而不是可視化中暗示的 500%。

這是一個非常明顯令人髮指的扭曲的例子——或者是嗎? 我們能想像這樣一種情況,這種完全相同的失真會比普通的 0 – 50,000 軸更有用嗎?

例如,讓我們想像同一家公司,但現在主管想知道一些不同的事情。

在這種情況下,每個小部件只有在銷售至少 45,000 件時才能盈利。 為了了解每個產品之間的比較以及與該樓層的關係,BI 團隊開始工作並提交以下可視化。 

 

 

T就絕對而言,它們都在彼此 20% 的窗口內,但它們與所有重要的 45,000 大關有多接近? 

看起來 Gamma 小部件有點不足,但 Beta 小部件是嗎? 甚至沒有標記 45,000 行。

在這種情況下,圍繞該關鍵軸放大圖表將提供大量信息。 

像這樣的案例使得提供一攬子建議變得非常困難。 最好謹慎行事。 在不計後果地拉伸和裁剪 y 軸之前,請仔細分析每種情況。 

噱頭酒吧

條形圖的一個不那麼可怕和簡單的誤用是當人們試圖讓他們的可視化變得太可愛時。 確實,香草條形圖可能有點無聊,因此人們會嘗試為它增添趣味是有道理的。

一個眾所周知的例子是臭名昭著的拉脫維亞巨人婦女案。

 

 

在某些方面,這與上一節中討論的一些問題有關。 如果圖表的創建者將整個 y 軸一直包括到 0'0'',那麼與女巨人拉脫維亞人相比,印度女性看起來就不會像小精靈了。 

當然,如果他們只是使用酒吧,問題也會消失。 它們很無聊,但也很有效。  

壞餅圖

餅圖是人類的敵人。 他們幾乎在所有方面都很糟糕。 這不僅僅是作者所擁護的激情觀點,這是客觀的、科學的事實。

使餅圖出錯的方法比使它們正確的方法更多。 它們的應用範圍極其狹窄,即使在這些應用中,它們是否是最有效的工作工具也是值得懷疑的。 

話雖如此,讓我們談談最令人震驚的失誤。

擁擠的圖表

這個錯誤不是很常見,但是當它出現時非常煩人。 它還演示了 pi 圖表的基本問題之一。

讓我們看下面的例子,一個餅圖顯示了書面英語中字母頻率的分佈。 

 

 

看看這張圖表,你認為你可以自信地說 I 比 R 更常見嗎? 還是歐? 這忽略了一些切片太小,甚至無法在它們上面貼上標籤。 

讓我們將其與一個可愛、簡單的條形圖進行比較。 

 

 

詩歌!

您不僅可以立即看到每個字母與所有其他字母的關係,還可以準確直觀地了解它們的頻率,以及顯示實際百分比的易於查看的軸。

之前的圖表? 無法修復。 變量太多了。 

3D圖表

餅圖的另一個嚴重濫用是當人們以 3D 形式製作餅圖時,通常會以不潔的角度傾斜它們。 

讓我們來看一個例子。

 

 

乍一看,藍色的“EUL-NGL”看起來與紅色的“S&D”差不多,但事實並非如此。 如果我們在心理上糾正傾斜,則差異比看起來要大得多。

這種 3D 圖形在沒有可接受的情況下起作用,它的存在只是為了在相對比例上誤導讀者。 

扁平餅圖看起來不錯。 

糟糕的顏色選擇

人們傾向於犯的最後一個錯誤是選擇不考慮周到的配色方案。 與其他人相比,這是一個小問題,但它可以為人們帶來很大的不同。 

考慮下面的圖表。 

 

 

很有可能,這對你來說很好。 一切都清楚地標明,尺寸有足夠大的差異,很容易看出銷售額之間的比較。

但是,如果您患有色盲,這可能非常煩人。 

作為一般規則,紅色和綠色永遠不應該在同一個圖表上使用,尤其是彼此相鄰的圖表。 

其他配色方案的錯誤應該對每個人都很明顯,例如選擇 6 種不同的淺色調或紅色。

投資訊息

創建數據可視化的方法有很多很多,這些方法很糟糕,會阻礙人們理解數據的能力。 只要稍加考慮,所有這些都可以避免。

重要的是要考慮其他人將如何查看圖表,即不熟悉數據的人。 您需要深入了解查看數據的目標是什麼,以及如何在不誤導人們的情況下最好地突出這些部分。