ひどいダッシュボードで誤った情報を広める方法
数値自体は読みにくく、意味のある推論を導き出すのはさらに困難です。 実際のデータ分析を行うには、さまざまなグラフィックスやチャートの形式でデータを視覚化することが必要になることがよくあります。
ただし、さまざまなグラフを見て時間を費やしたことがあれば、ずっと前に XNUMX つのことに気付くでしょう。すべてのデータ ビジュアライゼーションが同じように作成されているわけではありません。
これは、すばやく簡単に理解できる方法でデータを表すグラフを作成する際によくある間違いのいくつかを簡単にまとめたものです。
悪い地図
最初の xkcd をフォローアップすると、ひどく役に立たない方法でデータがマップに配置されるのがよく見られます。 最大かつ最も一般的な犯罪者の XNUMX つは、コミックに示されているものです。
面白くない人口分布
結局のところ、人々は最近都市に住む傾向があります。
観察した予想される分布が米国の総人口の分布と一致しない場合にのみ、マップを表示する必要があります。
たとえば、冷凍タコスを販売していて、売上の半分以上がウェストバージニア州の食料品店からのものであることがわかった場合、それは全国の市場に存在するにもかかわらず、非常に驚くべきことです.
これを示す地図と、タコスが人気のある他の場所を表示すると、有用な情報が得られる可能性があります。
同様に、完全に英語で製品を販売する場合、顧客の分布が世界中の英語話者の分布と一致することを期待する必要があります。
粒度が悪い
地図を台無しにするもう XNUMX つの方法は、土地を地理的にチャンクに分割する下手な方法を選択することです。 適切な最小単位を見つけるというこの問題は、BI 全体で共通の問題であり、ビジュアライゼーションも例外ではありません。
私が話していることをより明確にするために、XNUMX つの非常に異なる効果を持つ同じ粒子サイズの XNUMX つの例を見てみましょう。
まず、定義されたキーに沿って各郡の最高標高点を異なる色で陰影付けすることにより、誰かが米国の地形図を作成している様子を見てみましょう。
東海岸では多少効果的ですが、ロッキー山脈の端に到達すると、それは本当にすべてのノイズです.
(複雑な歴史的理由により) 郡の規模は西に行くほど大きくなる傾向があるため、地理の全体像はあまりよくわかりません。 彼らは物語を語りますが、地理に関連するものではありません。
これを、郡ごとの宗教関係の地図と比較してください。
このマップは、まったく同じ粒子サイズを使用しているにもかかわらず、非常に効果的です。 私たちは、米国の地域について、これらの地域がどのように認識されているか、そこに住む人々が自分自身や国の残りの部分についてどう思うかについて、迅速かつ正確で有意義な推論を行うことができます.
視覚補助として効果的なマップを作成することは困難ですが、非常に有用でわかりやすくなります。 マップが何を伝えようとしているのかをよく考えてください。
悪い棒グラフ
棒グラフは、通常、地図上に表示される情報よりも一般的です。 読みやすく、作成も簡単で、全体的にかなり洗練されています。
簡単にできますが、車輪の再発明を試みるときによくある間違いがいくつかあります。
誤解を招くスケール
不適切な棒グラフの最も一般的な例の XNUMX つは、誰かが左軸で不都合なことをした場合です。
これは特に厄介な問題であり、包括的なガイドラインを提供することは困難です。 この問題を理解しやすくするために、いくつかの例について説明します。
XNUMX つの製品を製造している会社を想像してみましょう。 アルファ、ベータ、およびガンマ ウィジェット。 経営幹部は、互いに比較してどれだけ売れているかを知りたいと考えており、BI チームは彼らのためにグラフを作成します。
一見すると、経営幹部は、Alpha ウィジェットが競合他社よりもはるかに売れているという印象を受けますが、実際には、視覚化で暗示されている 20% ではなく、Gamma ウィジェットよりも約 500% 売れているだけです。
これは非常に明らかに凶悪な歪みの例です – それともそうですか? これとまったく同じ歪みが、バニラの 0 ~ 50,000 軸よりも役立つ場合を想像できますか?
たとえば、同じ会社を想像してみましょう。ただし、エグゼクティブは別のことを知りたがっています。
この場合、各ウィジェットは、少なくとも 45,000 ユニットを販売した場合にのみ利益をもたらします。 各製品が相互に比較して、またこのフロアに関連してどの程度うまく機能しているかを調べるために、BI チームは次のビジュアライゼーションを提出します。
T絶対的にはすべて 20% の範囲内ですが、すべての重要な 45,000 マークにどれくらい近いのでしょうか?
ガンマ ウィジェットは少し不足しているように見えますが、ベータ ウィジェットですか? 45,000 行にはラベルさえありません。
この場合、その主要な軸の周りのグラフを拡大すると、非常に有益です。
このようなケースでは、包括的なアドバイスを提供することは非常に困難です。 注意を払うのが一番です。 無謀な放棄で y 軸を引き延ばしたり切り取ったりする前に、それぞれの状況を注意深く分析してください。
ギミックバー
棒グラフのあまり怖くない単純な誤用は、人々がビジュアライゼーションをかわいくしようとする場合です。 バニラの棒グラフが少し退屈であることは事実です。
よく知られている例は、ラトビアの巨大な女性の悪名高い事件です。
いくつかの点で、これは前のセクションで説明したいくつかの問題に関連しています。 グラフの作成者が y 軸全体を 0'0'' まで含めていた場合、インドの女性は巨人のラトビア人に比べて妖精のようには見えません。
もちろん、バーを使っていれば、問題も解決します。 退屈ですが、効果的でもあります。
悪い円グラフ
円グラフは人類の敵です。 彼らはほとんどすべての点でひどいです。 これは著者の熱烈な意見ではなく、客観的で科学的な事実です。
円グラフを正しく表示する方法よりも、間違って表示する方法の方が多くあります。 それらの用途は非常に狭く、その用途でさえ、その仕事にとって最も効果的なツールであるかどうかは疑問です.
そうは言っても、最もひどい失敗について話しましょう。
混雑したチャート
この間違いはあまり一般的ではありませんが、発生すると非常に厄介です。 また、円グラフの基本的な問題の XNUMX つも示しています。
次の例を見てみましょう。これは、英語で書かれた文字の頻度の分布を示す円グラフです。
このグラフを見て、私は R よりも一般的であると自信を持って言えますか? それともお? これは、一部のスライスが小さすぎてラベルに収まらないことを無視しています。
これを素敵でシンプルな棒グラフと比較してみましょう。
詩!
他のすべての文字との関係で各文字をすぐに確認できるだけでなく、それらの頻度について正確な直感が得られ、実際のパーセンテージを示す見やすい軸が得られます。
あの前のチャート? 修正不能。 単純に変数が多すぎます。
3Dチャート
円グラフのもう 3 つのひどい悪用は、人々が円グラフを XNUMXD で作成する場合で、多くの場合、円グラフを不潔な角度に傾けます。
例を見てみましょう。
一見、青い「EUL-NGL」と赤い「S&D」は同じくらいに見えますが、そうではありません。 傾きを精神的に修正すると、その差は見た目よりもはるかに大きくなります。
この種の 3D グラフが機能するという容認できる状況はありません。相対的なスケールに関して読者を誤解させるために存在するだけです。
フラットな円グラフは問題なく表示されます。
不適切な色の選択
人々が犯しがちな最後の間違いは、思いやりのない配色を選ぶことです。 これは他の点と比べると小さな点ですが、人々にとって大きな違いを生む可能性があります.
次の図を考えてみましょう。
おそらく、これはあなたにとって問題ないように見えます。 すべてが明確にラベル付けされており、サイズには十分な差異があるため、売上を互いに比較して簡単に確認できます.
ただし、色盲の場合、これは非常に煩わしい可能性があります。
原則として、赤と緑を同じグラフで使用しないでください。特に、互いに隣接して使用しないでください。
6 種類の微妙な色合いや赤を選択するなど、その他の配色の誤りは誰にとっても明らかなはずです。
まとめ
データの視覚化を作成する方法は他にもたくさんありますが、それらはひどいものであり、人々がデータをどれだけよく理解できるかを妨げています. それらはすべて、少しの注意で回避できます。
データに詳しくない他の人がグラフをどのように見るかを考慮することが重要です。 データを見る目的が何であるか、人々を誤解させずにそれらの部分を強調する最善の方法を深く理解する必要があります。