끔찍한 대시보드로 잘못된 정보 확산

by 17년 2022월 XNUMX일BI/분석0 코멘트

끔찍한 대시보드로 잘못된 정보를 퍼뜨리는 방법

 

 

숫자 자체는 읽기 어렵고 의미 있는 추론을 이끌어내기는 더욱 어렵습니다. 실제 데이터 분석을 하기 위해서는 다양한 그래픽과 차트의 형태로 데이터를 시각화해야 하는 경우가 많습니다. 

그러나 다양한 그래프를 살펴보는 데 시간을 할애했다면 모든 데이터 시각화가 동일하게 생성되지 않는다는 사실을 오래전에 깨달았을 것입니다.

이것은 데이터를 빠르고 쉽게 소화할 수 있는 방식으로 나타내기 위해 차트를 생성할 때 사람들이 저지르는 가장 일반적인 실수에 대한 간략한 요약입니다.

나쁜 지도

처음에 xkcd에 대한 후속 조치를 취하면 끔찍하고 쓸모없는 방식으로 데이터가 지도에 표시되는 것을 보는 것이 일반적입니다. 가장 크고 가장 흔한 범죄자 중 하나는 만화에 나오는 범죄자입니다. 

흥미롭지 않은 인구 분포

알다시피, 사람들은 요즘 도시에 사는 경향이 있습니다. 

관찰한 예상 분포가 미국의 전체 인구 분포와 일치하지 않는 경우에만 지도를 표시해야 합니다.

예를 들어, 냉동 타코를 판매할 때 판매의 절반 이상이 전국 시장에 있음에도 불구하고 웨스트 버지니아의 식료품점에서 나온다는 사실을 알게 된다면 이는 매우 놀라운 일일 것입니다.

이것을 나타내는 지도와 타코가 인기 있는 다른 곳을 표시하면 유용한 정보를 제공할 수 있습니다. 

비슷한 맥락에서 완전히 영어로 된 제품을 판매하는 경우 고객 분포가 전 세계적으로 영어 사용자의 분포와 일치할 것으로 예상해야 합니다. 

나쁜 입자 크기

지도를 엉망으로 만드는 또 다른 방법은 땅을 지리적으로 덩어리로 나누는 잘못된 방법을 선택하는 것입니다. 올바른 최소 단위를 찾는 문제는 BI 전체에서 공통적인 문제이며 시각화도 예외는 아닙니다.

내가 무슨 말을 하는지 더 명확하게 하기 위해 두 가지 매우 다른 효과를 갖는 동일한 입자 크기의 두 가지 예를 살펴보겠습니다.

먼저, 정의된 키를 따라 각 카운티의 최고 고도 지점을 다른 색상으로 음영 처리하여 미국의 지형도를 만드는 사람을 살펴보겠습니다. 

 

 

동해안에서는 다소 효과적이지만 일단 로키산맥의 가장자리에 부딪히면 정말 시끄럽습니다.

(복잡한 역사적 이유로) 카운티 크기는 서쪽으로 갈수록 커지는 경향이 있기 때문에 지리학에 대한 좋은 그림을 얻지 못합니다. 그들은 지리와 관련된 이야기가 아닌 이야기를 전합니다. 

이를 카운티별 종교 지도와 대조해 보십시오.

 

 

이 맵은 정확히 같은 입자 크기를 사용함에도 불구하고 완전히 효과적입니다. 우리는 미국의 지역, 이 지역이 어떻게 인식되는지, 그곳에 사는 사람들이 자신과 미국의 나머지 지역에 대해 어떻게 생각할지에 대해 빠르고 정확하며 의미 있는 추론을 할 수 있습니다.

시각적 보조 수단으로 효과적인 지도를 만드는 것은 어렵지만 매우 유용하고 설명할 수 있습니다. 당신의 지도가 무엇을 전달하려고 하는지에 대해 약간만 생각하십시오.

잘못된 막대 그래프

막대 그래프는 일반적으로 지도에 표시된 정보보다 더 일반적입니다. 그들은 읽기 쉽고, 만들기도 간단하고, 일반적으로 매우 매끄럽습니다.

만들기는 쉽지만 바퀴를 재발명하려고 시도하는 동안 사람들이 범할 수 있는 몇 가지 일반적인 실수가 있습니다. 

오해의 소지가 있는 저울

나쁜 막대 그래프의 가장 일반적인 예 중 하나는 누군가가 왼쪽 축에 대해 잘못된 행동을 하는 경우입니다. 

이것은 특히 교활한 문제이며 포괄적인 지침을 제공하기 어렵습니다. 이 문제를 좀 더 쉽게 소화할 수 있도록 몇 가지 예를 살펴보겠습니다. 

세 가지 제품을 만드는 회사를 상상해 봅시다. 알파, 베타 및 감마 위젯. 경영진은 서로 비교하여 얼마나 잘 판매되고 있는지 알고 싶어하고 BI 팀은 그래프를 작성합니다. 

 

 

얼핏 보기에 경영진은 Alpha Widget이 경쟁 제품보다 훨씬 더 많이 판매되고 있다는 인상을 받을 수 있습니다. 실제로는 시각화에 암시된 것처럼 20%가 아니라 약 500%만 Gamma 위젯이 판매되고 있다는 것입니다.

이것은 매우 명백히 극악무도한 왜곡의 한 예입니다. 아니면 그렇지 않습니까? 이 똑같은 왜곡이 기본 0 – 50,000 축보다 더 유용한 경우를 상상할 수 있습니까?

예를 들어, 경영진이 다른 것을 알고 싶어한다는 점을 제외하고는 같은 회사를 상상해 봅시다.

이 경우 각 위젯은 최소 45,000개 이상을 판매해야 수익을 냅니다. 각 제품이 이 층과 비교하여 얼마나 잘 작동하는지 알아보기 위해 BI 팀은 작업을 시작하고 다음 시각화를 제출합니다. 

 

 

T이봐 모두, 절대적으로, 서로의 20% 범위 내에 있지만, 모두 중요한 45,000 마크에 얼마나 가깝습니까? 

감마 위젯이 조금 부족한 것 같지만 베타 위젯인가요? 45,000 라인에는 레이블도 없습니다.

이 경우 해당 키 축을 중심으로 그래프를 확대하면 많은 정보를 얻을 수 있습니다. 

이와 같은 경우는 포괄적인 조언을 제공하는 것을 매우 어렵게 만듭니다. 각별한 주의를 기울이는 것이 좋습니다. 무모한 포기로 y축을 늘리고 자르기 전에 각 상황을 신중하게 분석하십시오. 

특수 효과 막대

막대 그래프의 훨씬 덜 무섭고 단순한 오용은 사람들이 시각화를 너무 귀엽게 만들려고 할 때입니다. 바닐라 막대 차트가 약간 지루할 수 있는 것이 사실이므로 사람들이 그것에 양념을 하려고 하는 것은 이치에 맞습니다.

잘 알려진 예는 거대한 라트비아 여성의 악명 높은 사례입니다.

 

 

어떤 면에서 이것은 이전 섹션에서 논의된 몇 가지 문제와 관련이 있습니다. 그래프의 작성자가 전체 y축을 0'0''까지 포함했다면 인도 여성은 라트비아 여성 거인에 비해 픽시처럼 보이지 않을 것입니다. 

물론 막대만 사용했다면 문제도 사라졌을 것입니다. 지루하지만 효과적이기도 합니다.  

잘못된 원형 차트

원형 차트는 인류의 적입니다. 그들은 거의 모든 면에서 끔찍합니다. 이것은 저자가 신봉하는 열정적인 견해 이상이며 객관적이고 과학적 사실입니다.

원형 차트를 옳게 만드는 방법보다 원형 차트를 틀리게 만드는 방법이 더 많습니다. 그것들은 매우 좁은 응용 프로그램을 가지고 있으며, 그 중에서도 작업에 가장 효과적인 도구인지 여부가 의심 스럽습니다. 

즉, 가장 심각한 실수에 대해 이야기합시다.

과밀한 차트

이 실수는 매우 일반적이지 않지만 발생하면 매우 짜증납니다. 또한 파이 차트의 근본적인 문제 중 하나를 보여줍니다.

다음 예를 살펴보겠습니다. 서면 영어의 문자 빈도 분포를 보여주는 파이 차트입니다. 

 

 

이 차트를 보면 내가 R보다 더 흔하다고 자신있게 말할 수 있다고 생각합니까? 아니면 오? 이것은 일부 슬라이스가 너무 작아서 레이블을 붙일 수 없다는 것을 무시합니다. 

이것을 아름답고 단순한 막대 차트와 비교해 보겠습니다. 

 

 

시!

각 문자를 다른 모든 문자와 관련하여 즉시 볼 수 있을 뿐만 아니라 주파수에 대한 정확한 직관과 실제 백분율을 표시하는 쉽게 볼 수 있는 축을 얻을 수 있습니다.

그 이전 차트? 고칠 수 없습니다. 변수가 너무 많습니다. 

3D 차트

파이 차트의 또 다른 심각한 남용은 사람들이 3D로 만들 때 종종 부정한 각도로 기울이는 것입니다. 

예를 봅시다.

 

 

파란색 "EUL-NGL"은 언뜻 보면 빨간색 "S&D"와 거의 같아 보이지만 그렇지 않습니다. 기울기를 정신적으로 수정하면 그 차이가 보이는 것보다 훨씬 더 큽니다.

이러한 종류의 3D 그래프가 작동하는 허용 가능한 상황은 없으며 상대적인 척도에 대해 독자를 오도하기 위해서만 존재합니다. 

플랫 파이 차트는 괜찮아 보입니다. 

불쌍한 색상 선택

사람들이 저지르는 경향이 있는 마지막 실수는 고려하지 않은 색 구성표를 선택하는 것입니다. 이것은 다른 것들에 비해 작은 점이지만 사람들에게는 큰 차이를 만들 수 있습니다. 

다음 차트를 고려하십시오. 

 

 

이것은 당신이 보기에 괜찮을 것입니다. 모든 것이 명확하게 표시되어 있고, 크기 차이가 충분히 커서 판매량을 서로 비교하기 쉽습니다.

그러나 색맹으로 고통받는 경우 이는 매우 성가신 일입니다. 

일반적으로 빨간색과 녹색은 특히 서로 인접한 동일한 그래프에서 사용해서는 안 됩니다. 

6가지 다른 약간의 음영이나 빨간색을 선택하는 것과 같은 다른 색 구성표 오류는 모든 사람에게 분명해야 합니다.

테이크 아웃

끔찍하고 사람들이 데이터를 얼마나 잘 이해할 수 있는지 방해하는 데이터 시각화를 만드는 방법은 훨씬 더 많습니다. 그들 모두는 약간의 사려 깊음으로 피할 수 있습니다.

데이터에 익숙하지 않은 다른 사람이 그래프를 어떻게 볼 것인지 고려하는 것이 중요합니다. 데이터를 보는 목적이 무엇인지, 사람들을 오도하지 않고 해당 부분을 가장 잘 강조할 수 있는 방법을 깊이 이해해야 합니다. 

 

BI/분석분류
Microsoft Excel이 최고의 분석 도구인 이유
Excel이 최고의 분석 도구인 이유는 무엇입니까?

Excel이 최고의 분석 도구인 이유는 무엇입니까?

  저렴하고 쉽습니다. Microsoft Excel 스프레드시트 소프트웨어는 아마도 비즈니스 사용자의 컴퓨터에 이미 설치되어 있을 것입니다. 그리고 오늘날 많은 사용자는 고등학교 때나 그 이전부터 Microsoft Office 소프트웨어에 노출되어 왔습니다. 이런 무책임한 반응은..

상세 보기

BI/분석분류
NY 스타일 vs. 시카고 스타일 피자: 맛있는 논쟁

NY 스타일 vs. 시카고 스타일 피자: 맛있는 논쟁

우리의 갈망을 만족시킬 때 따끈따끈한 피자 한 조각의 즐거움에 필적할 수 있는 것은 거의 없습니다. 뉴욕 스타일 피자와 시카고 스타일 피자에 대한 논쟁은 수십 년 동안 열정적인 토론을 불러일으켰습니다. 각 스타일에는 고유한 특성이 있으며 열성적인 팬이 있습니다....

상세 보기

BI/분석코그노스 애널리틱스
코그노스 쿼리 스튜디오
사용자는 Query Studio를 원합니다

사용자는 Query Studio를 원합니다

IBM Cognos Analytics 12의 출시와 함께 오랫동안 발표되었던 Query Studio 및 Analysis Studio의 지원 중단이 마침내 해당 스튜디오를 제외한 Cognos Analytics 버전과 함께 제공되었습니다. 이는 해당 분야에 종사하는 대부분의 사람들에게 놀라운 일이 아니지만...

상세 보기

BI/분석분류
테일러 스위프트 효과는 진짜인가?

테일러 스위프트 효과는 진짜인가?

일부 비평가들은 그녀가 슈퍼볼 티켓 가격을 올리고 있다고 주장합니다. 이번 주말 슈퍼볼은 텔레비전 역사상 가장 많이 시청된 3대 이벤트 중 하나가 될 것으로 예상됩니다. 아마도 작년의 기록적인 숫자보다 더 많고 아마도 1969년의 달보다 더 많을 것입니다...

상세 보기