Truyền bá thông tin sai lệch với trang tổng quan khủng khiếp

by Tháng Tám 17, 2022BI / Analytics0 comments

Cách bạn lan truyền thông tin sai lệch với các trang tổng quan khủng khiếp

 

 

Bản thân những con số đã khó đọc, và càng khó rút ra những suy luận có ý nghĩa từ đó. Thông thường, việc hiển thị dữ liệu dưới các dạng đồ họa và biểu đồ khác nhau là cần thiết để thực hiện bất kỳ phân tích dữ liệu thực nào. 

Tuy nhiên, nếu bạn đã dành bất kỳ khoảng thời gian nào để xem các biểu đồ khác nhau, bạn sẽ nhận ra một điều từ lâu - không phải tất cả các hình ảnh hóa dữ liệu đều được tạo ra như nhau.

Đây sẽ là tóm tắt nhanh một số sai lầm phổ biến nhất mà mọi người thường mắc phải khi tạo biểu đồ để biểu diễn dữ liệu một cách nhanh chóng và dễ hiểu.

Bản đồ xấu

Theo dõi xkcd lúc đầu, thực sự thường thấy dữ liệu được đưa lên bản đồ theo cách khủng khiếp và vô dụng. Một trong những kẻ phạm tội lớn nhất và phổ biến nhất là kẻ đã xuất hiện trong truyện tranh. 

Phân bố dân số không hợp lý

Hóa ra, ngày nay mọi người có xu hướng sống ở các thành phố. 

Bạn chỉ nên quan tâm đến việc hiển thị bản đồ nếu sự phân bố dự kiến ​​mà bạn quan sát được không phù hợp với sự phân bố của tổng dân số ở Hoa Kỳ.

Ví dụ: nếu bạn đang bán bánh tét đông lạnh và phát hiện ra rằng hơn một nửa doanh số của bạn đến từ các cửa hàng tạp hóa ở Tây Virginia mặc dù họ có mặt ở các thị trường trên toàn quốc, thì điều đó sẽ khá đáng chú ý.

Hiển thị một bản đồ chỉ ra điều này, cũng như những nơi khác mà bánh tét phổ biến, có thể cung cấp thông tin hữu ích. 

Tương tự như vậy, nếu bạn bán một sản phẩm hoàn toàn bằng tiếng Anh, bạn nên mong đợi việc phân phối khách hàng của mình phù hợp với phân phối của những người nói tiếng Anh trên toàn thế giới. 

Kích thước hạt xấu

Một cách khác để làm lộn xộn bản đồ là chọn một cách tồi để chia vùng đất về mặt địa lý thành nhiều phần. Vấn đề tìm đúng đơn vị nhỏ nhất này là một vấn đề phổ biến trong BI, và hình ảnh hóa không phải là một ngoại lệ.

Để làm rõ hơn những gì tôi đang nói, hãy xem hai ví dụ về cùng một kích thước hạt nhưng có hai hiệu ứng rất khác nhau.

Đầu tiên, hãy xem ai đó tạo bản đồ địa hình của Hoa Kỳ bằng cách tô màu điểm có độ cao cao nhất ở mỗi quận bằng một màu khác nhau dọc theo một khóa xác định. 

 

 

Mặc dù nó có phần hiệu quả đối với bờ biển phía đông, nhưng một khi bạn chạm vào rìa của Rockies, nó thực sự chỉ là tiếng ồn.

Bạn không có được một bức tranh địa lý rõ ràng vì (vì lý do lịch sử phức tạp) kích thước các quận có xu hướng lớn hơn khi bạn đi xa hơn về phía tây. Họ kể một câu chuyện, chỉ là một câu chuyện không liên quan đến địa lý. 

Đối chiếu điều này với bản đồ liên kết tôn giáo theo quận.

 

 

Bản đồ này hoàn toàn hiệu quả, mặc dù sử dụng cùng một kích thước hạt. Chúng tôi có thể đưa ra những suy luận nhanh chóng, chính xác và có ý nghĩa về các vùng của Hoa Kỳ, cách các vùng này có thể được nhìn nhận, những người sống ở đó có thể nghĩ gì về bản thân và phần còn lại của đất nước.

Việc tạo một bản đồ hiệu quả như một phương tiện hỗ trợ trực quan, tuy khó nhưng có thể rất hữu ích và làm sáng tỏ. Chỉ cần đảm bảo suy nghĩ về những gì bản đồ của bạn đang cố gắng truyền đạt.

Đồ thị thanh xấu

Biểu đồ thanh thường phổ biến hơn thông tin được trình bày trên bản đồ. Chúng dễ đọc, dễ tạo và nhìn chung khá đẹp.

Mặc dù chúng dễ thực hiện, nhưng có một số sai lầm phổ biến mà mọi người có thể mắc phải khi cố gắng phát minh lại bánh xe. 

Cân gây hiểu lầm

Một trong những ví dụ phổ biến nhất về biểu đồ thanh xấu là khi ai đó làm điều gì đó không đúng với trục bên trái. 

Đây là một vấn đề đặc biệt ngấm ngầm và rất khó để đưa ra các hướng dẫn chung. Để làm cho vấn đề này dễ hiểu hơn một chút, chúng ta hãy thảo luận một số ví dụ. 

Hãy tưởng tượng một công ty sản xuất ba sản phẩm; Tiện ích con Alpha, Beta và Gamma. Giám đốc điều hành muốn biết họ đang bán tốt như thế nào so với nhau và nhóm BI lập biểu đồ cho họ. 

 

 

Thoạt nhìn, giám đốc điều hành sẽ có ấn tượng rằng Alpha Widget đang vượt xa đối thủ, trong khi trên thực tế, chúng bán chạy hơn Gamma widget chỉ khoảng 20% ​​- không phải 500% như được ngụ ý trong hình dung.

Đây là một ví dụ về sự biến dạng rất rõ ràng - hay là nó? Chúng ta có thể tưởng tượng một trường hợp mà sự biến dạng chính xác này sẽ hữu ích hơn một trục vani 0 - 50,000 không?

Ví dụ, hãy tưởng tượng cùng một công ty ngoại trừ bây giờ giám đốc điều hành muốn biết điều gì đó khác biệt.

Trong trường hợp này, mỗi phụ tùng chỉ thu được lợi nhuận nếu họ bán được ít nhất 45,000 đơn vị. Để tìm hiểu xem mỗi sản phẩm đang hoạt động tốt như thế nào so với nhau và liên quan đến tầng này, nhóm BI bắt đầu làm việc và gửi hình ảnh trực quan sau đây. 

 

 

TNày, xét về mặt tuyệt đối, tất cả đều nằm trong khoảng cách nhau 20%, nhưng chúng gần với mốc 45,000 quan trọng đến mức nào? 

Có vẻ như các tiện ích Gamma đang giảm một chút, nhưng có phải là các tiện ích Beta không? Dòng 45,000 thậm chí không được dán nhãn.

Trong trường hợp này, việc phóng đại biểu đồ xung quanh trục chính đó sẽ mang lại nhiều thông tin. 

Những trường hợp như thế này khiến việc đưa ra lời khuyên chăn gối rất khó khăn. Tốt nhất bạn nên thận trọng. Phân tích cẩn thận từng tình huống trước khi kéo dài và cắt trục y một cách liều lĩnh. 

thanh mánh lới quảng cáo

Một cách sử dụng sai biểu đồ thanh ít đáng sợ và đơn giản hơn nhiều là khi mọi người cố gắng trở nên quá dễ thương với hình dung của họ. Đúng là một biểu đồ thanh vani có thể hơi nhàm chán, vì vậy sẽ có lý khi mọi người cố gắng thêm gia vị cho nó.

Một ví dụ nổi tiếng là trường hợp khét tiếng của những phụ nữ Latvia khổng lồ.

 

 

Theo một số cách, điều này có liên quan đến một số vấn đề đã thảo luận trong phần trước. Nếu người tạo ra biểu đồ đã bao gồm toàn bộ trục y đến 0'0 '', thì phụ nữ Ấn Độ trông sẽ không giống như những nàng tiên nữ so với những người Latvia không có người khổng lồ. 

Tất nhiên, nếu họ chỉ sử dụng các thanh, vấn đề cũng sẽ biến mất. Chúng nhàm chán, nhưng chúng cũng hiệu quả.  

Biểu đồ hình tròn xấu

Biểu đồ hình tròn là kẻ thù của loài người. Chúng khủng khiếp về mọi mặt. Đây không chỉ là một ý kiến ​​nhiệt tình được tác giả tán thành, đây là sự thật khoa học, khách quan.

Có nhiều cách để làm sai biểu đồ hình tròn hơn là làm cho chúng đúng. Chúng có các ứng dụng cực kỳ hẹp, và ngay cả trong những ứng dụng đó, vẫn còn vấn đề liệu chúng có phải là công cụ hiệu quả nhất cho công việc hay không. 

Điều đó đang được nói, chúng ta hãy chỉ nói về những sai lầm nghiêm trọng nhất.

Biểu đồ quá đông

Sai lầm này không phải là cực kỳ phổ biến, nhưng nó lại cực kỳ khó chịu khi mắc phải. Nó cũng thể hiện một trong những vấn đề cơ bản với biểu đồ pi.

Hãy xem ví dụ sau, một biểu đồ hình tròn cho thấy sự phân bố tần suất chữ cái trong tiếng Anh viết. 

 

 

Nhìn vào biểu đồ này, bạn có nghĩ rằng bạn có thể tự tin nói rằng tôi phổ biến hơn R không? Hay O? Điều này đang bỏ qua rằng một số lát quá nhỏ thậm chí không thể vừa nhãn trên chúng. 

Hãy so sánh điều này với một biểu đồ thanh đơn giản, đáng yêu. 

 

 

Thơ!

Bạn không chỉ có thể nhìn thấy ngay từng chữ cái liên quan đến tất cả các chữ cái khác, mà còn có được trực giác chính xác về tần số của chúng và một trục dễ nhìn thấy hiển thị tỷ lệ phần trăm thực tế.

Biểu đồ trước đó? Không thể sửa chữa. Đơn giản là có quá nhiều biến. 

3D Biểu đồ

Một sự lạm dụng nghiêm trọng khác đối với biểu đồ hình tròn là khi mọi người tạo chúng ở dạng 3D, đôi khi nghiêng chúng ở những góc xấu. 

Hãy xem xét ví dụ sau.

 

 

Nhìn thoáng qua, chữ “EUL-NGL” màu xanh trông giống với chữ “S&D” màu đỏ, nhưng không phải vậy. Nếu chúng ta tinh thần chính xác cho độ nghiêng, sự khác biệt lớn hơn nhiều so với tưởng tượng.

Không có tình huống chấp nhận được khi loại đồ thị 3D này sẽ hoạt động, nó chỉ tồn tại để đánh lừa người đọc về tỷ lệ tương đối. 

Biểu đồ hình tròn phẳng trông rất ổn. 

Lựa chọn màu sắc kém

Sai lầm cuối cùng mà mọi người thường mắc phải là chọn các cách phối màu thiếu cân nhắc. Đây là một điểm nhỏ so với những điểm khác, nhưng nó có thể tạo ra sự khác biệt lớn cho mọi người. 

Hãy xem xét biểu đồ sau. 

 

 

Rất có thể, điều này có vẻ ổn đối với bạn. Mọi thứ đều được dán nhãn rõ ràng, kích thước có sự chênh lệch đủ lớn để dễ dàng nhận thấy doanh số bán hàng so với nhau như thế nào.

Tuy nhiên, nếu bạn bị mù màu, điều này có thể rất khó chịu. 

Theo nguyên tắc chung, màu đỏ và xanh lá cây không bao giờ được sử dụng trên cùng một biểu đồ, đặc biệt là liền kề với nhau. 

Tất cả mọi người đều có thể thấy rõ các lỗi phối màu khác, chẳng hạn như chọn 6 sắc độ đậm nhạt khác nhau hoặc màu đỏ.

Takeaways

Có rất nhiều cách khác nữa để tạo ra các trực quan hóa dữ liệu rất khủng khiếp và cản trở mọi người có thể hiểu dữ liệu tốt như thế nào. Tất cả chúng đều có thể tránh được với một chút tinh ý.

Điều quan trọng là phải xem xét cách người khác xem biểu đồ, ai đó không quen thuộc với dữ liệu. Bạn cần phải hiểu sâu sắc về mục tiêu của việc xem dữ liệu là gì và cách tốt nhất để làm nổi bật những phần đó mà không gây hiểu lầm cho mọi người. 

 

BI / AnalyticsUncategorized
NY Style và Chicago Style Pizza: Một cuộc tranh luận thú vị

NY Style và Chicago Style Pizza: Một cuộc tranh luận thú vị

Khi thỏa mãn cơn thèm của chúng ta, hiếm có thứ gì có thể sánh bằng niềm vui của một miếng bánh pizza nóng hổi. Cuộc tranh luận giữa pizza kiểu New York và pizza kiểu Chicago đã làm dấy lên những cuộc thảo luận sôi nổi trong nhiều thập kỷ. Mỗi phong cách đều có những đặc điểm riêng và được người hâm mộ cuồng nhiệt....

Tìm hiểu thêm

BI / AnalyticsPhân tích Cognos
Studio truy vấn Cognos
Người dùng của bạn muốn Studio truy vấn của họ

Người dùng của bạn muốn Studio truy vấn của họ

Với việc phát hành IBM Cognos Analytics 12, việc ngừng sử dụng Query Studio và Analysis Studio đã được thông báo từ lâu cuối cùng đã được cung cấp cùng với một phiên bản Cognos Analytics trừ đi các studio đó. Mặc dù điều này không gây ngạc nhiên cho hầu hết những người tham gia vào...

Tìm hiểu thêm

BI / AnalyticsUncategorized
Hiệu ứng Taylor Swift có thật không?

Hiệu ứng Taylor Swift có thật không?

Một số nhà phê bình cho rằng cô đang đẩy giá vé Super Bowl lên cao. Super Bowl cuối tuần này được dự đoán sẽ là một trong 3 sự kiện được xem nhiều nhất trong lịch sử truyền hình. Có lẽ nhiều hơn những con số lập kỷ lục của năm ngoái và thậm chí có thể nhiều hơn cả mặt trăng năm 1969...

Tìm hiểu thêm

BI / Analytics
Danh mục Analytics – Ngôi sao mới nổi trong Hệ sinh thái Analytics

Danh mục Analytics – Ngôi sao mới nổi trong Hệ sinh thái Analytics

Giới thiệu Với tư cách là Giám đốc Công nghệ (CTO), tôi luôn tìm kiếm các công nghệ mới nổi có thể thay đổi cách chúng ta tiếp cận phân tích. Một công nghệ như vậy đã thu hút sự chú ý của tôi trong vài năm qua và có nhiều hứa hẹn là Phân tích...

Tìm hiểu thêm

BI / Analytics
Gần đây bạn có bộc lộ bản thân không?

Gần đây bạn có bộc lộ bản thân không?

  Chúng ta đang nói về bảo mật trên đám mây Khi bị lộ Hãy nói theo cách này, bạn lo lắng gì về việc bị lộ? Tài sản quý giá nhất của bạn là gì? Số An Sinh Xã Hội của bạn? Thông tin tài khoản ngân hàng của bạn? Tài liệu riêng tư, hoặc hình ảnh? Tiền điện tử của bạn...

Tìm hiểu thêm

BI / Analytics
Tầm quan trọng của KPI và cách sử dụng chúng hiệu quả

Tầm quan trọng của KPI và cách sử dụng chúng hiệu quả

Tầm quan trọng của KPI Và khi tầm thường thì tốt hơn là hoàn hảo Một cách dẫn đến thất bại là khăng khăng đòi hỏi sự hoàn hảo. Sự hoàn hảo là không thể và là kẻ thù của điều tốt. Người phát minh ra radar cảnh báo sớm cuộc không kích đã đề xuất một "sự sùng bái những điều không hoàn hảo". Triết lý của ông là...

Tìm hiểu thêm