הפצת מידע מוטעה עם לוחות מחוונים נוראיים

by אוגוסט 17, 2022BI/אנליטיקההערות 0

איך אתה מפיץ מידע שגוי עם לוחות מחוונים נוראיים

 

 

מספרים כשלעצמם קשה לקריאה, ועוד יותר קשה להסיק מהם מסקנות משמעותיות. לעתים קרובות יש צורך להמחיש את הנתונים בצורות של גרפיקה ותרשימים שונים כדי לבצע כל ניתוח נתונים אמיתי. 

עם זאת, אם השקעת זמן כלשהו בהסתכלות על גרפים שונים, תבין דבר אחד מזמן - לא כל הדמיות הנתונים נוצרות שווה.

זה יהיה סקירה מהירה של כמה מהטעויות הנפוצות ביותר שאנשים עושים בעת יצירת תרשימים כדי לייצג את הנתונים בצורה מהירה וקל לעיכול.

מפות גרועות

בהמשך ל-xkcd בהתחלה, זה באמת נפוץ לראות נתונים על מפה בצורה נוראית וחסרת תועלת. אחד העבריינים הגדולים והנפוצים ביותר הוא זה שמוצג בקומיקס. 

התפלגויות אוכלוסיות לא מעניינות

כפי שמתברר, אנשים נוטים לגור בערים בימינו. 

אתה צריך לטרוח להציג מפה רק אם ההתפלגות הצפויה שאתה צופה אינה תואמת את התפלגות האוכלוסייה הכוללת בארה"ב.

למשל, אם היית מוכר טאקו קפוא ומגלה שלמעלה ממחצית מהמכירות שלך מגיעות מחנויות מכולת במערב וירג'יניה למרות נוכחותן בשווקים ברחבי הארץ, זה יהיה די מדהים.

הצגת מפה המציינת זאת, כמו גם היכן עוד הטאקו פופולריים, יכולה לספק מידע שימושי. 

ברוח דומה, אם אתה מוכר מוצר שכולו באנגלית, אתה צריך לצפות שתפוצת הלקוחות שלך תתיישר עם ההפצה של דוברי אנגלית ברחבי העולם. 

גודל גרגר רע

דרך נוספת לבלבל מפה היא על ידי בחירה בדרך גרועה לפרק את הארץ גיאוגרפית לנתחים. סוגיה זו של מציאת היחידה הקטנה ביותר המתאימה היא בעיה שכיחה בכל BI, והדמיות אינן יוצאות דופן.

כדי להבהיר יותר על מה אני מדבר, בואו נסתכל על שתי דוגמאות של אותו גודל גרגר בעל שתי השפעות שונות מאוד.

ראשית, בואו נסתכל על מישהו שמכין מפה טופוגרפית של ארצות הברית על ידי הצללה של נקודת הגובה הגבוהה ביותר בכל מחוז בצבע שונה לאורך מפתח מוגדר. 

 

 

אמנם זה קצת יעיל עבור החוף המזרחי, אבל ברגע שאתה מגיע לקצה הרי הרוקי, זה באמת רק רעש.

אתה לא מקבל תמונה טובה מאוד של הגיאוגרפיה כי (מסיבות היסטוריות מסובכות) גדלי המחוז נוטים להיות גדולים יותר ככל שמתקדמים מערבה. הם מספרים סיפור, רק לא כזה שרלוונטי לגיאוגרפיה. 

הפוך זאת למפה של השתייכות דתית לפי מחוז.

 

 

המפה הזו יעילה לחלוטין, למרות השימוש באותו גודל גרגר בדיוק. אנו מסוגלים להסיק מסקנות מהירות, מדויקות ומשמעותיות לגבי אזורים של ארצות הברית, איך אזורים אלה עשויים להיתפס, מה האנשים שחיים שם עשויים לחשוב על עצמם ועל שאר המדינה.

יצירת מפה יעילה ככלי עזר חזותי, אמנם קשה, אך יכולה להיות מאוד שימושית ומבהירה. רק הקפד להשקיע מחשבה במה המפה שלך מנסה לתקשר.

גרפים גרועים

תרשימי עמודות הם בדרך כלל נפוצים יותר ממידע המוצג על מפה. הם פשוטים לקריאה, פשוטים ליצירה ובדרך כלל די מלוטשים.

למרות שקל לעשות אותם, יש כמה טעויות נפוצות שאנשים יכולים לעשות בזמן שהם מנסים להמציא את הגלגל מחדש. 

מאזניים מטעים

אחת הדוגמאות הנפוצות ביותר של גרפי עמודות גרועים היא כאשר מישהו עושה משהו לא נעים עם הציר השמאלי. 

זו בעיה ערמומית במיוחד, וקשה לתת הנחיות כלליות. כדי להפוך את הבעיה הזו לקצת יותר קלה לעיכול, בואו נדון בכמה דוגמאות. 

בואו נדמיין חברה שמייצרת שלושה מוצרים; ווידג'טים של אלפא, בטא וגמא. המנהל רוצה לדעת עד כמה הם מוכרים אחד לשני, וצוות ה-BI מכין להם גרף. 

 

 

במבט חטוף, המנהל יקבל את הרושם ש-Alpha Widgets עולים בהרבה על המתחרים, כאשר במציאות, הם מוכרים יותר על Widgets Gamma בכ-20% - לא ב-500% כפי שמשתמע מהדמייה.

זו דוגמה לעיוות מתועב מאוד ברור - או שזה נכון? האם נוכל לדמיין מקרה שבו אותו עיוות בדיוק יהיה שימושי יותר מאשר ציר וניל 0 - 50,000?

לדוגמה, בואו נדמיין את אותה חברה אלא שעכשיו המנהל רוצה לדעת משהו אחר.

במקרה זה, כל יישומון מרוויח רק אם הוא מוכר לפחות 45,000 יחידות. כדי לגלות עד כמה כל מוצר מצליח זה לזה וביחס לקומה זו, צוות ה-BI מתחיל לעבוד ומגיש את ההדמיה הבאה. 

 

 

Tהיי כולם, במונחים מוחלטים, בטווח של 20% אחד מהשני, אבל עד כמה הם קרובים לרף הכל חשוב של 45,000? 

זה נראה כאילו ווידג'טים של Gamma קצת נופלים, אבל האם ווידג'טים בטא? קו 45,000 אפילו לא מסומן.

הגדלה של הגרף סביב ציר מפתח זה, במקרה זה, תהיה אינפורמטיבית ביותר. 

מקרים כאלה מקשים מאוד על מתן עצות כלליות. עדיף לנקוט משנה זהירות. נתחו בקפידה כל מצב לפני למתוח ולחתוך את ציר ה-Y בנטישה פזיזה. 

גימיק ברים

שימוש לרעה ופשוט הרבה פחות בגרפי עמודות הוא כאשר אנשים מנסים להיות חמודים מדי עם ההדמיות שלהם. נכון שתרשים עמודות וניל יכול להיות קצת משעמם, אז הגיוני שאנשים ינסו לתבל אותו.

דוגמה ידועה היא המקרה הידוע לשמצה של הנשים הלטביות הענקיות.

 

 

במובנים מסוימים, זה רלוונטי לכמה נושאים שנדונו בסעיף הקודם. אם יוצר הגרף היה כולל את כל ציר ה-y עד 0'0'', אז הנשים ההודיות לא היו נראות כמו פיקסיות בהשוואה ללטביות הענקיות. 

כמובן שאם הם רק היו משתמשים בסורגים, גם הבעיה הייתה נעלמת. הם משעממים, אבל הם גם יעילים.  

תרשימי עוגה גרועים

תרשימי עוגה הם האויב של האנושות. הם נוראיים כמעט מכל הבחינות. זוהי יותר מאשר דעה נלהבת בה דוגל המחבר, זוהי עובדה אובייקטיבית ומדעית.

יש יותר דרכים לטעות בתרשימים של עוגה מאשר לתקן אותם. יש להם יישומים צרים ביותר, וגם באלה, יש ספק אם הם הכלי היעיל ביותר לתפקיד. 

עם זאת, בואו נדבר רק על הטעויות החמורות ביותר.

תרשימים צפופים

טעות זו אינה נפוצה במיוחד, אבל היא מעצבנת מאוד כשהיא מופיעה. זה גם מדגים את אחת הבעיות הבסיסיות עם תרשימי פי.

הבה נסתכל על הדוגמה הבאה, תרשים עוגה המציג את התפלגות תדירות האותיות באנגלית כתובה. 

 

 

כשאתה מסתכל על התרשים הזה, אתה חושב שאתה יכול לומר בביטחון שאני נפוץ יותר מ-R? או O? זוהי התעלמות מכך שחלק מהפרוסות קטנות מכדי להתאים עליהן תווית. 

בואו נשווה את זה לתרשים עמודות מקסים ופשוט. 

 

 

שִׁירָה!

לא רק שאתה יכול לראות מיד כל אות ביחס לכל האחרות, אלא שאתה מקבל אינטואיציה מדויקת לגבי התדרים שלהן, וציר הנראה בקלות המציג את האחוזים בפועל.

התרשים הקודם הזה? לא ניתן לתיקון. פשוט יש יותר מדי משתנים. 

תרשימי 3D

ניצול חריף נוסף של תרשימי עוגה הוא כאשר אנשים יוצרים אותם בתלת מימד, ולעתים קרובות מטים אותם בזוויות לא קדושות. 

בואו נסתכל על דוגמא.

 

 

במבט חטוף, "EUL-NGL" הכחול נראה בערך כמו "S&D" האדום, אבל זה לא המקרה. אם נתקן מנטלית את ההטיה, ההבדל הרבה הרבה יותר גדול ממה שזה נראה.

אין מצב מקובל שבו סוג זה של גרף תלת מימדי יתפקד, הוא קיים רק כדי להטעות את הקורא באשר לסולמות היחסיים. 

תרשימי עוגה שטוחים נראים בסדר גמור. 

בחירות צבע גרועות

הטעות האחרונה שאנשים נוטים לעשות היא לבחור ערכות צבעים לא מתחשבות. זו נקודה קטנה בהשוואה לאחרים, אבל היא יכולה לעשות הבדל גדול עבור אנשים. 

שקול את התרשים הבא. 

 

 

רוב הסיכויים שזה נראה לך בסדר גמור. הכל מסומן בבירור, למידות יש פערים גדולים מספיק כדי שקל לראות איך המכירות בהשוואה זו לזו.

עם זאת, אם אתם סובלים מעיוורון צבעים, סביר להניח שזה מאוד מעצבן. 

ככלל, אין להשתמש באדום וירוק באותו גרף, במיוחד בצמוד זה לזה. 

שגיאות ערכת צבעים אחרות צריכות להיות ברורות לכולם, כמו בחירת 6 גוונים קלים שונים או אדום.

Takeaways

יש עוד הרבה הרבה דרכים ליצור הדמיות נתונים נוראיות ומפריעות ליכולת של אנשים להבין נתונים. ניתן להימנע מכולם עם מעט התחשבות.

חשוב לשקול כיצד מישהו אחר יראה את הגרף, מישהו שלא מכיר מקרוב את הנתונים. אתה צריך להבין לעומק מה המטרה של הסתכלות על הנתונים, וכיצד הכי טוב להדגיש את החלקים האלה מבלי להטעות אנשים. 

 

BI/אנליטיקהUncategorized
מדוע Microsoft Excel הוא כלי הניתוח מספר 1
מדוע Excel הוא כלי הניתוח מספר 1?

מדוע Excel הוא כלי הניתוח מספר 1?

  זה זול וקל. תוכנת הגיליון האלקטרוני של Microsoft Excel כבר מותקנת כנראה במחשב של המשתמש העסקי. ומשתמשים רבים היום נחשפו לתוכנת Microsoft Office מאז התיכון או אפילו קודם לכן. התגובה המטומטמת הזו לגבי...

למידע נוסף

BI/אנליטיקהUncategorized
שחרר את התובנות שלך: מדריך לניקוי אביב באנליטיקס

שחרר את התובנות שלך: מדריך לניקוי אביב באנליטיקס

פירוק את התובנות שלך מדריך לניקוי אביב באנליטיקס השנה החדשה מתחילה ברעש גדול; דוחות סוף שנה נוצרים ונבדקים, ואז כולם מתייצבים בלוח זמנים עבודה עקבי. ככל שהימים מתארכים והעצים והפרחים פורחים,...

למידע נוסף

BI/אנליטיקהUncategorized
ניו יורק סטייל נגד שיקגו סטייל פיצה: ויכוח טעים

ניו יורק סטייל נגד שיקגו סטייל פיצה: ויכוח טעים

כשאנחנו מספקים את התשוקה שלנו, כמה דברים יכולים להתחרות בשמחה של פרוסת פיצה לוהטת. הוויכוח בין פיצה בסגנון ניו יורק לשיקגו עורר דיונים נלהבים במשך עשרות שנים. לכל סגנון מאפיינים ייחודיים משלו ומעריצים אדוקים....

למידע נוסף

BI/אנליטיקהCognos Analytics
Cognos Query Studio
המשתמשים שלך רוצים את סטודיו השאילתות שלהם

המשתמשים שלך רוצים את סטודיו השאילתות שלהם

עם שחרורו של IBM Cognos Analytics 12, הוצאה משימוש ממושכת של Query Studio ו-Analysis Studio סופק לבסוף עם גרסה של Cognos Analytics פחות האולפנים האלה. אמנם זה לא אמור להפתיע את רוב האנשים העוסקים ב...

למידע נוסף

BI/אנליטיקהUncategorized
האם אפקט טיילור סוויפט אמיתי?

האם אפקט טיילור סוויפט אמיתי?

כמה מבקרים טוענים שהיא מעלה את מחירי כרטיסי הסופרבול בסוף השבוע הזה הסופרבול צפוי להיות אחד משלושת האירועים הנצפים ביותר בתולדות הטלוויזיה. כנראה יותר ממספרי השיא של השנה שעברה ואולי אפילו יותר מהירח של 3...

למידע נוסף

BI/אנליטיקה
קטלוגים של אנליטיקה - כוכב עולה במערכת האקולוגית של אנליטיקה

קטלוגים של אנליטיקה - כוכב עולה במערכת האקולוגית של אנליטיקה

הקדמה כמנהל טכנולוגיה ראשי (CTO), אני תמיד מחפש טכנולוגיות מתפתחות שמשנות את הדרך בה אנו ניגשים לניתוח. טכנולוגיה אחת כזו שמשכה את תשומת לבי במהלך השנים האחרונות ובעלת הבטחה עצומה היא ה-Analytics...

למידע נוסף