نحوه انتشار اطلاعات نادرست با داشبوردهای وحشتناک
اعداد به خودی خود به سختی قابل خواندن هستند، و حتی سخت تر از آن می توان استنتاج معناداری را از آنها گرفت. اغلب این مورد پیش میآید که تجسم دادهها در قالبهای گرافیکی و نمودارهای مختلف برای انجام هر تحلیل واقعی داده ضروری است.
با این حال، اگر زمان زیادی را صرف نگاه کردن به نمودارهای مختلف کرده باشید، مدتها پیش به یک چیز پی بردهاید - همه تجسمهای داده یکسان ایجاد نمیشوند.
این خلاصهای سریع از برخی از رایجترین اشتباهاتی است که مردم هنگام ایجاد نمودارها برای نمایش دادهها به روشی سریع و قابل هضم مرتکب میشوند.
نقشه های بد
با پیگیری xkcd در ابتدا، دیدن دادههایی که روی نقشه به شکلی وحشتناک و بیفایده قرار میگیرند، بسیار معمول است. یکی از بزرگترین و رایجترین متخلفان همانی است که در کمیک نشان داده شده است.
توزیع های غیر جالب جمعیت
همانطور که مشخص است، مردم این روزها تمایل دارند در شهرها زندگی کنند.
فقط در صورتی باید زحمت نشان دادن نقشه را داشته باشید که توزیع مورد انتظاری که مشاهده می کنید با توزیع کل جمعیت در ایالات متحده مطابقت نداشته باشد.
به عنوان مثال، اگر تاکوهای منجمد میفروختید و متوجه میشوید که بیش از نیمی از فروش شما از فروشگاههای مواد غذایی در ویرجینیای غربی علیرغم حضور آنها در بازارهای سراسر کشور انجام میشود، بسیار قابل توجه خواهد بود.
نشان دادن نقشه ای که نشان دهنده این موضوع است، و همچنین در جاهایی که تاکوها محبوب هستند، می تواند اطلاعات مفیدی را ارائه دهد.
در روشی مشابه، اگر محصولی را می فروشید که کاملاً به زبان انگلیسی است، باید انتظار داشته باشید که توزیع مشتریان شما با توزیع انگلیسی زبانان در سراسر جهان مطابقت داشته باشد.
اندازه دانه بد
راه دیگر برای به هم ریختن نقشه، انتخاب یک روش ضعیف برای تقسیم زمین از نظر جغرافیایی به قطعات است. این مسئله یافتن کوچکترین واحد مناسب در سراسر BI رایج است و تجسم ها نیز از این قاعده مستثنی نیستند.
برای روشن تر شدن آنچه در مورد آن صحبت می کنم، اجازه دهید به دو نمونه از یک اندازه دانه نگاه کنیم که دو اثر بسیار متفاوت دارند.
ابتدا، بیایید به کسی نگاه کنیم که با سایه انداختن نقطه بالاترین ارتفاع در هر شهرستان به رنگ متفاوت در امتداد یک کلید مشخص، نقشه توپوگرافی ایالات متحده را می سازد.
در حالی که تا حدودی برای سواحل شرقی موثر است، اما وقتی به لبه کوههای راکی برخورد کردید، واقعاً همهچیز سر و صدا میشود.
شما تصویر خیلی خوبی از جغرافیا دریافت نمی کنید زیرا (به دلایل تاریخی پیچیده) اندازه شهرستان ها هر چه بیشتر به سمت غرب بروید بزرگتر می شوند. آنها داستانی را تعریف می کنند، فقط یک داستان مربوط به جغرافیا نیست.
این را با نقشه وابستگی مذهبی بر اساس شهرستان مقایسه کنید.
این نقشه با وجود استفاده از اندازه دانه دقیقاً یکسان کاملاً مؤثر است. ما میتوانیم استنباطهای سریع، دقیق و معنیداری در مورد مناطقی از ایالات متحده انجام دهیم، این که چگونه این مناطق ممکن است درک شوند، مردمی که در آنجا زندگی میکنند ممکن است درباره خود و بقیه کشور چه فکری کنند.
تهیه یک نقشه موثر به عنوان کمک بصری، اگرچه دشوار است، اما می تواند بسیار مفید و روشنگر باشد. فقط مطمئن شوید که در مورد آنچه که نقشه شما سعی در برقراری ارتباط دارد فکر کنید.
نمودارهای نوار بد
نمودارهای میله ای معمولاً بیشتر از اطلاعات ارائه شده روی نقشه هستند. خواندن آنها ساده است، ایجاد آنها ساده است و به طور کلی بسیار براق هستند.
اگرچه انجام آنها آسان است، اما اشتباهات رایجی وجود دارد که افراد هنگام تلاش برای اختراع مجدد چرخ می توانند مرتکب شوند.
ترازوهای گمراه کننده
یکی از رایجترین نمونههای نمودارهای میلهای بد زمانی است که شخصی با محور چپ کاری ناخوشایند انجام میدهد.
این یک مشکل به خصوص موذیانه است و ارائه دستورالعمل های کلی دشوار است. برای اینکه این مشکل کمی هضم شود، اجازه دهید چند مثال را مورد بحث قرار دهیم.
بیایید شرکتی را تصور کنیم که سه محصول تولید می کند. ویجت های آلفا، بتا و گاما. مدیر اجرایی میخواهد بداند که آنها در مقایسه با یکدیگر چقدر خوب میفروشند، و تیم BI یک نمودار برای آنها تهیه میکند.
در یک نگاه، مدیران اجرایی این تصور را دریافت خواهند کرد که ابزارکهای آلفا بسیار بیشتر از رقبا میفروشند، در حالی که در واقعیت، فروش ویجتهای گاما تنها حدود 20 درصد است - نه 500 درصد همانطور که در تجسم ذکر شده است.
این نمونه ای از تحریف بسیار آشکار شنیع است - یا اینطور است؟ آیا میتوانیم موردی را تصور کنیم که دقیقاً همین اعوجاج مفیدتر از محور 0 تا 50,000 وانیلی باشد؟
به عنوان مثال، بیایید یک شرکت را تصور کنیم با این تفاوت که اکنون مدیر اجرایی می خواهد چیز متفاوتی بداند.
در این حالت، هر ویجت تنها در صورتی سود می برد که حداقل 45,000 واحد بفروشد. برای اطلاع از اینکه هر محصول در مقایسه با یکدیگر و در رابطه با این طبقه چقدر خوب عمل می کند، تیم BI دست به کار شده و تصویرسازی زیر را ارائه می دهد.
Tسلام، همه، به صورت مطلق، در یک پنجره 20٪ از یکدیگر هستند، اما آنها چقدر به علامت همه مهم 45,000 نزدیک هستند؟
به نظر میرسد که ویجتهای گاما کمی کم شدهاند، اما آیا ویجتهای بتا هستند؟ خط 45,000 حتی برچسب گذاری نشده است.
بزرگنمایی نمودار حول محور کلیدی، در این مورد، بسیار آموزنده خواهد بود.
مواردی از این دست، ارائه توصیه های عمومی را بسیار دشوار می کند. بهتر است احتیاط کنید. قبل از کشش و برش دادن محور y با رها کردن بی پروا، هر موقعیت را به دقت تجزیه و تحلیل کنید.
میله های حیله
یک سوء استفاده بسیار کمتر ترسناک و ساده از نمودارهای میله ای زمانی است که افراد سعی می کنند با تجسم های خود بسیار زیبا شوند. درست است که نمودار میله ای وانیلی می تواند کمی خسته کننده باشد، بنابراین منطقی است که مردم سعی کنند آن را چاشنی ساز کنند.
یک مثال معروف، مورد بدنام زنان غول پیکر لتونی است.
از برخی جهات، این به برخی از موضوعاتی که در بخش قبل مورد بحث قرار گرفت، مرتبط است. اگر خالق نمودار تمام محور y را تا 0'0'' درج می کرد، در آن صورت زنان هندی در مقایسه با لتونیایی های غول پیکر شبیه پیکسی ها نبودند.
البته اگر فقط از میله ها استفاده می کردند مشکل هم برطرف می شد. آنها خسته کننده هستند، اما همچنین موثر هستند.
نمودارهای پای بد
نمودار دایره ای دشمن نوع بشر است. آنها تقریباً از هر نظر وحشتناک هستند. این بیش از یک نظر پرشور مورد حمایت نویسنده است، این یک واقعیت عینی و علمی است.
راه های بیشتری برای اشتباه گرفتن نمودارهای دایره ای وجود دارد تا درست کردن آنها. آنها کاربردهای بسیار محدودی دارند، و حتی در آنها، این که آیا آنها مؤثرترین ابزار برای این کار هستند یا خیر، جای سوال دارد.
همانطور که گفته شد، اجازه دهید فقط در مورد فاحش ترین اشتباهات صحبت کنیم.
نمودارهای شلوغ
این اشتباه بسیار رایج نیست، اما زمانی که به میان می آید بسیار آزاردهنده است. همچنین یکی از مشکلات اساسی نمودار pi را نشان می دهد.
بیایید به مثال زیر نگاه کنیم، نمودار دایره ای که توزیع بسامد حروف را در انگلیسی نوشتاری نشان می دهد.
با نگاهی به این نمودار، آیا فکر می کنید می توانید با اطمینان بگویید که من از R رایج تر هستم؟ یا O؟ این نادیده گرفتن این است که برخی از برش ها خیلی کوچک هستند و حتی یک برچسب روی آنها قرار نمی گیرد.
بیایید این را با یک نمودار میله ای زیبا و ساده مقایسه کنیم.
شعر!
نه تنها میتوانید فوراً هر حرف را در رابطه با همه حروف دیگر ببینید، بلکه شهود دقیقی در مورد فرکانس آنها و یک محور به راحتی قابل مشاهده برای نمایش درصدهای واقعی به دست میآورید.
اون نمودار قبلی؟ غیر قابل رفع. به سادگی متغیرهای زیادی وجود دارد.
نمودارهای سه بعدی
سوء استفاده فاحش دیگر از نمودارهای دایره ای زمانی است که مردم آنها را به صورت سه بعدی می سازند و اغلب آنها را در زوایای نامقدس کج می کنند.
بیایید به یک مثال نگاه کنیم.
در یک نگاه، رنگ آبی "EUL-NGL" تقریباً مشابه "S&D" قرمز به نظر می رسد، اما اینطور نیست. اگر از نظر ذهنی شیب را تصحیح کنیم، تفاوت بسیار بزرگتر از آن چیزی است که به نظر می رسد.
هیچ وضعیت قابل قبولی وجود ندارد که این نوع نمودار سه بعدی عمل کند، فقط برای گمراه کردن خواننده در مقیاس های نسبی وجود دارد.
نمودارهای دایره ای مسطح به خوبی به نظر می رسند.
انتخاب رنگ ضعیف
آخرین اشتباهی که مردم مرتکب می شوند، انتخاب طرح های رنگی بی ملاحظه است. این یک نکته کوچک در مقایسه با بقیه است، اما می تواند تفاوت بزرگی برای مردم ایجاد کند.
نمودار زیر را در نظر بگیرید.
به احتمال زیاد، این به نظر شما خوب است. همه چیز به وضوح برچسب گذاری شده است، اندازه ها دارای اختلافات به اندازه کافی بزرگ هستند که به راحتی می توان میزان فروش را در مقایسه با یکدیگر مشاهده کرد.
با این حال، اگر از کوررنگی رنج می برید، این احتمالا بسیار آزاردهنده است.
به عنوان یک قاعده کلی، قرمز و سبز هرگز نباید در یک نمودار استفاده شوند، به ویژه در مجاورت یکدیگر.
سایر خطاهای طرح رنگ باید برای همه آشکار باشد، مانند انتخاب 6 سایه متفاوت یا قرمز.
Takeaways
راههای بسیار بسیار بیشتری برای ایجاد تجسم دادهها وجود دارد که وحشتناک هستند و مانع درک درستی از دادهها میشوند. با کمی تفکر می توان از همه آنها جلوگیری کرد.
این مهم است که در نظر داشته باشید که چگونه شخص دیگری نمودار را می بیند، کسی که از نزدیک با داده ها آشنا نیست. شما باید درک عمیقی از هدف نگاه کردن به داده ها داشته باشید و بهترین روش برای برجسته کردن آن بخش ها بدون گمراه کردن افراد است.