ভয়ঙ্কর ড্যাশবোর্ডের মাধ্যমে আপনি কীভাবে ভুল তথ্য ছড়ান
সংখ্যাগুলি নিজেরাই পড়া কঠিন, এবং এর থেকে অর্থপূর্ণ অনুমান করাও কঠিন। এটা প্রায়ই হয় যে বিভিন্ন গ্রাফিক্স এবং চার্টের আকারে ডেটা ভিজ্যুয়ালাইজ করা কোনো বাস্তব ডেটা বিশ্লেষণ করার জন্য প্রয়োজনীয়।
যাইহোক, আপনি যদি বিভিন্ন গ্রাফের দিকে তাকিয়ে অনেক সময় ব্যয় করেন তবে আপনি অনেক আগেই একটি জিনিস উপলব্ধি করতে পারবেন – সমস্ত ডেটা ভিজ্যুয়ালাইজেশন সমানভাবে তৈরি হয় না।
এটি দ্রুত এবং সহজে হজমযোগ্য উপায়ে ডেটা উপস্থাপন করার জন্য চার্ট তৈরি করার সময় লোকেরা যে সব সাধারণ ভুল করে থাকে তার একটি দ্রুত সংক্ষিপ্ত বিবরণ হবে।
খারাপ মানচিত্র
শুরুতে xkcd-এ ফলো-আপ করলে, ম্যাপে ডেটা এমনভাবে রাখা যা ভয়ানক এবং অকেজো। সবচেয়ে বড় এবং সবচেয়ে সাধারণ অপরাধীদের মধ্যে একটি কমিক দেখানো হয়.
অরুচিহীন জনসংখ্যা বিতরণ
দেখা যাচ্ছে, মানুষ আজকাল শহরে বসবাস করতে থাকে।
আপনি শুধুমাত্র একটি মানচিত্র দেখাতে বিরক্ত করা উচিত যদি আপনি লক্ষ্য করা প্রত্যাশিত বিতরণ মার্কিন যুক্তরাষ্ট্রের মোট জনসংখ্যার বন্টনের সাথে সারিবদ্ধ না হয়।
উদাহরণস্বরূপ, আপনি যদি হিমায়িত টাকো বিক্রি করেন এবং জানতে পারেন যে আপনার বিক্রয়ের অর্ধেকেরও বেশি ওয়েস্ট ভার্জিনিয়ার মুদি দোকান থেকে দেশব্যাপী বাজারে তাদের উপস্থিতি থাকা সত্ত্বেও, এটি বেশ উল্লেখযোগ্য হবে।
এটি নির্দেশ করে একটি মানচিত্র দেখানো, সেইসাথে টাকোগুলি কোথায় জনপ্রিয়, তা দরকারী তথ্য প্রদান করতে পারে।
একইভাবে, আপনি যদি সম্পূর্ণ ইংরেজিতে এমন একটি পণ্য বিক্রি করেন, তাহলে আপনার গ্রাহকদের বিতরণ বিশ্বব্যাপী ইংরেজি ভাষাভাষীদের বিতরণের সাথে সামঞ্জস্যপূর্ণ হবে বলে আশা করা উচিত।
খারাপ শস্য আকার
একটি মানচিত্র বিশৃঙ্খল করার আরেকটি উপায় হল ভৌগলিকভাবে ভূমিকে খণ্ডে বিভক্ত করার একটি খারাপ উপায় বেছে নেওয়া। সঠিক ক্ষুদ্রতম একক খোঁজার এই সমস্যাটি BI জুড়ে একটি সাধারণ বিষয়, এবং ভিজ্যুয়ালাইজেশনও এর ব্যতিক্রম নয়।
আমি যা বলছি তা আরও স্পষ্ট করার জন্য, আসুন একই শস্যের আকারের দুটি উদাহরণ দেখি যার দুটি খুব ভিন্ন প্রভাব রয়েছে।
প্রথমে, আসুন দেখি যে কেউ একজন সংজ্ঞায়িত কী বরাবর প্রতিটি কাউন্টির সর্বোচ্চ উচ্চতার বিন্দুকে ভিন্ন রঙের ছায়া দিয়ে মার্কিন যুক্তরাষ্ট্রের একটি টপোগ্রাফিক মানচিত্র তৈরি করছে।
যদিও এটি পূর্ব উপকূলের জন্য কিছুটা কার্যকর, কিন্তু একবার আপনি রকিজের প্রান্তে আঘাত করলে, এটি সত্যিই সমস্ত গোলমাল।
আপনি ভূগোলের খুব ভাল ছবি পাবেন না কারণ (জটিল ঐতিহাসিক কারণে) কাউন্টির আকার আপনি যত পশ্চিমে যান ততই বড় হতে থাকে। তারা একটি গল্প বলে, শুধু ভূগোলের সাথে প্রাসঙ্গিক নয়।
কাউন্টি অনুসারে ধর্মীয় অনুষঙ্গের একটি মানচিত্রের সাথে এটিকে বৈসাদৃশ্য করুন।
এই মানচিত্রটি সম্পূর্ণরূপে কার্যকর, সঠিক একই শস্যের আকার ব্যবহার করা সত্ত্বেও। আমরা মার্কিন যুক্তরাষ্ট্রের অঞ্চলগুলি সম্পর্কে দ্রুত, নির্ভুল এবং অর্থপূর্ণ অনুমান করতে সক্ষম হয়েছি, এই অঞ্চলগুলি কীভাবে অনুভূত হতে পারে, সেখানে বসবাসকারী লোকেরা নিজেদের এবং দেশের বাকি অংশ সম্পর্কে কী ভাবতে পারে।
একটি চাক্ষুষ সহায়তা হিসাবে একটি কার্যকর মানচিত্র তৈরি করা, যদিও কঠিন, খুব দরকারী এবং ব্যাখ্যামূলক হতে পারে। আপনার মানচিত্রটি কী যোগাযোগ করার চেষ্টা করছে সে সম্পর্কে কিছু চিন্তা করতে ভুলবেন না।
খারাপ বার গ্রাফ
একটি মানচিত্রে উপস্থাপিত তথ্যের চেয়ে বার গ্রাফগুলি সাধারণত বেশি সাধারণ। এগুলি পড়তে সহজ, তৈরি করা সহজ এবং সাধারণত বেশ মসৃণ।
যদিও সেগুলি তৈরি করা সহজ, কিছু সাধারণ ভুল রয়েছে যা লোকেরা চাকাটি পুনরায় উদ্ভাবনের চেষ্টা করার সময় করতে পারে।
বিভ্রান্তিকর দাঁড়িপাল্লা
খারাপ বার গ্রাফের সবচেয়ে সাধারণ উদাহরণ হল যখন কেউ বাম অক্ষের সাথে অপ্রীতিকর কিছু করে।
এটি একটি বিশেষভাবে প্রতারক সমস্যা, এবং কম্বল নির্দেশিকা দেওয়া কঠিন। এই সমস্যাটি হজম করা একটু সহজ করার জন্য, কিছু উদাহরণ আলোচনা করা যাক।
আসুন একটি কোম্পানি কল্পনা করা যাক যে তিনটি পণ্য তৈরি করে; আলফা, বিটা এবং গামা উইজেট। এক্সিকিউটিভ জানতে চায় তারা একে অপরের তুলনায় কতটা ভালো বিক্রি করছে এবং BI টিম তাদের জন্য একটি গ্রাফ তৈরি করেছে।
এক নজরে, এক্সিকিউটিভ ধারণা পাবেন যে আলফা উইজেটগুলি প্রতিযোগিতার তুলনায় অনেক বেশি বিক্রি করছে, যখন বাস্তবে, তারা গামা উইজেটগুলিকে প্রায় 20% ছাড়িয়েছে - 500% নয় যেমনটি ভিজ্যুয়ালাইজেশনে উহ্য রয়েছে৷
এটি একটি খুব স্পষ্টভাবে জঘন্য বিকৃতির একটি উদাহরণ - নাকি এটি? আমরা কি এমন একটি ক্ষেত্রে কল্পনা করতে পারি যেখানে এই সঠিক একই বিকৃতিটি ভ্যানিলা 0 - 50,000 অক্ষের চেয়ে বেশি কার্যকর হবে?
উদাহরন স্বরূপ, একই কোম্পানির কল্পনা করা যাক এখন এক্সিকিউটিভ ভিন্ন কিছু জানতে চায়।
এই ক্ষেত্রে, প্রতিটি উইজেট কমপক্ষে 45,000 ইউনিট বিক্রি করলেই কেবল লাভ হবে৷ প্রতিটি পণ্য একে অপরের তুলনায় কতটা ভাল কাজ করছে এবং এই ফ্লোরের সাথে সম্পর্কযুক্ত তা খুঁজে বের করতে, BI টিম কাজ করে এবং নিম্নলিখিত ভিজ্যুয়ালাইজেশন জমা দেয়।
Tআরে সব, পরম পদে, একে অপরের 20% উইন্ডোর মধ্যে, কিন্তু তারা সমস্ত গুরুত্বপূর্ণ 45,000 চিহ্নের কতটা কাছাকাছি?
দেখে মনে হচ্ছে গামা উইজেটগুলি একটু ছোট হচ্ছে, কিন্তু বিটা উইজেটগুলি কি? 45,000 লাইন এমনকি লেবেল করা হয় না.
এই ক্ষেত্রে, সেই কী অক্ষের চারপাশে গ্রাফটিকে বিবর্ধিত করা অত্যন্ত তথ্যপূর্ণ হবে।
এই ধরনের ক্ষেত্রে কম্বল পরামর্শ দেওয়া খুব কঠিন করে তোলে। সাবধানতা অবলম্বন করা ভাল। বেপরোয়া পরিত্যাগের সাথে y অক্ষকে প্রসারিত এবং ক্রপ করার আগে প্রতিটি পরিস্থিতি যত্ন সহকারে বিশ্লেষণ করুন।
গিমিক বার
বার গ্রাফের একটি অনেক কম ভীতিকর এবং সহজ অপব্যবহার হল যখন লোকেরা তাদের ভিজ্যুয়ালাইজেশনের সাথে খুব সুন্দর হওয়ার চেষ্টা করে। এটি সত্য যে একটি ভ্যানিলা বার চার্ট একটু বিরক্তিকর হতে পারে, তাই এটি বোঝায় যে লোকেরা এটিকে মশলাদার করার চেষ্টা করবে।
একটি সুপরিচিত উদাহরণ হল দৈত্য লাত্ভিয়ান মহিলাদের কুখ্যাত মামলা।
কিছু উপায়ে, এটি পূর্ববর্তী বিভাগে আলোচিত কিছু সমস্যার সাথে প্রাসঙ্গিক। গ্রাফের স্রষ্টা যদি সম্পূর্ণ y অক্ষকে 0'0'' পর্যন্ত অন্তর্ভুক্ত করতেন, তাহলে ভারতীয় মহিলারা দৈত্য লাটভিয়ানদের তুলনায় পিক্সির মতো দেখতে পেত না।
অবশ্যই, যদি তারা শুধু বার ব্যবহার করত, তাহলে সমস্যাটিও চলে যেত। তারা বিরক্তিকর, কিন্তু তারা কার্যকরী.
খারাপ পাই চার্ট
পাই চার্ট মানবজাতির শত্রু। তারা প্রায় সব দিক থেকে ভয়ানক. এটি লেখকের দ্বারা প্রদত্ত একটি উত্সাহী মতামতের চেয়ে বেশি, এটি উদ্দেশ্যমূলক, বৈজ্ঞানিক সত্য।
পাই চার্টগুলিকে সঠিক করার চেয়ে ভুল করার আরও অনেক উপায় রয়েছে। তাদের অত্যন্ত সংকীর্ণ অ্যাপ্লিকেশন রয়েছে এবং এমনকি সেগুলির মধ্যেও, তারা কাজের জন্য সবচেয়ে কার্যকরী হাতিয়ার কিনা তা নিয়ে সন্দেহজনক।
বলা হচ্ছে, আসুন শুধু সবচেয়ে মারাত্মক ভুল পদক্ষেপের কথা বলি।
উপচে পড়া চার্ট
এই ভুলটি খুব সাধারণ নয়, তবে এটি যখন আসে তখন এটি অত্যন্ত বিরক্তিকর। এটি পাই চার্টের সাথে একটি মৌলিক সমস্যাও প্রদর্শন করে।
আসুন নিম্নলিখিত উদাহরণটি দেখি, একটি পাই চার্ট লিখিত ইংরেজিতে অক্ষরের ফ্রিকোয়েন্সি বিতরণ দেখায়।
এই চার্টটি দেখে, আপনি কি মনে করেন যে আপনি আত্মবিশ্বাসের সাথে বলতে পারেন যে আমি আর এর চেয়ে বেশি সাধারণ? নাকি ও? এটি উপেক্ষা করছে যে কিছু স্লাইস এমনকি তাদের উপর একটি লেবেল ফিট করার জন্য খুব ছোট।
আসুন এটিকে একটি সুন্দর, সাধারণ বার চার্টের সাথে তুলনা করি।
কবিতার !
আপনি শুধুমাত্র অন্য সকলের সাথে সম্পর্কিত প্রতিটি অক্ষর অবিলম্বে দেখতে পারবেন না, তবে আপনি তাদের ফ্রিকোয়েন্সি সম্পর্কে একটি সঠিক অন্তর্দৃষ্টি এবং প্রকৃত শতাংশগুলি প্রদর্শন করে একটি সহজে দৃশ্যমান অক্ষ পাবেন।
সেই আগের চার্ট? আনফিক্সেবল। সহজভাবে অনেক ভেরিয়েবল আছে.
3 ডি চার্ট
পাই চার্টের আরেকটি গুরুতর অপব্যবহার হল যখন লোকেরা এগুলিকে 3D তে তৈরি করে, প্রায়শই তাদের অপবিত্র কোণে কাত করে।
একটি উদাহরণ দেখা যাক।
এক নজরে, নীল "EUL-NGL" দেখতে লাল "S&D" এর মতোই দেখায়, কিন্তু ব্যাপারটা তেমন নয়৷ আমরা যদি কাত করার জন্য মানসিকভাবে সঠিক করি তবে পার্থক্যটি মনে হয় তার চেয়ে অনেক বেশি।
কোন গ্রহণযোগ্য পরিস্থিতি নেই যেখানে এই ধরনের 3D গ্রাফ কাজ করবে, এটি শুধুমাত্র পাঠককে আপেক্ষিক স্কেল হিসাবে বিভ্রান্ত করার জন্য বিদ্যমান।
ফ্ল্যাট পাই চার্ট ঠিক ঠিক দেখতে।
দরিদ্র রঙ পছন্দ
লোকেরা যে চূড়ান্ত ভুলটি করে থাকে তা হল অবিবেচনাপূর্ণ রঙের স্কিম বাছাই করা। এটি অন্যদের তুলনায় একটি ছোট পয়েন্ট, কিন্তু এটি মানুষের জন্য একটি বড় পার্থক্য করতে পারে।
নিম্নলিখিত চার্ট বিবেচনা করুন.
সম্ভাবনা আছে, এটি আপনার কাছে ঠিক দেখায়। সবকিছু পরিষ্কারভাবে লেবেল করা হয়েছে, আকারে যথেষ্ট বড় অসঙ্গতি রয়েছে যে একে অপরের সাথে বিক্রি কেমন তা দেখা সহজ।
যাইহোক, আপনি যদি বর্ণান্ধতায় ভোগেন তবে এটি সম্ভবত খুব বিরক্তিকর।
একটি সাধারণ নিয়ম হিসাবে, লাল এবং সবুজ একই গ্রাফে ব্যবহার করা উচিত নয়, বিশেষ করে একে অপরের সংলগ্ন।
অন্যান্য রঙের স্কিমের ত্রুটিগুলি সবার কাছে স্পষ্ট হওয়া উচিত, যেমন 6টি ভিন্ন হালকা শেড বা লাল বাছাই করা।
takeaways
ডেটা ভিজ্যুয়ালাইজেশন তৈরি করার অনেকগুলি, আরও অনেক উপায় রয়েছে যা ভয়ানক এবং মানুষ কতটা ভালভাবে ডেটা বুঝতে সক্ষম তা বাধা দেয়। একটু চিন্তাভাবনা করলেই সব এড়ানো যায়।
অন্য কেউ কীভাবে গ্রাফটি দেখতে যাচ্ছে তা বিবেচনা করা গুরুত্বপূর্ণ, এমন কেউ যিনি ডেটার সাথে ঘনিষ্ঠভাবে পরিচিত নন। ডেটা দেখার লক্ষ্য কী এবং লোকেদের বিভ্রান্ত না করে সেই অংশগুলিকে কীভাবে হাইলাইট করা যায় সে সম্পর্কে আপনার গভীর ধারণা থাকতে হবে।