تحليلات الكذب

by جون بويرأغسطس 31، 2022BI / التحليلاتتعليقات

تحليلات الكذب

انحياز التحليل

قال مارك توين بشكل مثير للجدل شيئًا مثل ، "هناك ثلاثة أنواع من الأكاذيب: الأكاذيب والأكاذيب اللعينة و تحليلات".

نحن نعتبر أن التحليلات تمنحنا رؤى مفيدة وقابلة للتنفيذ. ما لا ندركه غالبًا هو كيف تؤثر تحيزاتنا وتحيزات الآخرين على الإجابات التي نقدمها حتى من خلال أكثر البرامج والأنظمة تطوراً. في بعض الأحيان ، قد يتم التلاعب بنا بطريقة غير شريفة ، ولكن بشكل أكثر شيوعًا ، قد تكون التحيزات الدقيقة واللاواعية هي التي تتسلل إلى تحليلاتنا. الدافع وراء التحليلات المتحيزة متعدد الجوانب. في بعض الأحيان ، تتأثر النتائج المحايدة التي نتوقعها من العلم بـ 1) خيارات دقيقة في كيفية تقديم البيانات ، 2) بيانات غير متسقة أو غير تمثيلية ، 3) كيفية تدريب أنظمة الذكاء الاصطناعي ، 4) جهل الباحثين أو عدم كفاءة الباحثين أو غيرهم ممن يحاولون لرواية القصة ، 5) التحليل نفسه.

العرض التقديمي متحيز

يسهل اكتشاف بعض الأكاذيب عن غيرها. عندما تعرف ما الذي تبحث عنه قد تكتشفه بسهولة أكبر الرسوم البيانية والمخططات المضللة.

هناك على الأقل خمس طرق لعرض البيانات بشكل مضلل: 1) اعرض مجموعة بيانات محدودة ، 2). إظهار الارتباطات غير ذات الصلة ، 3) إظهار البيانات بشكل غير دقيق ، 4) إظهار البيانات بشكل غير تقليدي ، أو 5). إظهار البيانات مبسطة أكثر من اللازم.

إظهار مجموعة بيانات محدودة

الحد من البيانات ، أو التحديد اليدوي لقسم غير عشوائي من البيانات يمكن أن يروي في كثير من الأحيان قصة لا تتوافق مع الصورة الكبيرة. أخذ العينات السيئ ، أو اختيار الكرز ، هو عندما يستخدم المحلل عينة غير تمثيلية لتمثيل مجموعة أكبر.

في مارس 2020، قسم الصحة العامة في جورجيا نشر هذا المخطط كجزء من تقرير الحالة اليومية. إنها في الواقع تثير أسئلة أكثر مما تجيب.

أحد الأشياء المفقودة هو السياق. على سبيل المثال ، قد يكون من المفيد معرفة النسبة المئوية للسكان لكل فئة عمرية. هناك مشكلة أخرى في الرسم البياني الدائري البسيط وهي الفئات العمرية غير المتكافئة. الفئة 0-17 لها 18 عامًا ، و18-59 لديها 42 عامًا ، و 60 عامًا فأكثر مفتوحة ، ولكن لديها حوالي 40 عامًا. الاستنتاج ، بالنظر إلى هذا الرسم البياني وحده ، هو أن غالبية الحالات تقع في الفئة العمرية 18-59 عامًا. يبدو أن الفئة العمرية 60+ عامًا أقل تأثراً بحالات COVID. لكن هذه ليست القصة الكاملة.

للمقارنة ، هذه البيانات المختلفة على موقع ويب CDC رسم بياني لحالات COVID حسب الفئة العمرية مع بيانات إضافية عن النسبة المئوية لسكان الولايات المتحدة في كل فئة عمرية.

هذا أفضل. لدينا المزيد من السياق. يمكننا أن نرى أن الفئات العمرية 18-29 ، 30-39 ، 40-49 جميعها لديها نسبة أعلى من الحالات من النسبة المئوية للفئة العمرية في السكان. لا تزال هناك بعض الفئات العمرية غير المتكافئة. لماذا 16-17 فئة عمرية منفصلة؟ لا تزال هذه ليست القصة الكاملة ، لكن النقاد كتبوا أعمدة ، وقدموا تنبؤات وتفويضات على أقل من ذلك. من الواضح أنه مع COVID ، هناك العديد من المتغيرات بالإضافة إلى العمر التي تؤثر على اعتباره حالة إيجابية: حالة التطعيم ، وتوافر الاختبارات ، وعدد مرات الاختبار ، والأمراض المصاحبة ، وغيرها الكثير. عدد الحالات ، في حد ذاته ، يوفر صورة غير كاملة. ينظر معظم الخبراء أيضًا في عدد الوفيات ، أو النسب المئوية للوفيات لكل 100,000 من السكان ، أو حالات الوفاة للنظر في كيفية تأثير COVID على كل فئة عمرية.

أظهر الارتباطات غير المترابطة

من الواضح أن هناك ملف ارتباط قوي بين إنفاق الولايات المتحدة على العلوم والفضاء والتكنولوجيا وعدد حالات الانتحار شنقًا وخنقًا وخنقًا. الارتباط هو 99.79٪ ، وهو تطابق كامل تقريبًا.

ومع ذلك ، من الذي سيجعل القضية مترابطة بطريقة أو بأخرى ، أو أن أحدهما يسبب الآخر؟ هناك أمثلة أخرى أقل تطرفًا ، لكنها ليست أقل زيفًا. هناك علاقة قوية مماثلة بين الحروف في الكلمة الفائزة لنحلة التهجئة الوطنية لسكريبس وعدد الأشخاص الذين قتلتهم العناكب السامة. صدفة؟ انت صاحب القرار.

هناك طريقة أخرى لرسم هذه البيانات التي قد تكون أقل تضليلًا وهي تضمين الصفر على كلا المحورين الصاديين.

عرض البيانات بشكل غير دقيق

من كيفية عرض البيانات بشكل سيء، قدمت ولاية جورجيا الأمريكية أكبر 5 مقاطعات مع أكبر عدد من حالات COVID-19 المؤكدة.

تبدو شرعية ، أليس كذلك؟ من الواضح أن هناك اتجاهًا هبوطيًا لحالات COVID-19 المؤكدة. هل يمكنك قراءة المحور السيني؟ يمثل المحور السيني الوقت. عادة ، ستزيد التواريخ من اليسار إلى اليمين. هنا ، نرى القليل من السفر عبر الزمن على المحور السيني:

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

انتظر؟ ماذا؟ لا يتم فرز المحور X ترتيبًا زمنيًا. لذا ، بقدر ما يبدو الاتجاه لطيفًا ، لا يمكننا استخلاص أي استنتاجات. إذا تم ترتيب التواريخ ، فإن الأشرطة الخاصة بعدد الحالات تُظهر نمط سن المنشار أكثر من أي نوع من الاتجاه.

الحل السهل هنا هو فرز التواريخ بالطريقة التي يعمل بها التقويم.

إظهار البيانات بشكل غير تقليدي

كلنا مشغولون. علمتنا أدمغتنا أن نصدر أحكامًا سريعة بناءً على افتراضات كانت متسقة في عالمنا. على سبيل المثال ، يوضح كل رسم بياني رأيته محوري x و y عند الصفر أو أدنى قيم. بالنظر إلى هذا الرسم البياني بإيجاز ، ما هي الاستنتاجات التي يمكنك استخلاصها حول تأثير فلوريدا "حافظ على القانون الأساسي الخاص بك."؟ أشعر بالخجل من الاعتراف بذلك ، لكن هذا الرسم البياني خدعني في البداية. تنجذب عينك بشكل ملائم إلى النص والسهم في منتصف الرسم. أسفل في هذا الرسم البياني. قد لا تكون هذه كذبة - فالبيانات موجودة هناك. لكن علي أن أعتقد أن الهدف من ذلك هو الخداع. إذا لم تكن قد رأيته بعد ، فسيكون الصفر على المحور ص في الأعلى. لذلك ، مع اتجاه البيانات إلى الانخفاض ، فإن هذا يعني المزيد من الوفيات. يوضح هذا الرسم البياني عدد جرائم القتل باستخدام الأسلحة النارية زيادة بعد عام 2005 ، أشار إليه الاتجاه السائد إلى أسفل.

إظهار البيانات مبسطة أكثر من اللازم

يمكن رؤية أحد الأمثلة على التبسيط المفرط للبيانات عندما يستفيد المحللون من مفارقة سيمبسون. تحدث هذه الظاهرة عندما يبدو أن البيانات المجمعة تظهر استنتاجًا مختلفًا عما يحدث عندما يتم فصلها إلى مجموعات فرعية. من السهل الوقوع في هذا المصيدة عند النظر إلى النسب المئوية المجمعة عالية المستوى. يرتبط أحد أوضح الرسوم التوضيحية لمفارقة سيمبسون في العمل بـ متوسط الضرب.

هنا نرى أن Derek Jeter لديه متوسط ضرب إجمالي أعلى من David Justice في موسمي 1995 و 1996. تأتي المفارقة عندما ندرك أن العدالة تفوقت على جيتر في ضرب المتوسط في كلتا السنتين. إذا نظرت بعناية ، فمن المنطقي عندما تدرك أن Jeter كان لديه ما يقرب من 4 أضعاف عدد الخفافيش (المقام) في عام 1996 بمتوسط أقل بنسبة 007 في عام 1996. في حين أن العدل كان لديه ما يقرب من 10 أضعاف عدد الخفافيش فقط. 003 أعلى متوسط في عام 1995.

يبدو العرض واضحًا ، لكن مفارقة سيمبسون ، عن قصد أو بغير قصد ، أدت إلى استنتاجات غير صحيحة. في الآونة الأخيرة ، كانت هناك أمثلة على مفارقة سيمبسون في الأخبار وعلى وسائل التواصل الاجتماعي المتعلقة باللقاحات ووفيات COVID. واحد المخطط يعرض رسمًا بيانيًا خطيًا يقارن معدلات الوفيات بين الملقحين وغير الملقحين للأشخاص الذين تتراوح أعمارهم بين 10-59 عامًا. يوضح الرسم البياني أن غير الملقحين لديهم معدل وفيات أقل باستمرار. ماذا يحدث هنا؟

المشكلة مشابهة لتلك التي نراها مع ضرب المتوسطات. المقام في هذه الحالة هو عدد الأفراد في كل فئة عمرية. يجمع الرسم البياني بين المجموعات التي لها نتائج مختلفة. إذا نظرنا إلى الفئة العمرية الأكبر سنًا ، 50-59 ، بشكل منفصل ، نرى أن أجرة التلقيح أفضل. وبالمثل ، إذا نظرنا إلى 10-49 ، نرى أيضًا أن اللقاح أفضل. من المفارقات ، عند النظر إلى المجموعة المدمجة ، أن غير الملقحين يبدو أن النتيجة أسوأ. بهذه الطريقة ، يمكنك إثبات وجود حجج معاكسة باستخدام البيانات.

البيانات متحيزة

لا يمكن الوثوق بالبيانات دائمًا. حتى في المجتمع العلمي ، اعترف أكثر من ثلث الباحثين الذين شملهم الاستطلاع بذلك "ممارسات بحث مشكوك فيها." آخر محقق البحث عن الاحتيال يقول ، "من المحتمل جدًا أن يكون هناك الكثير من الاحتيال في البيانات - الجداول ، الرسوم البيانية الخطية ، بيانات التسلسل [- مما نكتشفه بالفعل]. يمكن لأي شخص يجلس على طاولة المطبخ وضع بعض الأرقام في جدول بيانات وإنشاء رسم بياني خطي يبدو مقنعًا ".

هذا أولا مثال يبدو أن شخصًا ما فعل ذلك تمامًا. أنا لا أقول أن هذا احتيال ، ولكن كمسح ، فإنه لا ينتج عنه أي بيانات تساهم في اتخاذ قرار مستنير. يبدو أن الاستطلاع سأل المستجيبين عن رأيهم في قهوة محطة الوقود ، أو بعض الأحداث الجارية الأخرى ذات الصلة ..

رائع
عظيم
جيد جدا

لقد قمت بقص منشور Twitter لإزالة الإشارات إلى الطرف المذنب ، ولكن هذا هو الرسم البياني الكامل الفعلي للنتائج النهائية للاستطلاع. الاستطلاعات مثل هذه ليست غير شائعة. من الواضح أن أي مخطط تم إنشاؤه من البيانات الناتجة عن الردود سيُظهر أن القهوة المعنية لا ينبغي تفويتها.

تكمن المشكلة في أنك إذا تلقيت هذا الاستطلاع ولم تجد إجابة تناسب تفكيرك ، فستتخطى الاستبيان. قد يكون هذا مثالًا صارخًا على كيفية إنشاء بيانات غير جديرة بالثقة. ومع ذلك ، يمكن أن يؤدي تصميم الاستبيان السيئ إلى عدد أقل من الردود وأولئك الذين يجيبون لديهم رأي واحد فقط ، إنها مجرد مسألة درجة. البيانات متحيزة.

هذا المثال الثاني لتحيز البيانات مأخوذ من ملفات "أسوأ الرسوم البيانية المضللة لـ COVID 19".

مرة أخرى ، هذا دقيق وغير واضح تمامًا. يُظهر الرسم البياني الشريطي انخفاضًا سلسًا - سلسًا للغاية - في النسبة المئوية لحالات COVID-19 الإيجابية بمرور الوقت لمقاطعة في فلوريدا. يمكنك بسهولة استخلاص نتيجة مفادها أن القضايا آخذة في الانخفاض. هذا رائع ، التصور يمثل البيانات بدقة. المشكلة في البيانات. لذا ، فهو تحيز أكثر دهاءً لأنك لا تستطيع رؤيته. يتم تخزينها في البيانات. تتضمن الأسئلة التي يجب طرحها ، من الذي يتم اختباره؟ بمعنى آخر ، ما هو المقام ، أو عدد السكان الذي ننظر إلى النسبة المئوية له. الافتراض هو أنه يمثل المجتمع بأكمله ، أو على الأقل عينة تمثيلية.

ومع ذلك ، خلال هذه الفترة ، في هذه المقاطعة ، تم إجراء الاختبارات فقط لعدد محدود من الناس. كان يجب أن تظهر عليهم أعراض شبيهة بـ COVID ، أو سافروا مؤخرًا إلى بلد على قائمة النقاط الساخنة. بالإضافة إلى أن النتائج المربكة هي حقيقة أن كل اختبار إيجابي تم حسابه وحساب كل اختبار سلبي. عادة ، عندما يكون الفرد إيجابيًا ، سيختبرون مرة أخرى عندما ينتهي الفيروس من مجراه وسيختبرون سلبيًا. لذلك ، بمعنى ما ، لكل حالة إيجابية ، هناك حالة اختبار سلبية تلغيها. كانت الغالبية العظمى من الاختبارات سلبية وتم احتساب الاختبارات السلبية لكل فرد. يمكنك أن ترى كيف تكون البيانات متحيزة وليست مفيدة بشكل خاص لاتخاذ القرارات.

إن مدخلات الذكاء الاصطناعي والتدريب عليها متحيزان

هناك طريقتان على الأقل يمكن للذكاء الاصطناعي أن يؤدي بهما إلى نتائج متحيزة: البدء ببيانات متحيزة ، أو باستخدام خوارزميات متحيزة لمعالجة البيانات الصحيحة.

المدخلات المنحازة

كثير منا لديه انطباع بأنه يمكن الوثوق بالذكاء الاصطناعي لتحليل الأرقام ، وتطبيق خوارزمياته ، وإجراء تحليل موثوق للبيانات. يمكن للذكاء الاصطناعي أن يكون ذكيًا بقدر ما يتم تدريبه فقط. إذا كانت البيانات التي تم التدريب عليها غير كاملة ، فلن يمكن الوثوق بالنتائج أو الاستنتاجات أيضًا. على غرار حالة تحيز المسح أعلاه ، هناك عدد من الطرق التي يمكن أن تكون البيانات بها انحيازا في التعلم الآلي:.

تحيز العينة - مجموعة بيانات التدريب لا تمثل جميع السكان.
تحيز الاستبعاد - في بعض الأحيان يكون ما يبدو أنه قيم متطرفة صحيحًا بالفعل ، أو حيث نرسم خطًا حول ما يجب تضمينه (الرموز البريدية ، والتواريخ ، وما إلى ذلك).
تحيز القياس - تقضي الاتفاقية دائمًا بالقياس من مركز وأسفل الغضروف المفصلي ، على سبيل المثال ، عند قياس السوائل في القوارير الحجمية أو أنابيب الاختبار (باستثناء الزئبق).
تذكر التحيز - عندما يعتمد البحث على ذاكرة المشاركين.
تحيز المراقب - يميل العلماء ، مثل كل البشر ، إلى رؤية ما يتوقعون رؤيته.
التحيز الجنسي والعنصري - الجنس أو العرق قد يكونان تمثيلا زائدا أو ناقصا.
التحيز النقابي - تعزز البيانات الصور النمطية

لكي يعود الذكاء الاصطناعي بنتائج موثوقة ، يجب أن تمثل بيانات التدريب الخاصة به العالم الحقيقي. كما ناقشنا في مقالة مدونة سابقة ، يعد إعداد البيانات أمرًا بالغ الأهمية ومثل أي مشروع بيانات آخر. يمكن للبيانات غير الموثوقة أن تعلم أنظمة التعلم الآلي الدرس الخاطئ وستؤدي إلى استنتاج خاطئ. ومع ذلك ، "جميع البيانات متحيزة. هذا ليس جنون العظمة. هذه حقيقة." - الدكتور سانجيف م نارايان، كلية الطب بجامعة ستانفورد.

أدى استخدام البيانات المتحيزة للتدريب إلى عدد من حالات فشل الذكاء الاصطناعي الملحوظة. (أمثلة هنا و هنا، ابحاث هنا..)

الخوارزميات المنحازة

الخوارزمية هي مجموعة من القواعد التي تقبل إدخالاً وتخلق مخرجات للإجابة على مشكلة العمل. غالبًا ما تكون أشجار قرار محددة جيدًا. تبدو الخوارزميات مثل الصناديق السوداء. لا أحد متأكد من كيفية عملهم ، في كثير من الأحيان ، ولا حتى الشركات التي تستخدمها. أوه ، وغالبًا ما تكون ملكية. طبيعتها الغامضة والمعقدة هي أحد الأسباب التي تجعل الخوارزميات المتحيزة خبيثة للغاية. .

ضع في اعتبارك خوارزميات الذكاء الاصطناعي في الطب أو الموارد البشرية أو المالية التي تأخذ العرق في الاعتبار. إذا كان العرق عاملاً ، فلا يمكن للخوارزمية أن تكون عمياء عنصريًا. هذا ليس نظريا. تم اكتشاف مشاكل مثل هذه في العالم الحقيقي باستخدام الذكاء الاصطناعي في تأجير, مشاركة الركوب, طلب القرضق، و زرع الكلى.

خلاصة القول هي أنه إذا كانت بياناتك أو خوارزمياتك سيئة ، أو أسوأ من عديمة الفائدة ، فقد تكون خطيرة. هناك شيء مثل "التدقيق الحسابي. " الهدف هو مساعدة المؤسسات على تحديد المخاطر المحتملة المتعلقة بالخوارزمية من حيث صلتها بالعدالة والتحيز والتمييز. في مكان آخر، فيسبوك يستخدم الذكاء الاصطناعي لمحاربة التحيز في الذكاء الاصطناعي.

الناس متحيزون

لدينا أشخاص على طرفي المعادلة. يقوم الناس بإعداد التحليل ويتلقى الأشخاص المعلومات. هناك باحثون وهناك قراء. في أي اتصال ، يمكن أن تكون هناك مشاكل في الإرسال أو الاستقبال.

خذ الطقس على سبيل المثال. ماذا تعني عبارة "فرصة هطول أمطار"؟ أولاً ، ماذا يعني خبراء الأرصاد الجوية عندما يقولون إن هناك فرصة لهطول الأمطار؟ بحسب حكومة الولايات المتحدة دائرة الارصاد الجوية الوطنية، فرصة لسقوط أمطار ، أو ما يسمونه احتمالية هطول الأمطار (PoP) ، هو أحد العناصر الأقل فهمًا في توقعات الطقس. إنه يحتوي على تعريف قياسي: "احتمال هطول الأمطار هو مجرد احتمال إحصائي قدره 0.01 بوصة [كذا] زيادة [كذا] لهطول الأمطار في منطقة معينة في منطقة التنبؤ المعينة في الفترة الزمنية المحددة." "المنطقة المحددة" هي منطقة التنبؤ ، أو بroadمنطقة المدلى بها. هذا يعني أن الاحتمالية الرسمية لهطول الأمطار تعتمد على الثقة في أنها ستمطر في مكان ما في المنطقة والنسبة المئوية للمنطقة التي ستبتل. بمعنى آخر ، إذا كان عالم الأرصاد الجوية واثقًا من أنها ستمطر في منطقة التنبؤ (الثقة = 100٪) ، فإن PoP يمثل جزءًا من المنطقة التي ستتلقى المطر.

شارع باريس؛ يوم ممطر، غوستاف كايليبوت (1848-1894) المجال العام لمعهد شيكاغو للفنون

تعتمد فرصة هطول الأمطار على الثقة والمساحة. لم اكن اعرف ذلك. أظن أن الآخرين لا يعرفون ذلك أيضًا. حوالي 75 ٪ من السكان لا يفهمون بدقة كيفية حساب PoP ، أو ما يُقصد تمثيله. إذن ، هل يتم خداعنا ، أم أن هذه مشكلة في الإدراك. دعنا نسميها تصور هطول الأمطار. هل نلوم متنبئ الطقس؟ لكي نكون منصفين ، هناك بعض ارتباك بين المتنبئين بالطقس أيضًا. في واحد مسح، قال 43٪ من خبراء الأرصاد الجوية الذين شملهم الاستطلاع أن هناك القليل جدًا من الاتساق في تعريف PoP.

التحليل نفسه متحيز

من بين العوامل الخمسة المؤثرة ، قد يكون التحليل نفسه هو الأكثر إثارة للدهشة. في البحث العلمي الذي ينتج عنه ورقة مراجعة يتم نشرها ، عادة ما يتم افتراض النظرية ، ويتم تحديد الطرق لاختبار الفرضية ، ويتم جمع البيانات ، ثم يتم تحليل البيانات. لا يتم تقدير نوع التحليل الذي تم إجراؤه وكيفية إجراؤه في كيفية تأثيره على الاستنتاجات. في ورقة نُشر في وقت سابق من هذا العام (يناير 2022) ، في المجلة الدولية للسرطان ، قام المؤلفون بتقييم ما إذا كانت نتائج التجارب العشوائية ذات الشواهد والدراسات القائمة على الملاحظة بأثر رجعي. وخلصت النتائج التي توصلوا إليها إلى أن

من خلال تغيير الخيارات التحليلية في أبحاث الفعالية المقارنة ، توصلنا إلى نتائج معاكسة. تشير نتائجنا إلى أن بعض دراسات الملاحظة بأثر رجعي قد تجد أن العلاج يحسن النتائج للمرضى ، في حين أن دراسة أخرى مماثلة قد تجد أنها لا تفعل ذلك ، بناءً على الخيارات التحليلية.

في الماضي ، عند قراءة مقال في مجلة علمية ، إذا كنت مثلي ، فربما تعتقد أن النتائج أو الاستنتاجات كلها تتعلق بالبيانات. الآن ، يبدو أن النتائج ، أو ما إذا تم تأكيد الفرضية الأولية أو دحضها ، قد تعتمد أيضًا على طريقة التحليل.

آخر دراسة وجدت نتائج مماثلة. المقالة، العديد من المحللين ، مجموعة بيانات واحدة: توضيح كيفية تأثير الاختلافات في الخيارات التحليلية على النتائج ، يصف كيف قدموا نفس مجموعة البيانات إلى 29 فريقًا مختلفًا لتحليلها. غالبًا ما يُنظر إلى تحليل البيانات على أنه عملية صارمة ومحددة جيدًا تؤدي إلى استنتاج واحد.

على الرغم من احتجاجات علماء المنهجيات ، فمن السهل التغاضي عن حقيقة أن النتائج قد تعتمد على الاستراتيجية التحليلية المختارة ، والتي هي نفسها مشبعة بالنظرية والافتراضات ونقاط الاختيار. في كثير من الحالات ، هناك العديد من الأساليب المعقولة (والعديد من الأساليب غير المعقولة) لتقييم البيانات التي تتعلق بسؤال بحثي.

حشد الباحثون مصادر تحليل البيانات وتوصلوا إلى استنتاج مفاده أن جميع الأبحاث تتضمن قرارات ذاتية - بما في ذلك نوع التحليل الذي يجب استخدامه - والتي يمكن أن تؤثر على النتيجة النهائية للدراسة.

توصية من جهة أخرى الباحث من قام بتحليل الدراسة أعلاه هو توخي الحذر عند استخدام ورقة واحدة في اتخاذ القرارات أو استخلاص النتائج.

معالجة التحيز في التحليلات

هذا يعني ببساطة أن يكون حكاية تحذيرية. يمكن للمعرفة أن تحمينا من التعرض للخداع. كلما زادت وعياً بالطرق المحتملة التي قد يستخدمها الماسح الضوئي لخداعنا ، قل احتمال دخولنا ، على سبيل المثال ، عن طريق توجيه النشل الخاطئ ، على سبيل المثال ، أو الحديث السلس عن مسرحية بونزي. لذلك فإن فهم التحيزات المحتملة والتعرف عليها تؤثر على تحليلاتنا. إذا كنا على دراية بالتأثيرات المحتملة ، فقد نتمكن من تقديم القصة بشكل أفضل واتخاذ قرارات أفضل في النهاية.

BI / التحليلات غير مصنف

لماذا يعتبر Microsoft Excel أداة التحليل رقم 1

لماذا يعتبر Excel أداة التحليل رقم 1؟

إنها رخيصة وسهلة. من المحتمل أن يكون برنامج جداول البيانات Microsoft Excel مثبتًا بالفعل على كمبيوتر المستخدم التجاري. وقد تعرض العديد من المستخدمين اليوم لبرامج Microsoft Office منذ المدرسة الثانوية أو حتى قبل ذلك. هذا الرد الساخط على...

تفاصيل أكثر

جون بوير | أبريل 18، 2024 | 0

BI / التحليلات غير مصنف

رتب أفكارك: دليل للتنظيف الربيعي للتحليلات

رتب أفكارك دليلًا للتنظيف الربيعي للتحليلات يبدأ العام الجديد بضجة كبيرة؛ يتم إنشاء تقارير نهاية العام وفحصها، ومن ثم يستقر الجميع في جدول عمل ثابت. كلما طالت الأيام وتفتحت الأشجار والزهور..

تفاصيل أكثر

شيري ويجدر | أبريل 10، 2024 | 0

BI / التحليلات غير مصنف

نيويورك ستايل مقابل شيكاغو ستايل بيتزا: نقاش لذيذ

عند إشباع رغباتنا، هناك أشياء قليلة يمكن أن تنافس متعة شريحة البيتزا الساخنة. أثار الجدل الدائر بين البيتزا على طريقة نيويورك والبيتزا على طريقة شيكاغو مناقشات عاطفية لعقود من الزمن. كل نمط له خصائصه الفريدة والمشجعين المخلصين....

تفاصيل أكثر

شيري ويجدر | مارس 12 ،2024 | 0

BI / التحليلات تحليلات كوجنوس

يريد المستخدمون لديك استوديو الاستعلام الخاص بهم

مع إصدار IBM Cognos Analytics 12، تم أخيرًا تقديم الإيقاف الذي تم الإعلان عنه منذ فترة طويلة لـ Query Studio و Analysis Studio مع إصدار Cognos Analytics بدون تلك الاستوديوهات. وعلى الرغم من أن هذا لا ينبغي أن يشكل مفاجأة لمعظم الأشخاص العاملين في مجال ...

تفاصيل أكثر

مايك نوريس | فبراير 29، 2024 | 0

BI / التحليلات غير مصنف

هل تأثير تايلور سويفت حقيقي؟

يشير بعض النقاد إلى أنها ترفع أسعار تذاكر Super Bowl. من المتوقع أن تكون مباراة Super Bowl في نهاية هذا الأسبوع واحدة من أكثر ثلاثة أحداث مشاهدة في تاريخ التلفزيون. ربما أكثر من الأرقام القياسية المسجلة في العام الماضي وربما أكثر من قمر عام 3...

تفاصيل أكثر

جون بوير | فبراير 7، 2024 | 0

BI / التحليلات

كتالوجات التحليلات – نجم صاعد في النظام البيئي للتحليلات

مقدمة بصفتي كبير مسؤولي التكنولوجيا (CTO)، فأنا أبحث دائمًا عن التقنيات الناشئة التي تغير الطريقة التي نتعامل بها مع التحليلات. إحدى هذه التقنيات التي لفتت انتباهي على مدى السنوات القليلة الماضية وتحمل وعدًا كبيرًا هي التحليلات...

تفاصيل أكثر

لانس هانكينز | أكتوبر 19، 2023 | 0

عرض المزيد

تحليلات الكذب

تحليلات الكذب

العرض التقديمي متحيز

إظهار مجموعة بيانات محدودة

أظهر الارتباطات غير المترابطة

عرض البيانات بشكل غير دقيق

إظهار البيانات بشكل غير تقليدي

إظهار البيانات مبسطة أكثر من اللازم

البيانات متحيزة

إن مدخلات الذكاء الاصطناعي والتدريب عليها متحيزان

الخوارزميات المنحازة

الناس متحيزون

التحليل نفسه متحيز

معالجة التحيز في التحليلات

بلوق وظائف ذات الصلة

لماذا يعتبر Excel أداة التحليل رقم 1؟

رتب أفكارك: دليل للتنظيف الربيعي للتحليلات

نيويورك ستايل مقابل شيكاغو ستايل بيتزا: نقاش لذيذ

يريد المستخدمون لديك استوديو الاستعلام الخاص بهم

هل تأثير تايلور سويفت حقيقي؟

كتالوجات التحليلات – نجم صاعد في النظام البيئي للتحليلات

احصل على عرض توضيحي

البرمجيات الحرة

الحلول

المنتجات

من نحن

الموارد

اتصل بنا