المضايقون
متى رأينا البيانات لأول مرة؟
- منتصف القرن العشرين
- خلفا لفولكان ، سبوك
- شنومك قبل الميلاد
- من تعرف؟
بقدر ما يمكننا العودة إلى التاريخ المكتشف ، نجد البشر يستخدمون البيانات. ومن المثير للاهتمام أن البيانات تسبق الأرقام المكتوبة. تعود بعض أقدم الأمثلة على تخزين البيانات إلى حوالي 18,000 قبل الميلاد حيث استخدم أسلافنا في القارة الأفريقية العلامات على العصي كشكل من أشكال إمساك الدفاتر. سيتم أيضًا قبول الإجابات 2 و 4. كان منتصف القرن العشرين ، على الرغم من ذلك ، عندما تم تعريف ذكاء الأعمال لأول مرة كما نفهمها اليوم. لم ينتشر ذكاء الأعمال حتى مطلع القرن الحادي والعشرين تقريبًا.
فوائد جودة البيانات واضحة.
- الثقة. سوف يثق المستخدمون بشكل أفضل في البيانات. "75٪ من التنفيذيين لا يثقون ببياناتهم"
- قرارات أفضل. ستتمكن من استخدام التحليلات مقابل البيانات لاتخاذ قرارات أكثر ذكاءً. جودة البيانات أحد أكبر تحديين يواجهان المنظمات التي تتبنى الذكاء الاصطناعي. (الآخر هو مجموعات مهارات الموظفين.)
- ميزة تنافسية. تؤثر جودة البيانات على الكفاءة التشغيلية وخدمة العملاء والتسويق والنتيجة النهائية - الإيرادات.
- للنجاح . ترتبط جودة البيانات ارتباطًا وثيقًا بالأعمال تحقيق النجاح .
6 العناصر الأساسية لجودة البيانات
إذا كنت لا تستطيع الوثوق ببياناتك ، فكيف تحترم نصيحتها؟
اليوم ، تعد جودة البيانات أمرًا بالغ الأهمية لصحة القرارات التي تتخذها الشركات باستخدام أدوات ذكاء الأعمال والتحليلات والتعلم الآلي والذكاء الاصطناعي. إن جودة البيانات ، في أبسط صورها ، هي بيانات صحيحة وكاملة. ربما تكون قد شاهدت مشاكل جودة البيانات في العناوين الرئيسية:
- تحسين بيانات COVID-19 من CDC - "على مدار الجائحة ، عملت مراكز السيطرة على الأمراض والوقاية منها على تحسين توقيت واكتمال وجودة البيانات الهامة للاستجابة."
- القمامة في الداخل ، والقمامة خارج ؛ تكتشف هيئة مراقبة المدينة نمطًا مقلقًا من جودة البيانات غير الموثوق بها - "تقرير جديد صادر عن المفتش العام بالإنابة في [شيكاغو] يقول إن" مشكلات جودة البيانات "تؤثر على" موضوعية وفائدة وسلامة "المعلومات المستخدمة لتخصيص الموارد وقياس أداء الموظفين ومراقبة مجموعة من البرامج."
- يجد مكتب المساءلة الحكومية مشكلات جودة البيانات أثناء طرح السجلات الصحية الإلكترونية الخاصة بـ VA - "لم تضمن VA جودة البيانات المنقولة إلى نظام Cerner EHR الجديد."
في بعض النواحي - حتى في العقد الثالث من ذكاء الأعمال - يعد تحقيق جودة البيانات والحفاظ عليها أكثر صعوبة. تتضمن بعض التحديات التي تساهم في النضال المستمر للحفاظ على جودة البيانات ما يلي:
- عمليات الاندماج والاستحواذ التي تحاول الجمع بين الأنظمة والعمليات والأدوات والبيانات المتباينة من كيانات متعددة.
- صوامع بيانات داخلية بدون معايير للتوفيق بين تكامل البيانات.
- سهّل التخزين الرخيص التقاط كميات كبيرة من البيانات والاحتفاظ بها. نحن نلتقط بيانات أكثر مما يمكننا تحليله.
- نما تعقيد أنظمة البيانات. هناك المزيد من نقاط الاتصال بين نظام التسجيل حيث يتم إدخال البيانات ونقطة الاستهلاك ، سواء كان ذلك مستودع البيانات أو السحابة.
ما هي جوانب البيانات التي نتحدث عنها؟ ما هي خصائص البيانات التي تساهم في جودتها؟ هناك ستة عناصر تساهم في جودة البيانات. كل من هذه التخصصات كاملة.
- توقيت
- البيانات جاهزة وقابلة للاستخدام عند الحاجة إليها.
- البيانات متاحة لتقارير نهاية الشهر خلال الأسبوع الأول من الشهر التالي ، على سبيل المثال.
- فعال
- البيانات لها نوع البيانات الصحيح في قاعدة البيانات. النص هو نص والتواريخ هي التواريخ والأرقام هي الأرقام.
- القيم ضمن النطاقات المتوقعة. على سبيل المثال ، في حين أن 212 درجة فهرنهايت هي درجة حرارة فعلية قابلة للقياس ، فهي ليست قيمة صالحة لدرجة حرارة الإنسان.
- القيم بالتنسيق الصحيح. 1.000000 ليس له نفس المعنى مثل 1.
- اتساق
- البيانات متسقة داخليا
- لا توجد نسخ مكررة من السجلات
- النزاهة
- العلاقات بين الجداول موثوقة.
- لم يتم تغييره عن غير قصد. يمكن إرجاع القيم إلى أصولها.
- كمال
- لا توجد "ثغرات" في البيانات. كل عناصر السجل لها قيم.
- لا توجد قيم فارغة.
- دقة
- البيانات في بيئة إعداد التقارير أو التحليل - مستودع البيانات ، سواء في مكان العمل أو في السحابة - تعكس أنظمة المصدر أو الأنظمة أو السجل
- البيانات من مصادر يمكن التحقق منها.
نحن نتفق ، إذن ، على أن تحدي جودة البيانات قديم قدم البيانات نفسها ، والمشكلة موجودة في كل مكان وحيوية لحلها. لذا ماذا نفعل حيال ذلك؟ اعتبر برنامج جودة البيانات الخاص بك مشروعًا طويل الأجل لا ينتهي أبدًا.
تمثل جودة البيانات عن كثب مدى دقة تلك البيانات في تمثيل الواقع. لنكون صادقين ، بعض البيانات أكثر أهمية من البيانات الأخرى. تعرف على البيانات الحاسمة لقرارات العمل القوية ونجاح المؤسسة. ابدأ من هناك. ركز على تلك البيانات.
باعتبارها جودة البيانات 101 ، تعد هذه المقالة مقدمة للموضوع على مستوى الطلاب الجدد: التاريخ ، والأحداث الجارية ، والتحدي ، وسبب كونها مشكلة ، ونظرة عامة عالية المستوى حول كيفية معالجة جودة البيانات داخل المؤسسة. أخبرنا إذا كنت مهتمًا بإلقاء نظرة أعمق على أي من هذه الموضوعات في مقال على مستوى 200 أو على مستوى الدراسات العليا. إذا كان الأمر كذلك ، فسوف نتعمق أكثر في التفاصيل في الأشهر المقبلة.