شما کیفیت داده می خواهید، اما از داده های با کیفیت استفاده نمی کنید

by اوت 24، 2022BI/Analyticsنظر 0

تیزرها

اولین بار چه زمانی داده ها را دیدیم؟

  1. اواسط قرن بیستم
  2. اسپاک به عنوان جانشین Vulcan
  3. 18,000 BC
  4. چه کسی می داند؟  

تا آنجا که می توانیم در تاریخ کشف شده برگردیم، انسان هایی را می یابیم که از داده ها استفاده می کنند. جالب اینجاست که داده ها حتی مقدم بر اعداد نوشته شده هستند. برخی از اولین نمونه‌های ذخیره‌سازی داده‌ها مربوط به حدود 18,000 سال قبل از میلاد است که در آن اجداد ما در قاره آفریقا از علامت‌هایی بر روی چوب‌ها به عنوان شکلی از حسابداری استفاده می‌کردند. پاسخ 2 و 4 نیز پذیرفته می شود. با این حال، اواسط قرن بیستم بود، زمانی که هوش تجاری برای اولین بار به گونه‌ای که ما امروز می‌فهمیم تعریف شد. BI تقریباً تا اوایل قرن بیست و یکم گسترده نشد.

مزایای کیفیت داده آشکار است. 

  • اعتماد. کاربران بهتر به داده ها اعتماد خواهند کرد. "75 درصد از مدیران به داده های خود اعتماد ندارند"
  • تصمیمات بهتر. شما می توانید از تجزیه و تحلیل در برابر داده ها برای تصمیم گیری هوشمندانه استفاده کنید.  کیفیت داده یکی از دو چالش بزرگ پیش روی سازمان هایی است که هوش مصنوعی را اتخاذ می کنند. (دیگر مجموعه مهارت های کارکنان است.)
  • مزیت رقابتی.  کیفیت داده ها بر کارایی عملیاتی، خدمات مشتری، بازاریابی و درآمد نهایی تأثیر می گذارد.
  • موفقیت. کیفیت داده ها به شدت با تجارت مرتبط است موفقیت.

 

6 عنصر کلیدی کیفیت داده ها

اگر نمی توانید به داده های خود اعتماد کنید، چگونه می توانید به توصیه های آن احترام بگذارید؟

 

امروزه، کیفیت داده ها برای اعتبار تصمیماتی که کسب و کارها با ابزارهای BI، تجزیه و تحلیل، یادگیری ماشین و هوش مصنوعی می گیرند، حیاتی است. در ساده ترین حالت، کیفیت داده، داده ای است که معتبر و کامل باشد. ممکن است مشکلات کیفیت داده ها را در سرفصل ها دیده باشید:

از برخی جهات - حتی در دهه سوم هوش تجاری - دستیابی و حفظ کیفیت داده ها حتی دشوارتر است. برخی از چالش هایی که به مبارزه مداوم برای حفظ کیفیت داده کمک می کند عبارتند از:

  • ادغام‌ها و اکتساب‌هایی که سعی می‌کنند سیستم‌ها، فرآیندها، ابزارها و داده‌های متفاوت را از چندین نهاد گرد هم بیاورند. 
  • سیلوهای داخلی داده بدون استانداردهایی برای تطبیق ادغام داده ها.            
  • ذخیره سازی ارزان، ضبط و نگهداری حجم زیادی از داده ها را آسان تر کرده است. ما بیشتر از آن چیزی که بتوانیم تجزیه و تحلیل کنیم، داده ها را جمع آوری می کنیم.
  • پیچیدگی سیستم های داده افزایش یافته است. نقاط تماس بیشتری بین سیستم ثبت که در آن داده ها وارد می شود و نقطه مصرف وجود دارد، خواه انبار داده باشد یا ابر.

در مورد چه جنبه هایی از داده ها صحبت می کنیم؟ چه ویژگی هایی از داده ها به کیفیت آن کمک می کند؟ شش عنصر وجود دارد که به کیفیت داده ها کمک می کند. هر کدام از اینها رشته های کاملی هستند. 

  • به موقع بودن
    • داده ها در صورت نیاز آماده و قابل استفاده هستند.
    • برای مثال، داده ها برای گزارش پایان ماه در هفته اول ماه بعد در دسترس هستند.
  • اعتبار
    • داده ها دارای نوع داده صحیح در پایگاه داده هستند. متن متن است، تاریخ ها تاریخ و اعداد اعداد هستند.
    • مقادیر در محدوده مورد انتظار هستند. به عنوان مثال، در حالی که 212 درجه فارنهایت یک دمای واقعی قابل اندازه گیری است، برای دمای انسان یک مقدار معتبر نیست.  
    • مقادیر فرمت صحیحی دارند. 1.000000 همان معنای 1 را ندارد.
  • ثبات
    • داده ها از نظر داخلی سازگار است
    • هیچ رکورد تکراری وجود ندارد
  • تمامیت
    • روابط بین جداول قابل اعتماد است.
    • ناخواسته تغییر نکرده است. ارزش ها را می توان در منشأ آنها ردیابی کرد. 
  • کمال
    • هیچ "حفره ای" در داده ها وجود ندارد. همه عناصر یک رکورد دارای مقادیر هستند.  
    • هیچ مقدار NULL وجود ندارد.
  • دقت
    • داده‌ها در محیط گزارش‌دهی یا تحلیلی - انبار داده‌ها، چه در حالت اولیه یا در فضای ابری - منعکس‌کننده سیستم‌ها، سیستم‌ها یا رکوردهای منبع هستند.
    • داده ها از منابع قابل تایید است.

پس ما موافقیم که چالش کیفیت داده به اندازه خود داده قدیمی است، مشکل همه جا حاضر است و حل آن حیاتی است. بنابراین، ما در مورد آن چه کنیم؟ برنامه کیفیت داده خود را به عنوان یک پروژه بلند مدت و بی پایان در نظر بگیرید.  

کیفیت داده ها دقیقاً نشان می دهد که آن داده ها چقدر واقعیت را نشان می دهند. صادقانه بگویم، برخی از داده ها مهم تر از داده های دیگر هستند. بدانید چه داده هایی برای تصمیم گیری های تجاری محکم و موفقیت سازمان حیاتی هستند. از آنجا شروع کنید. روی آن داده ها تمرکز کنید.  

به عنوان کیفیت داده 101، این مقاله مقدمه ای در سطح دانشجوی سال اول برای این موضوع است: تاریخچه، رویدادهای جاری، چالش، چرایی مشکل و یک نمای کلی از نحوه پرداختن به کیفیت داده در یک سازمان. اگر مایلید در یک مقاله در سطح 200 یا سطح فارغ التحصیلان به بررسی عمیق تری به هر یک از این موضوعات بپردازید، به ما اطلاع دهید. اگر چنین است، در ماه‌های آینده به جزئیات بیشتر خواهیم پرداخت.   

BI/Analyticsدسته بندی نشده
چرا مایکروسافت اکسل ابزار تجزیه و تحلیل شماره 1 است؟
چرا اکسل ابزار تحلیل شماره 1 است؟

چرا اکسل ابزار تحلیل شماره 1 است؟

  این ارزان و آسان است. نرم افزار صفحه گسترده مایکروسافت اکسل احتمالاً از قبل بر روی رایانه کاربر تجاری نصب شده است. و بسیاری از کاربران امروزه از دوران دبیرستان یا حتی قبل از آن در معرض نرم افزار مایکروسافت آفیس قرار گرفته اند. این پاسخ زانو تند به ...

ادامه مطلب

BI/Analyticsدسته بندی نشده
بینش خود را شلوغ کنید: راهنمای تجزیه و تحلیل بهار تمیز کردن

بینش خود را شلوغ کنید: راهنمای تجزیه و تحلیل بهار تمیز کردن

بینش خود را شلوغ کنید راهنمای تجزیه و تحلیل تمیز کردن بهاره سال جدید با یک انفجار آغاز می شود. گزارش‌های پایان سال ایجاد و بررسی می‌شوند، و سپس همه در یک برنامه کاری ثابت قرار می‌گیرند. با طولانی شدن روزها و شکوفه دادن درختان و گل ها،...

ادامه مطلب

BI/Analyticsدسته بندی نشده
پیتزای سبک نیویورک در مقابل شیکاگو: مناظره ای خوشمزه

پیتزای سبک نیویورک در مقابل شیکاگو: مناظره ای خوشمزه

هنگام ارضای هوس ما، چیزهای کمی می توانند با لذت یک تکه داغ پیتزا رقابت کنند. بحث بین پیتزا به سبک نیویورک و شیکاگو برای دهه ها بحث های پرشور را برانگیخته است. هر سبکی ویژگی های منحصر به فرد و طرفداران فداکار خود را دارد.

ادامه مطلب

BI/AnalyticsCognos Analytics
Cognos Query Studio
کاربران شما Query Studio خود را می خواهند

کاربران شما Query Studio خود را می خواهند

با انتشار IBM Cognos Analytics 12، لغو مدت‌ها اعلام شده Query Studio و Analysis Studio سرانجام با نسخه‌ای از Cognos Analytics منهای آن استودیوها ارائه شد. در حالی که این نباید برای بسیاری از افرادی که درگیر این موضوع هستند تعجب آور باشد...

ادامه مطلب

BI/Analyticsدسته بندی نشده
آیا اثر تیلور سویفت واقعی است؟

آیا اثر تیلور سویفت واقعی است؟

برخی از منتقدان پیشنهاد می‌کنند که او قیمت‌های بلیت Super Bowl را بالا می‌برد. انتظار می‌رود Super Bowl این آخر هفته یکی از 3 رویداد برتر تاریخ تلویزیون باشد. احتمالاً بیشتر از رکوردهای سال گذشته و شاید حتی بیشتر از ماه سال 1969 ...

ادامه مطلب

BI/Analytics
کاتالوگ های تجزیه و تحلیل - یک ستاره در حال ظهور در اکوسیستم تجزیه و تحلیل

کاتالوگ های تجزیه و تحلیل - یک ستاره در حال ظهور در اکوسیستم تجزیه و تحلیل

مقدمه به عنوان یک مدیر ارشد فناوری (CTO)، من همیشه به دنبال فناوری های نوظهوری هستم که رویکرد ما به تحلیل را تغییر می دهد. یکی از این فناوری‌ها که در چند سال گذشته توجه من را به خود جلب کرده و نویدبخش است، Analytics است...

ادامه مطلب