טיזרים
מתי ראינו נתונים לראשונה?
- אמצע המאה העשרים
- כיורש של הוולקן, ספוק
- 18,000 לפנה"ס
- מי יודע?
ככל שאנו יכולים ללכת בהיסטוריה שהתגלתה אנו מוצאים בני אדם המשתמשים בנתונים. מעניין, הנתונים אפילו קודמים למספרים כתובים. כמה מהדוגמאות המוקדמות ביותר לאחסון נתונים הן מסביבות שנת 18,000 לפני הספירה שבה אבותינו ביבשת אפריקה השתמשו בסימנים על מקלות כצורה של הנהלת חשבונות. גם תשובות 2 ו-4 יתקבלו. עם זאת, זו הייתה אמצע המאה העשרים, כאשר בינה עסקית הוגדרה לראשונה כפי שאנו מבינים אותה כיום. BI לא הפך לנפוץ עד כמעט תחילת המאה ה-21.
היתרונות של איכות נתונים ברורים.
- סומך. המשתמשים יבטחו טוב יותר בנתונים. "75% מהמנהלים לא סומכים על הנתונים שלהם"
- החלטות טובות יותר. תוכל להשתמש בניתוח מול הנתונים כדי לקבל החלטות חכמות יותר. איכות מידע הוא אחד משני האתגרים הגדולים ביותר העומדים בפני ארגונים המאמצים AI. (האחרת היא מערכי כישורי צוות.)
- יתרון תחרותי. איכות הנתונים משפיעה על היעילות התפעולית, שירות הלקוחות, השיווק והשורה התחתונה - הכנסות.
- הַצלָחָה. איכות הנתונים קשורה מאוד לעסקים הצלחה.
6 מרכיבי מפתח של איכות נתונים
אם אתה לא יכול לסמוך על הנתונים שלך, איך אתה יכול לכבד את העצות שלהם?
כיום, איכות הנתונים היא קריטית לתקפות ההחלטות שעסקים מקבלים באמצעות כלי BI, ניתוח, למידת מכונה ובינה מלאכותית. במקרה הפשוט ביותר, איכות הנתונים היא נתונים שהם תקפים ומלאים. אולי ראית את הבעיות של איכות הנתונים בכותרות:
- שיפור הנתונים של COVID-19 של CDC - "במהלך המגיפה, CDC שיפר את העדכניות, השלמות והאיכות של הנתונים הקריטיים לתגובה."
- זבל פנימה, זבל החוצה; City Watchdog מגלה דפוס מטריד של איכות נתונים לא אמינה - "דוח חדש של המפקח הכללי בפועל של [שיקגו] אומר ש"בעיות באיכות הנתונים" משפיעות על "האובייקטיביות, התועלת והשלמות" של המידע המשמש להקצאת משאבים, מדידת ביצועי עובדים ומעקב אחר שורה של תוכניות."
- GAO מוצא בעיות באיכות הנתונים במהלך השקת EHR של VA - "ה-VA לא הבטיחה את איכות הנתונים שהועברו למערכת Cerner EHR החדשה שלה."
במובנים מסוימים - אפילו בעשור השלישי של בינה עסקית - השגה ושמירה על איכות הנתונים היא אפילו קשה יותר. חלק מהאתגרים התורמים למאבק המתמיד בשמירה על איכות הנתונים כוללים:
- מיזוגים ורכישות המנסים להפגיש מערכות, תהליכים, כלים ונתונים שונים ממספר גופים.
- ממגורות פנימיות של נתונים ללא תקנים כדי ליישב את שילוב הנתונים.
- אחסון זול הפך את הלכידה והשמירה של כמויות גדולות של נתונים לקלים יותר. אנחנו לוכדים יותר נתונים ממה שאנחנו יכולים לנתח.
- המורכבות של מערכות הנתונים גדלה. יש יותר נקודות מגע בין מערכת הרישום שבה מוזנים נתונים לבין נקודת הצריכה, בין אם זה מחסן הנתונים או הענן.
על אילו היבטים של נתונים אנחנו מדברים? אילו מאפיינים של הנתונים תורמים לאיכותם? ישנם שישה אלמנטים התורמים לאיכות הנתונים. כל אחד מאלה הוא דיסציפלינות שלמות.
- עִתוּי נָכוֹן
- הנתונים מוכנים וניתנים לשימוש בעת הצורך.
- הנתונים זמינים לדיווח סוף חודש בשבוע הראשון של החודש העוקב, למשל.
- תוקף
- לנתונים יש את סוג הנתונים הנכון במסד הנתונים. טקסט הוא טקסט, תאריכים הם תאריכים ומספרים הם מספרים.
- הערכים נמצאים בטווחים הצפויים. לדוגמה, בעוד ש-212 מעלות פרנהייט היא טמפרטורה ניתנת למדידה בפועל, היא אינה ערך חוקי עבור טמפרטורה אנושית.
- לערכים יש את הפורמט הנכון. ל-1.000000 אין משמעות זהה ל-1.
- עֲקֵבִיוּת
- הנתונים עקביים פנימית
- אין כפילויות של רשומות
- שלמות
- היחסים בין הטבלאות אמינים.
- זה לא השתנה בלי כוונה. ניתן לייחס ערכים למקורותיהם.
- שְׁלֵמוּת
- אין "חורים" בנתונים. לכל הרכיבים של רשומה יש ערכים.
- אין ערכי NULL.
- דיוק
- נתונים בסביבת הדיווח או האנליטית - מחסן הנתונים, בין אם במקום ובין אם בענן - משקפים את מערכות המקור, או המערכות או הרשומה
- הנתונים הם ממקורות הניתנים לאימות.
אנו מסכימים, אם כן, שהאתגר של איכות הנתונים הוא ישן כמו הנתונים עצמם, הבעיה נמצאת בכל מקום וחיוני לפתרון. אז, מה עושים עם זה? שקול את תוכנית איכות הנתונים שלך כפרויקט ארוך טווח שאינו נגמר.
איכות הנתונים מייצגת באופן הדוק עד כמה הנתונים מייצגים את המציאות בצורה מדויקת. למען האמת, נתונים מסוימים חשובים יותר מנתונים אחרים. דעו אילו נתונים הם קריטיים להחלטות עסקיות מוצקות ולהצלחת הארגון. תתחיל שם. תתמקד בנתונים האלה.
בתור איכות נתונים 101, מאמר זה הוא הקדמה ברמת פרשמן לנושא: ההיסטוריה, אירועים עכשוויים, האתגר, מדוע זו בעיה וסקירה ברמה גבוהה כיצד לטפל באיכות הנתונים בארגון. ספר לנו אם אתה מעוניין להסתכל לעומק על כל אחד מהנושאים האלה במאמר של 200 רמות או ברמת בוגר. אם כן, נצלול עמוק יותר לפרטים הספציפיים בחודשים הקרובים.