אתה רוצה איכות נתונים, אבל אתה לא משתמש בנתונים איכותיים

by אוגוסט 24, 2022BI/אנליטיקההערות 0

טיזרים

מתי ראינו נתונים לראשונה?

  1. אמצע המאה העשרים
  2. כיורש של הוולקן, ספוק
  3. 18,000 לפנה"ס
  4. מי יודע?  

ככל שאנו יכולים ללכת בהיסטוריה שהתגלתה אנו מוצאים בני אדם המשתמשים בנתונים. מעניין, הנתונים אפילו קודמים למספרים כתובים. כמה מהדוגמאות המוקדמות ביותר לאחסון נתונים הן מסביבות שנת 18,000 לפני הספירה שבה אבותינו ביבשת אפריקה השתמשו בסימנים על מקלות כצורה של הנהלת חשבונות. גם תשובות 2 ו-4 יתקבלו. עם זאת, זו הייתה אמצע המאה העשרים, כאשר בינה עסקית הוגדרה לראשונה כפי שאנו מבינים אותה כיום. BI לא הפך לנפוץ עד כמעט תחילת המאה ה-21.

היתרונות של איכות נתונים ברורים. 

  • סומך. המשתמשים יבטחו טוב יותר בנתונים. "75% מהמנהלים לא סומכים על הנתונים שלהם"
  • החלטות טובות יותר. תוכל להשתמש בניתוח מול הנתונים כדי לקבל החלטות חכמות יותר.  איכות מידע הוא אחד משני האתגרים הגדולים ביותר העומדים בפני ארגונים המאמצים AI. (האחרת היא מערכי כישורי צוות.)
  • יתרון תחרותי.  איכות הנתונים משפיעה על היעילות התפעולית, שירות הלקוחות, השיווק והשורה התחתונה - הכנסות.
  • הַצלָחָה. איכות הנתונים קשורה מאוד לעסקים הצלחה.

 

6 מרכיבי מפתח של איכות נתונים

אם אתה לא יכול לסמוך על הנתונים שלך, איך אתה יכול לכבד את העצות שלהם?

 

כיום, איכות הנתונים היא קריטית לתקפות ההחלטות שעסקים מקבלים באמצעות כלי BI, ניתוח, למידת מכונה ובינה מלאכותית. במקרה הפשוט ביותר, איכות הנתונים היא נתונים שהם תקפים ומלאים. אולי ראית את הבעיות של איכות הנתונים בכותרות:

במובנים מסוימים - אפילו בעשור השלישי של בינה עסקית - השגה ושמירה על איכות הנתונים היא אפילו קשה יותר. חלק מהאתגרים התורמים למאבק המתמיד בשמירה על איכות הנתונים כוללים:

  • מיזוגים ורכישות המנסים להפגיש מערכות, תהליכים, כלים ונתונים שונים ממספר גופים. 
  • ממגורות פנימיות של נתונים ללא תקנים כדי ליישב את שילוב הנתונים.            
  • אחסון זול הפך את הלכידה והשמירה של כמויות גדולות של נתונים לקלים יותר. אנחנו לוכדים יותר נתונים ממה שאנחנו יכולים לנתח.
  • המורכבות של מערכות הנתונים גדלה. יש יותר נקודות מגע בין מערכת הרישום שבה מוזנים נתונים לבין נקודת הצריכה, בין אם זה מחסן הנתונים או הענן.

על אילו היבטים של נתונים אנחנו מדברים? אילו מאפיינים של הנתונים תורמים לאיכותם? ישנם שישה אלמנטים התורמים לאיכות הנתונים. כל אחד מאלה הוא דיסציפלינות שלמות. 

  • עִתוּי נָכוֹן
    • הנתונים מוכנים וניתנים לשימוש בעת הצורך.
    • הנתונים זמינים לדיווח סוף חודש בשבוע הראשון של החודש העוקב, למשל.
  • תוקף
    • לנתונים יש את סוג הנתונים הנכון במסד הנתונים. טקסט הוא טקסט, תאריכים הם תאריכים ומספרים הם מספרים.
    • הערכים נמצאים בטווחים הצפויים. לדוגמה, בעוד ש-212 מעלות פרנהייט היא טמפרטורה ניתנת למדידה בפועל, היא אינה ערך חוקי עבור טמפרטורה אנושית.  
    • לערכים יש את הפורמט הנכון. ל-1.000000 אין משמעות זהה ל-1.
  • עֲקֵבִיוּת
    • הנתונים עקביים פנימית
    • אין כפילויות של רשומות
  • שלמות
    • היחסים בין הטבלאות אמינים.
    • זה לא השתנה בלי כוונה. ניתן לייחס ערכים למקורותיהם. 
  • שְׁלֵמוּת
    • אין "חורים" בנתונים. לכל הרכיבים של רשומה יש ערכים.  
    • אין ערכי NULL.
  • דיוק
    • נתונים בסביבת הדיווח או האנליטית - מחסן הנתונים, בין אם במקום ובין אם בענן - משקפים את מערכות המקור, או המערכות או הרשומה
    • הנתונים הם ממקורות הניתנים לאימות.

אנו מסכימים, אם כן, שהאתגר של איכות הנתונים הוא ישן כמו הנתונים עצמם, הבעיה נמצאת בכל מקום וחיוני לפתרון. אז, מה עושים עם זה? שקול את תוכנית איכות הנתונים שלך כפרויקט ארוך טווח שאינו נגמר.  

איכות הנתונים מייצגת באופן הדוק עד כמה הנתונים מייצגים את המציאות בצורה מדויקת. למען האמת, נתונים מסוימים חשובים יותר מנתונים אחרים. דעו אילו נתונים הם קריטיים להחלטות עסקיות מוצקות ולהצלחת הארגון. תתחיל שם. תתמקד בנתונים האלה.  

בתור איכות נתונים 101, מאמר זה הוא הקדמה ברמת פרשמן לנושא: ההיסטוריה, אירועים עכשוויים, האתגר, מדוע זו בעיה וסקירה ברמה גבוהה כיצד לטפל באיכות הנתונים בארגון. ספר לנו אם אתה מעוניין להסתכל לעומק על כל אחד מהנושאים האלה במאמר של 200 רמות או ברמת בוגר. אם כן, נצלול עמוק יותר לפרטים הספציפיים בחודשים הקרובים.   

BI/אנליטיקהUncategorized
מדוע Microsoft Excel הוא כלי הניתוח מספר 1
מדוע Excel הוא כלי הניתוח מספר 1?

מדוע Excel הוא כלי הניתוח מספר 1?

  זה זול וקל. תוכנת הגיליון האלקטרוני של Microsoft Excel כבר מותקנת כנראה במחשב של המשתמש העסקי. ומשתמשים רבים היום נחשפו לתוכנת Microsoft Office מאז התיכון או אפילו קודם לכן. התגובה המטומטמת הזו לגבי...

למידע נוסף

BI/אנליטיקהUncategorized
שחרר את התובנות שלך: מדריך לניקוי אביב באנליטיקס

שחרר את התובנות שלך: מדריך לניקוי אביב באנליטיקס

פירוק את התובנות שלך מדריך לניקוי אביב באנליטיקס השנה החדשה מתחילה ברעש גדול; דוחות סוף שנה נוצרים ונבדקים, ואז כולם מתייצבים בלוח זמנים עבודה עקבי. ככל שהימים מתארכים והעצים והפרחים פורחים,...

למידע נוסף

BI/אנליטיקהUncategorized
ניו יורק סטייל נגד שיקגו סטייל פיצה: ויכוח טעים

ניו יורק סטייל נגד שיקגו סטייל פיצה: ויכוח טעים

כשאנחנו מספקים את התשוקה שלנו, כמה דברים יכולים להתחרות בשמחה של פרוסת פיצה לוהטת. הוויכוח בין פיצה בסגנון ניו יורק לשיקגו עורר דיונים נלהבים במשך עשרות שנים. לכל סגנון מאפיינים ייחודיים משלו ומעריצים אדוקים....

למידע נוסף

BI/אנליטיקהCognos Analytics
Cognos Query Studio
המשתמשים שלך רוצים את סטודיו השאילתות שלהם

המשתמשים שלך רוצים את סטודיו השאילתות שלהם

עם שחרורו של IBM Cognos Analytics 12, הוצאה משימוש ממושכת של Query Studio ו-Analysis Studio סופק לבסוף עם גרסה של Cognos Analytics פחות האולפנים האלה. אמנם זה לא אמור להפתיע את רוב האנשים העוסקים ב...

למידע נוסף

BI/אנליטיקהUncategorized
האם אפקט טיילור סוויפט אמיתי?

האם אפקט טיילור סוויפט אמיתי?

כמה מבקרים טוענים שהיא מעלה את מחירי כרטיסי הסופרבול בסוף השבוע הזה הסופרבול צפוי להיות אחד משלושת האירועים הנצפים ביותר בתולדות הטלוויזיה. כנראה יותר ממספרי השיא של השנה שעברה ואולי אפילו יותר מהירח של 3...

למידע נוסף

BI/אנליטיקה
קטלוגים של אנליטיקה - כוכב עולה במערכת האקולוגית של אנליטיקה

קטלוגים של אנליטיקה - כוכב עולה במערכת האקולוגית של אנליטיקה

הקדמה כמנהל טכנולוגיה ראשי (CTO), אני תמיד מחפש טכנולוגיות מתפתחות שמשנות את הדרך בה אנו ניגשים לניתוח. טכנולוגיה אחת כזו שמשכה את תשומת לבי במהלך השנים האחרונות ובעלת הבטחה עצומה היא ה-Analytics...

למידע נוסף