Сакате квалитет на податоци, но не користите квалитетни податоци

by Август 24, 2022БИ/Аналитика0 коментари

закачки

Кога првпат видовме податоци?

  1. Средината на дваесеттиот век
  2. Како наследник на Вулкан, Спок
  3. 18,000 п.н.е.
  4. Кој знае?  

Колку што можеме да одиме наназад во откриената историја, наоѓаме луѓе кои користат податоци. Интересно, податоците дури и претходат на напишаните броеви. Некои од најраните примери за складирање податоци се од околу 18,000 п.н.е., каде што нашите предци на африканскиот континент користеле ознаки на стапчиња како форма на книговодство. Одговорите 2 и 4 исто така ќе бидат прифатени. Сепак, беше средината на дваесеттиот век, кога деловната интелигенција за прв пат беше дефинирана како што ја разбираме денес. БИ не стана широко распространета речиси до крајот на 21 век.

Придобивките од квалитетот на податоците се очигледни. 

  • Верувајте. Корисниците подобро ќе им веруваат на податоците. “75% од директорите не им веруваат на нивните податоци"
  • Подобри одлуки. Ќе можете да користите аналитика против податоците за да донесувате попаметни одлуки.  Квалитет на податоци е еден од двата најголеми предизвици со кои се соочуваат организациите кои прифаќаат вештачка интелигенција. (Другото се групи на вештини на персоналот.)
  • Конкурентна предност.  Квалитетот на податоците влијае на оперативната ефикасност, услугите на клиентите, маркетингот и крајната линија - приходите.
  • Успех. Квалитетот на податоците е многу поврзан со бизнисот успех.

 

6 Клучни елементи на квалитетот на податоците

Ако не можете да им верувате на вашите податоци, како можете да ги почитувате нивните совети?

 

Денес, квалитетот на податоците е критичен за валидноста на одлуките што ги носат бизнисите со алатките за БИ, аналитиката, машинското учење и вештачката интелигенција. Наједноставно, квалитетот на податоците е податок кој е валиден и целосен. Можеби сте ги виделе проблемите со квалитетот на податоците во насловите:

На некој начин – дури и во третата деценија на деловната интелигенција – постигнувањето и одржувањето на квалитетот на податоците е уште потешко. Некои од предизвиците кои придонесуваат за постојана борба за одржување на квалитетот на податоците вклучуваат:

  • Спојувања и аквизиции кои се обидуваат да спојат различни системи, процеси, алатки и податоци од повеќе субјекти. 
  • Внатрешни силоси на податоци без стандарди за усогласување на интеграцијата на податоците.            
  • Евтиното складирање го олесни снимањето и задржувањето на големи количини на податоци. Добиваме повеќе податоци отколку што можеме да анализираме.
  • Сложеноста на системите за податоци порасна. Има повеќе допирни точки помеѓу системот за евиденција каде се внесуваат податоците и точката на потрошувачка, без разлика дали тоа е складиштето на податоци или облакот.

За кои аспекти на податоците зборуваме? Кои својства на податоците придонесуваат за нивниот квалитет? Постојат шест елементи кои придонесуваат за квалитетот на податоците. Секоја од овие се цели дисциплини. 

  • Навременост
    • Податоците се подготвени и употребливи кога се потребни.
    • Податоците се достапни за известување на крајот на месецот, на пример, во првата недела од следниот месец.
  • валидност
    • Податоците го имаат точниот тип на податоци во базата на податоци. Текстот е текст, датумите се датуми и броевите се броеви.
    • Вредностите се во очекуваните граници. На пример, додека 212 степени Фаренхајт е вистинска мерлива температура, тоа не е валидна вредност за човечка температура.  
    • Вредностите имаат правилен формат. 1.000000 го нема истото значење како 1.
  • доследност
    • Податоците се внатрешно конзистентни
    • Нема дупликати на записи
  • Интегритет
    • Односите меѓу табелите се сигурни.
    • Не се менува ненамерно. Вредностите може да се следат до нивното потекло. 
  • Комплетност
    • Нема „дупки“ во податоците. Сите елементи на записот имаат вредности.  
    • Нема NULL вредности.
  • точност
    • Податоците во известувачката или аналитичката средина - складиштето на податоци, без разлика дали е на prem или во облакот - ги одразуваат изворните системи, или системи или записи
    • Податоците се од проверливи извори.

Значи, се согласуваме дека предизвикот за квалитетот на податоците е стар колку и самите податоци, проблемот е сеприсутен и витален за решавање. Значи, што правиме за тоа? Сметајте ја вашата програма за квалитет на податоци како долгорочен, бесконечен проект.  

Квалитетот на податоците тесно покажува колку точно тие податоци ја претставуваат реалноста. Да бидам искрен, некои податоци се поважни од другите податоци. Знајте кои податоци се клучни за цврсти деловни одлуки и успехот на организацијата. Започнете таму. Фокусирајте се на тие податоци.  

Како квалитет на податоци 101, овој напис е вовед на ниво на бруцош за темата: историјата, тековните настани, предизвикот, зошто тоа е проблем и преглед на високо ниво за тоа како да се реши квалитетот на податоците во организацијата. Кажете ни ако сте заинтересирани да разгледате подлабоко некоја од овие теми во статија од 200 нивоа или на ниво на постдипломски студии. Ако е така, ќе навлеземе подлабоко во спецификите во наредните месеци.   

БИ/АналитикаНекатегоризирано
Зошто Microsoft Excel е алатката број 1 за аналитика
Зошто Excel е алатката за аналитика број 1?

Зошто Excel е алатката за аналитика број 1?

  Тоа е ефтино и лесно. Софтверот за табеларни пресметки на Microsoft Excel веројатно е веќе инсталиран на компјутерот на деловниот корисник. И многу корисници денес се изложени на софтверот на Microsoft Office уште од средно училиште или уште порано. Овој непредвидлив одговор за ...

Прочитај повеќе

БИ/АналитикаНекатегоризирано
Расчистете ги вашите увиди: Водич за пролетно чистење на анализите

Расчистете ги вашите увиди: Водич за пролетно чистење на анализите

Расчистете ги вашите увиди Водич за пролетно чистење на аналитика Новата година започнува со жестоко; Извештаите за крајот на годината се креираат и детално се проверуваат, а потоа сите се населуваат во конзистентен распоред за работа. Како што деновите стануваат подолги, а дрвјата и цвеќињата цветаат,...

Прочитај повеќе

БИ/АналитикаНекатегоризирано
Њу Стил против пица во Чикаго: вкусна дебата

Њу Стил против пица во Чикаго: вкусна дебата

Кога ги задоволуваме нашите желби, малку работи можат да се спротивстават на радоста на жешкото парче пица. Дебатата меѓу пицата во стилот на Њујорк и во стилот на Чикаго предизвикува страсни дискусии со децении. Секој стил има свои уникатни карактеристики и посветени обожаватели....

Прочитај повеќе

БИ/АналитикаCognos Analytics
Cognos Query Studio
Вашите корисници го сакаат нивното студио за прашања

Вашите корисници го сакаат нивното студио за прашања

Со објавувањето на IBM Cognos Analytics 12, долго најавуваното укинување на Query Studio и Analysis Studio конечно беше испорачано со верзија на Cognos Analytics минус тие студија. Иако ова не треба да биде изненадување за повеќето луѓе ангажирани во ...

Прочитај повеќе

БИ/АналитикаНекатегоризирано
Дали ефектот на Тејлор Свифт е реален?

Дали ефектот на Тејлор Свифт е реален?

Некои критичари сугерираат дека таа ги зголемува цените на билетите за Супер Боул Овој викенд Супер Боул се очекува да биде еден од првите 3 најгледани настани во историјата на телевизијата. Веројатно повеќе од минатогодишните рекордни бројки, а можеби дури и повеќе од месечината во 1969 година...

Прочитај повеќе

БИ/Аналитика
Каталози за аналитика – Ѕвезда во подем во екосистемот за аналитика

Каталози за аналитика – Ѕвезда во подем во екосистемот за аналитика

Вовед Како главен директор за технологија (CTO), секогаш сум во потрага по новите технологии кои го трансформираат начинот на кој пристапуваме кон аналитиката. Една таква технологија која ми го привлече вниманието во последните неколку години и ветува огромно е Аналитика...

Прочитај повеќе