Искате качество на данните, но не използвате качествени данни

by Август 24, 2022BI/Аналитика0 коментари

Teasers

Кога за първи път видяхме данни?

  1. Средата на ХХ век
  2. Като наследник на Вулкан, Спок
  3. 18,000 BC
  4. Кой знае?  

Доколкото можем да се върнем назад в откритата история, откриваме хора, използващи данни. Интересното е, че данните дори предхождат написаните числа. Някои от най-ранните примери за съхраняване на данни са от около 18,000 2 г. пр. н. е., когато нашите предци на африканския континент са използвали знаци върху пръчици като форма на счетоводство. Отговори 4 и 21 също ще бъдат приети. Беше средата на двадесети век обаче, когато бизнес разузнаването беше дефинирано за първи път така, както го разбираме днес. BI не стана широко разпространен почти до началото на XNUMX век.

Ползите от качеството на данните са очевидни. 

  • Доверие. Потребителите ще се доверят по-добре на данните. “75% от ръководителите не се доверяват на данните си"
  • По-добри решения. Ще можете да използвате анализи срещу данните, за да вземате по-интелигентни решения.  Качество на данните е едно от двете най-големи предизвикателства пред организациите, приемащи AI. (Другото е набор от умения на персонала.)
  • Конкурентно предимство.  Качеството на данните влияе върху оперативната ефективност, обслужването на клиентите, маркетинга и крайния резултат – приходите.
  • успех. Качеството на данните е тясно свързано с бизнеса успех.

 

6 ключови елемента на качеството на данните

Ако не можете да се доверите на данните си, как можете да уважите съветите им?

 

Днес качеството на данните е от решаващо значение за валидността на решенията, които бизнесът взема с BI инструменти, анализи, машинно обучение и изкуствен интелект. Най-просто, качеството на данните са данни, които са валидни и пълни. Може да сте виждали проблемите с качеството на данните в заглавията:

В някои отношения – дори в третото десетилетие на Business Intelligence – постигането и поддържането на качеството на данните е още по-трудно. Някои от предизвикателствата, които допринасят за постоянната борба за поддържане на качеството на данните, включват:

  • Сливания и придобивания, които се опитват да обединят различни системи, процеси, инструменти и данни от множество субекти. 
  • Вътрешни силози от данни без стандарти за съвместяване на интегрирането на данни.            
  • Евтиното съхранение направи улавянето и задържането на големи количества данни по-лесно. Ние събираме повече данни, отколкото можем да анализираме.
  • Сложността на системите за данни нарасна. Има повече допирни точки между системата за запис, където се въвеждат данните, и точката на потребление, независимо дали това е хранилище за данни или облак.

За какви аспекти на данните говорим? Какви свойства на данните допринасят за тяхното качество? Има шест елемента, които допринасят за качеството на данните. Всяка от тях е цели дисциплини. 

  • навременност
    • Данните са готови и могат да се използват, когато са необходими.
    • Данните са достъпни за отчитане в края на месеца, например през първата седмица на следващия месец.
  • валидност
    • Данните имат правилния тип данни в базата данни. Текстът е текст, датите са дати, а числата са числа.
    • Стойностите са в очакваните граници. Например, докато 212 градуса по Фаренхайт е действителна измерима температура, това не е валидна стойност за човешка температура.  
    • Стойностите са в правилния формат. 1.000000 няма същото значение като 1.
  • Съгласуваност
    • Данните са вътрешно последователни
    • Няма дубликати на записи
  • интегритет
    • Връзките между таблиците са надеждни.
    • Не се променя неволно. Ценностите могат да бъдат проследени до техния произход. 
  • пълнота
    • Няма „дупки“ в данните. Всички елементи на запис имат стойности.  
    • Няма стойности NULL.
  • Точност
    • Данните в отчетната или аналитичната среда – складът на данни, независимо дали е локален или в облака – отразява изходните системи, или системи, или запис
    • Данните са от проверими източници.

Съгласни сме, следователно, че предизвикателството за качеството на данните е толкова старо, колкото и самите данни, проблемът е повсеместен и жизненоважен за решаване. И така, какво да правим по въпроса? Гледайте на вашата програма за качество на данните като на дългосрочен, безкраен проект.  

Качеството на данните тясно представя колко точно тези данни представят реалността. Честно казано, някои данни са по-важни от други. Знайте кои данни са от решаващо значение за стабилните бизнес решения и успеха на организацията. Започнете оттам. Фокусирайте се върху тези данни.  

Като Data Quality 101, тази статия е въведение на ниво първокурсник в темата: историята, текущите събития, предизвикателството, защо това е проблем и преглед на високо ниво за това как да се обърне внимание на качеството на данните в една организация. Уведомете ни, ако проявявате интерес да разгледате по-задълбочено някоя от тези теми в статия за ниво 200 или за висше образование. Ако е така, ще се потопим в подробностите през следващите месеци.   

BI/АналитикаБез категория
Защо Microsoft Excel е инструмент №1 за анализ
Защо Excel е инструмент №1 за анализ?

Защо Excel е инструмент №1 за анализ?

  Това е евтино и лесно. Софтуерът за електронни таблици Microsoft Excel вероятно вече е инсталиран на компютъра на бизнес потребителя. И много потребители днес са били изложени на софтуера на Microsoft Office от гимназията или дори по-рано. Този дрезгав отговор на...

Вижте повече

BI/АналитикаБез категория
Разчистете своите прозрения: Ръководство за пролетно почистване на Google Анализ

Разчистете своите прозрения: Ръководство за пролетно почистване на Google Анализ

Разчистете вашите прозрения Ръководство за анализ Пролетно почистване Новата година започва с гръм и трясък; Докладите в края на годината се създават и разглеждат внимателно и след това всеки се установява в последователен работен график. Когато дните стават по-дълги и дърветата и цветята цъфтят,...

Вижте повече

BI/АналитикаБез категория
NY Style срещу Chicago Style Pizza: Вкусен дебат

NY Style срещу Chicago Style Pizza: Вкусен дебат

Когато задоволяваме желанията си, малко неща могат да съперничат на насладата от горещо парче пица. Дебатът между пицата в стил Ню Йорк и този в Чикаго предизвиква страстни дискусии от десетилетия. Всеки стил има свои уникални характеристики и предани фенове....

Вижте повече

BI/АналитикаАнализ на Cognos
Студио за заявки Cognos
Вашите потребители искат своето студио за заявки

Вашите потребители искат своето студио за заявки

С пускането на IBM Cognos Analytics 12, отдавна обявеното оттегляне на Query Studio и Analysis Studio най-накрая беше доставено с версия на Cognos Analytics без тези студия. Въпреки че това не трябва да е изненада за повечето хора, ангажирани с...

Вижте повече

BI/АналитикаБез категория
Реален ли е ефектът на Тейлър Суифт?

Реален ли е ефектът на Тейлър Суифт?

Някои критици предполагат, че тя повишава цените на билетите за Super Bowl Този уикенд се очаква Super Bowl да бъде едно от 3-те най-гледани събития в историята на телевизията. Вероятно повече от миналогодишните рекордни числа и може би дори повече от луната през 1969 г.

Вижте повече

BI/Аналитика
Каталози на Анализ – Изгряваща звезда в екосистемата на Анализ

Каталози на Анализ – Изгряваща звезда в екосистемата на Анализ

Въведение Като главен технологичен директор (CTO) винаги съм нащрек за нововъзникващи технологии, които променят начина, по който подхождаме към анализа. Една такава технология, която привлече вниманието ми през последните няколко години и има огромно обещание, е Analytics...

Вижте повече