Դասավանդողներ
Ե՞րբ մենք առաջին անգամ տեսանք տվյալներ:
- Քսաներորդ դարի կեսերը
- Որպես Vulcan-ի իրավահաջորդ՝ Սպոկը
- 18,000 BC
- Ով գիտի?
Քանի դեռ մենք կարող ենք գնալ հայտնաբերված պատմության մեջ, մենք գտնում ենք, որ մարդիկ օգտագործում են տվյալներ: Հետաքրքիր է, որ տվյալները նույնիսկ նախորդում են գրավոր թվերին: Տվյալների պահպանման ամենավաղ օրինակները վերաբերում են մոտավորապես մ.թ.ա. 18,000 թվականին, որտեղ մեր նախնիները Աֆրիկյան մայրցամաքում օգտագործում էին փայտիկների վրա դրված նշանները որպես հաշվապահական հաշվառման ձև: 2-րդ և 4-րդ պատասխանները նույնպես կընդունվեն։ Այնուամենայնիվ, քսաներորդ դարի կեսերն էին, երբ բիզնես ինտելեկտը առաջին անգամ սահմանվեց այնպես, ինչպես մենք հասկանում ենք այն այսօր: BI-ն լայն տարածում գտավ մինչև 21-րդ դարի վերջը:
Տվյալների որակի առավելություններն ակնհայտ են.
- Վստահեք. Օգտագործողները ավելի լավ կվստահեն տվյալներին: «Գործադիրների 75%-ը չի վստահում իրենց տվյալներին"
- Ավելի լավ որոշումներ. Դուք կկարողանաք օգտագործել վերլուծական տվյալները տվյալների դեմ՝ ավելի խելացի որոշումներ կայացնելու համար: Տվյալների որակը AI ընդունող կազմակերպությունների առջեւ ծառացած երկու ամենամեծ մարտահրավերներից մեկն է: (Մյուսը անձնակազմի հմտությունների հավաքածուն է):
- Մրցակցային առավելություն. Տվյալների որակը ազդում է գործառնական արդյունավետության, հաճախորդների սպասարկման, շուկայավարման և վերջնական գծի վրա՝ եկամուտների վրա:
- Հաջողություն. Տվյալների որակը մեծապես կապված է բիզնեսի հետ հաջողություն.
Տվյալների որակի 6 հիմնական տարրեր
Եթե չեք կարող վստահել ձեր տվյալներին, ինչպե՞ս կարող եք հարգել դրանց խորհուրդները:
Այսօր տվյալների որակը չափազանց կարևոր է այն որոշումների վավերականության համար, որոնք ձեռնարկությունները կայացնում են BI գործիքների, վերլուծության, մեքենայական ուսուցման և արհեստական ինտելեկտի միջոցով: Ամենապարզ դեպքում տվյալների որակը վավեր և ամբողջական տվյալ է: Դուք կարող եք տեսել տվյալների որակի խնդիրները վերնագրերում.
- CDC-ի COVID-19 տվյալների բարելավում – «Համաճարակի ընթացքում CDC-ն բարելավում է արձագանքման համար կարևոր տվյալների արդիականությունը, ամբողջականությունը և որակը»:
- Աղբի մեջ, աղբը դուրս; Քաղաքային դիտորդը հայտնաբերել է տվյալների անվստահելի որակի անհանգստացնող օրինակ – «[Չիկագոյի] գլխավոր տեսուչի պաշտոնակատարի նոր զեկույցում ասվում է, որ «տվյալների որակի խնդիրները» ազդում են ռեսուրսների բաշխման, աշխատակիցների կատարողականը չափելու և մի շարք ծրագրերի մոնիտորինգի համար օգտագործվող տեղեկատվության «օբյեկտիվության, օգտակարության և ամբողջականության» վրա։
- GAO-ն տվյալների որակի հետ կապված խնդիրներ է գտնում VA-ի EHR-ի ներդրման ժամանակ – «VA-ն չի ապահովել տվյալների որակը, որը տեղափոխվում է իր նոր Cerner EHR համակարգ»:
Որոշ առումներով, նույնիսկ Բիզնեսի հետախուզության երրորդ տասնամյակում, տվյալների որակի ձեռքբերումն ու պահպանումը նույնիսկ ավելի դժվար է: Որոշ մարտահրավերներ, որոնք նպաստում են տվյալների որակի պահպանման մշտական պայքարին, ներառում են.
- Միաձուլումներ և ձեռքբերումներ, որոնք փորձում են միավորել տարբեր համակարգեր, գործընթացներ, գործիքներ և տվյալներ բազմաթիվ կազմակերպություններից:
- Տվյալների ներքին սիլոսներ՝ առանց տվյալների ինտեգրմանը համապատասխանող ստանդարտների:
- Էժան պահեստավորումը հեշտացրել է մեծ քանակությամբ տվյալների հավաքումն ու պահպանումը: Մենք ավելի շատ տվյալներ ենք հավաքում, քան կարող ենք վերլուծել:
- Տվյալների համակարգերի բարդությունն աճել է: Գրառման համակարգի, որտեղ տվյալները մուտքագրվում են, և սպառման կետի միջև կան ավելի շատ հպման կետեր, լինի դա տվյալների պահեստը, թե ամպը:
Տվյալների ո՞ր ասպեկտների մասին է խոսքը: Տվյալների ո՞ր հատկություններն են նպաստում դրա որակին: Կան վեց տարրեր, որոնք նպաստում են տվյալների որակին: Սրանցից յուրաքանչյուրը ամբողջ առարկաներ են:
- Ժամանակայնություն
- Տվյալները պատրաստ են և օգտագործելի, երբ դրանք անհրաժեշտ լինեն:
- Տվյալները հասանելի են, օրինակ, հաջորդ ամսվա առաջին շաբաթվա ընթացքում ամսվա վերջի հաշվետվությունների համար:
- Վավերականությունը
- Տվյալները տվյալների բազայում ունեն տվյալների ճիշտ տեսակը: Տեքստը տեքստ է, ամսաթվերը՝ ամսաթվեր, իսկ թվերը՝ թվեր:
- Արժեքները ակնկալվող միջակայքում են: Օրինակ, թեև 212 աստիճան ֆարենհայթը իրական չափելի ջերմաստիճան է, այն վավեր արժեք չէ մարդու ջերմաստիճանի համար:
- Արժեքներն ունեն ճիշտ ձևաչափ: 1.000000-ը նույն նշանակությունը չունի, ինչ 1-ը:
- կայունություն
- Տվյալները ներքին համահունչ են
- Գրառումների կրկնօրինակներ չկան
- ամբողջություն
- Սեղանների միջև հարաբերությունները հուսալի են:
- Այն ակամա փոխված չէ։ Արժեքները կարելի է հետևել դրանց ծագմանը:
- ամբողջականություն
- Տվյալների մեջ «անցքեր» չկան։ Գրառման բոլոր տարրերն ունեն արժեքներ:
- NULL արժեքներ չկան:
- Ճշգրտություն
- Տվյալները հաշվետվական կամ վերլուծական միջավայրում` տվյալների պահեստում, անկախ նրանից, թե պրեմիում, թե ամպում, արտացոլում են աղբյուրի համակարգերը, համակարգերը կամ գրառումները:
- Տվյալները ստուգելի աղբյուրներից են:
Այսպիսով, մենք համաձայն ենք, որ տվյալների որակի մարտահրավերը նույնքան հին է, որքան տվյալները, խնդիրը ամենուր տարածված է և կենսականորեն լուծելու համար: Այսպիսով, ի՞նչ ենք մենք անում դրա դեմ: Ձեր տվյալների որակի ծրագիրը դիտարկեք որպես երկարաժամկետ, անվերջ նախագիծ:
Տվյալների որակը սերտորեն ցույց է տալիս, թե որքան ճշգրիտ են այդ տվյալները ներկայացնում իրականությունը: Անկեղծ ասած, որոշ տվյալներ ավելի կարևոր են, քան մյուս տվյալները: Իմացեք, թե ինչ տվյալներ են կարևոր բիզնես որոշումների և կազմակերպության հաջողության համար: Սկսեք այնտեղից: Կենտրոնացեք այդ տվյալների վրա:
Որպես Տվյալների որակ 101, այս հոդվածը առաջին կուրսեցիների մակարդակի ներածություն է թեմայի վերաբերյալ. պատմություն, ընթացիկ իրադարձություններ, մարտահրավեր, ինչու է դա խնդիր և բարձր մակարդակի ակնարկ այն մասին, թե ինչպես կարելի է անդրադառնալ կազմակերպության ներսում տվյալների որակին: Տեղեկացրեք մեզ, եթե հետաքրքրված եք այս թեմաներից որևէ մեկին ավելի խորը ուսումնասիրել 200 մակարդակի կամ ավարտական մակարդակի հոդվածում: Եթե այո, ապա առաջիկա ամիսներին մենք կխորանանք մանրամասների մեջ: