მკვლევარები
როდის ვნახეთ პირველად მონაცემები?
- მეოცე საუკუნის შუა ხანები
- როგორც ვულკანის მემკვიდრე, სპოკი
- 18,000 ძვ
- Ვინ იცის?
რამდენადაც შეგვიძლია აღმოჩენილ ისტორიაში წასვლა, ჩვენ ვპოულობთ ადამიანებს, რომლებიც იყენებენ მონაცემებს. საინტერესოა, რომ მონაცემები წინ უსწრებს დაწერილ ციფრებს. მონაცემთა შენახვის ზოგიერთი ადრეული მაგალითია დაახლოებით 18,000 წ. წ.-მდე, სადაც ჩვენი წინაპრები აფრიკის კონტინენტზე იყენებდნენ ნიშანს ჯოხებზე, როგორც ბუღალტრული აღრიცხვის ფორმას. ასევე მიიღება 2 და 4 პასუხები. თუმცა, ეს იყო მეოცე საუკუნის შუა რიცხვები, როდესაც ბიზნეს დაზვერვა პირველად განისაზღვრა ისე, როგორც დღეს გვესმის. BI არ გახდა ფართოდ გავრცელებული 21-ე საუკუნის დასასრულამდე.
მონაცემთა ხარისხის სარგებელი აშკარაა.
- ენდეთ. მომხმარებლები უკეთესად ენდობიან მონაცემებს. "აღმასრულებელთა 75% არ ენდობა მათ მონაცემებს"
- უკეთესი გადაწყვეტილებები. თქვენ შეძლებთ გამოიყენოთ ანალიტიკა მონაცემების წინააღმდეგ უფრო ჭკვიანური გადაწყვეტილებების მისაღებად. მონაცემთა ხარისხი ეს არის ერთ-ერთი ყველაზე დიდი გამოწვევა, რომლის წინაშეც დგას ორგანიზაციები, რომლებიც იღებენ ხელოვნურ ინტელექტს. (მეორე არის პერსონალის უნარების ნაკრები.)
- Კონკურენტული უპირატესობა. მონაცემთა ხარისხი გავლენას ახდენს ოპერაციულ ეფექტურობაზე, მომხმარებელთა მომსახურებაზე, მარკეტინგზე და საბოლოო ხაზზე - შემოსავალზე.
- წარმატება. მონაცემთა ხარისხი ძლიერ არის დაკავშირებული ბიზნესთან წარმატება.
მონაცემთა ხარისხის 6 ძირითადი ელემენტი
თუ არ შეგიძლიათ ენდოთ თქვენს მონაცემებს, როგორ შეგიძლიათ პატივი სცეთ მის რჩევას?
დღესდღეობით, მონაცემთა ხარისხი გადამწყვეტია იმ გადაწყვეტილებების მართებულობისთვის, რომლებსაც ბიზნესი იღებს BI ინსტრუმენტებით, ანალიტიკით, მანქანური სწავლებით და ხელოვნური ინტელექტით. უმარტივესად, მონაცემთა ხარისხი არის მონაცემები, რომლებიც სწორი და სრულია. თქვენ შეიძლება გინახავთ მონაცემთა ხარისხის პრობლემები სათაურებში:
- CDC-ის COVID-19 მონაცემთა გაუმჯობესება – ”პანდემიის მსვლელობისას CDC აუმჯობესებს რეაგირებისთვის კრიტიკული მონაცემების დროულობას, სისრულესა და ხარისხს.”
- ნაგავი, ნაგავი; ქალაქის დამკვირვებელი აღმოაჩენს მონაცემთა არასანდო ხარისხის შემაშფოთებელ ნიმუშს – „[ჩიკაგოს] გენერალური ინსპექტორის მოვალეობის შემსრულებელი ახალი ანგარიში ამბობს, რომ „მონაცემთა ხარისხის საკითხები“ გავლენას ახდენს ინფორმაციის „ობიექტურობაზე, სარგებლიანობასა და მთლიანობაზე“, რომელიც გამოიყენება რესურსების გასანაწილებლად, თანამშრომლების მუშაობის გაზომვისა და მრავალი პროგრამის მონიტორინგისთვის“.
- GAO აღმოაჩენს მონაცემთა ხარისხის საკითხებს VA-ს EHR-ის გაშვების დროს – ”VA-მ არ უზრუნველყო მონაცემთა ხარისხის მიგრაცია მის ახალ Cerner EHR სისტემაში.”
გარკვეულწილად - ბიზნეს დაზვერვის მესამე ათწლეულშიც კი - მონაცემთა ხარისხის მიღწევა და შენარჩუნება კიდევ უფრო რთულია. ზოგიერთი გამოწვევა, რომელიც ხელს უწყობს მონაცემთა ხარისხის შენარჩუნების მუდმივ ბრძოლას, მოიცავს:
- შერწყმა და შესყიდვები, რომლებიც ცდილობენ გააერთიანონ განსხვავებული სისტემები, პროცესები, ხელსაწყოები და მონაცემები მრავალი სუბიექტიდან.
- მონაცემთა შიდა სილოსები სტანდარტების გარეშე, რათა შეესაბამებოდეს მონაცემთა ინტეგრაციას.
- იაფმა შენახვამ გააადვილა დიდი რაოდენობით მონაცემების აღება და შენარჩუნება. ჩვენ ვიღებთ იმაზე მეტ მონაცემს, ვიდრე შეგვიძლია გავაანალიზოთ.
- გაიზარდა მონაცემთა სისტემების სირთულე. მეტი შეხების წერტილებია ჩანაწერის სისტემას, სადაც ხდება მონაცემების შეყვანა და მოხმარების წერტილს შორის, იქნება ეს მონაცემთა საწყობი თუ ღრუბელი.
მონაცემთა რომელ ასპექტებზეა საუბარი? მონაცემების რა თვისებები უწყობს ხელს მის ხარისხს? არსებობს ექვსი ელემენტი, რომლებიც ხელს უწყობენ მონაცემთა ხარისხს. თითოეული ეს არის მთელი დისციპლინა.
- დროულობა
- საჭიროების შემთხვევაში მონაცემები მზად და გამოსაყენებელია.
- მონაცემები ხელმისაწვდომია თვის ბოლოს მოხსენებისთვის, მაგალითად, მომდევნო თვის პირველი კვირის განმავლობაში.
- მოქმედების ვადა
- მონაცემებს აქვს მონაცემთა სწორი ტიპი მონაცემთა ბაზაში. ტექსტი არის ტექსტი, თარიღები არის თარიღები და ნომრები არის ნომრები.
- მნიშვნელობები მოსალოდნელ დიაპაზონშია. მაგალითად, მიუხედავად იმისა, რომ 212 გრადუსი ფარენჰეიტი არის ფაქტობრივი გაზომვადი ტემპერატურა, ის არ არის სწორი მნიშვნელობა ადამიანის ტემპერატურისთვის.
- მნიშვნელობებს აქვთ სწორი ფორმატი. 1.000000-ს არ აქვს იგივე მნიშვნელობა, რაც 1-ს.
- მდგრადობა
- მონაცემები შინაგანად თანმიმდევრულია
- ჩანაწერების დუბლიკატები არ არის
- მთლიანობის აღდგენის
- ცხრილებს შორის ურთიერთობები საიმედოა.
- უნებურად არ იცვლება. ფასეულობებს შეიძლება მივაკვლიოთ მათ საწყისებზე.
- სისრულე
- არ არის "ხვრელები" მონაცემებში. ჩანაწერის ყველა ელემენტს აქვს მნიშვნელობები.
- არ არის NULL მნიშვნელობები.
- სიზუსტე
- მონაცემები საანგარიშო ან ანალიტიკურ გარემოში - მონაცემთა საწყობი, იქნება ეს on-prem ან ღრუბელში - ასახავს წყაროს სისტემებს, სისტემებს ან ჩანაწერს.
- მონაცემები არის გადამოწმებადი წყაროებიდან.
ამრიგად, ჩვენ ვეთანხმებით, რომ მონაცემთა ხარისხის გამოწვევა ისეთივე ძველია, როგორც თავად მონაცემები, პრობლემა ყველგან არის გავრცელებული და გადასაჭრელად სასიცოცხლოდ მნიშვნელოვანია. მაშ, რა ვქნათ ამის შესახებ? განიხილეთ თქვენი მონაცემთა ხარისხის პროგრამა, როგორც გრძელვადიანი, დაუსრულებელი პროექტი.
მონაცემთა ხარისხი მჭიდროდ ასახავს რამდენად ზუსტად არის ეს მონაცემები რეალობას. მართალი გითხრათ, ზოგიერთი მონაცემი უფრო მნიშვნელოვანია, ვიდრე სხვა მონაცემები. იცოდეთ რა მონაცემებია გადამწყვეტი მტკიცე ბიზნეს გადაწყვეტილებებისა და ორგანიზაციის წარმატებისთვის. დაიწყე იქ. ფოკუსირება მოახდინეთ ამ მონაცემებზე.
როგორც მონაცემთა ხარისხი 101, ეს სტატია არის პირველკურსელთა დონის შესავალი თემასთან დაკავშირებით: ისტორია, მიმდინარე მოვლენები, გამოწვევა, რატომ არის ეს პრობლემა და მაღალი დონის მიმოხილვა, თუ როგორ უნდა მივმართოთ მონაცემთა ხარისხს ორგანიზაციაში. შეგვატყობინეთ, თუ გაინტერესებთ რომელიმე ამ თემის უფრო ღრმად შესწავლა 200 დონის ან სამაგისტრო დონის სტატიაში. თუ ასეა, ჩვენ უფრო ღრმად ჩავუღრმავდებით დეტალებს უახლოეს თვეებში.