टीझर्स
आम्ही प्रथम डेटा कधी पाहिला?
- विसाव्या शतकाच्या मध्यावर
- व्हल्कन, स्पॉकचा उत्तराधिकारी म्हणून
- 18,000 बीसी
- कोण माहित आहे?
शोधलेल्या इतिहासात आपण जितके मागे जाऊ शकतो तितके आपल्याला डेटा वापरताना मानव सापडतो. विशेष म्हणजे, डेटा अगदी लिखित संख्येच्या आधी आहे. डेटा संग्रहित करण्याची काही सर्वात जुनी उदाहरणे सुमारे 18,000 BC मधील आहेत जिथे आफ्रिकन खंडातील आपल्या पूर्वजांनी काठ्यांवर एक प्रकारचा लेखाजोखा म्हणून खुणा वापरल्या. 2 आणि 4 उत्तरे देखील स्वीकारली जातील. ते विसाव्या शतकाच्या मध्यावर होते, तथापि, जेव्हा आपण आज समजतो त्याप्रमाणे बिझनेस इंटेलिजन्सची प्रथम व्याख्या करण्यात आली होती. 21 व्या शतकाच्या सुरुवातीपर्यंत BI व्यापक झाले नाही.
डेटा गुणवत्तेचे फायदे स्पष्ट आहेत.
- ट्रस्ट. वापरकर्ते डेटावर अधिक विश्वास ठेवतील. "75% कार्यकारी अधिकारी त्यांच्या डेटावर विश्वास ठेवत नाहीत"
- चांगले निर्णय. स्मार्ट निर्णय घेण्यासाठी तुम्ही डेटाच्या विरूद्ध विश्लेषणे वापरण्यास सक्षम असाल. डेटा गुणवत्ता एआयचा अवलंब करणाऱ्या संस्थांसमोरील दोन सर्वात मोठ्या आव्हानांपैकी एक आहे. (इतर म्हणजे कर्मचारी कौशल्य संच.)
- स्पर्धात्मक फायदा. डेटाच्या गुणवत्तेमुळे ऑपरेशनल कार्यक्षमता, ग्राहक सेवा, मार्केटिंग आणि तळाची ओळ - महसूल प्रभावित होते.
- यश. डेटा गुणवत्ता व्यवसायाशी मोठ्या प्रमाणात जोडलेली आहे यश.
डेटा गुणवत्तेचे 6 प्रमुख घटक
आपण आपल्या डेटावर विश्वास ठेवू शकत नसल्यास, आपण त्याच्या सल्ल्याचा आदर कसा करू शकता?
आज, डेटाची गुणवत्ता BI टूल्स, अॅनालिटिक्स, मशीन लर्निंग आणि आर्टिफिशियल इंटेलिजन्सच्या सहाय्याने व्यवसायांनी घेतलेल्या निर्णयांच्या वैधतेसाठी महत्त्वपूर्ण आहे. सर्वात सोप्या पद्धतीने, डेटा गुणवत्ता हा डेटा आहे जो वैध आणि पूर्ण आहे. तुम्ही मथळ्यांमध्ये डेटा गुणवत्तेच्या समस्या पाहिल्या असतील:
- CDC चा COVID-19 डेटा सुधारणा - "साथीच्या रोगाच्या काळात, CDC प्रतिसादासाठी वेळोवेळी, पूर्णता आणि गंभीर डेटाची गुणवत्ता सुधारत आहे."
- कचरा आत कचरा बाहेर; सिटी वॉचडॉगला अविश्वसनीय डेटा गुणवत्तेचा त्रासदायक नमुना सापडला - "[शिकागो] कार्यवाहक महानिरीक्षकांच्या एका नवीन अहवालात म्हटले आहे की "डेटा गुणवत्ता समस्या" संसाधनांचे वाटप करण्यासाठी, कर्मचार्यांच्या कामगिरीचे मोजमाप करण्यासाठी आणि अनेक कार्यक्रमांचे निरीक्षण करण्यासाठी वापरल्या जाणार्या माहितीची "वस्तुनिष्ठता, उपयुक्तता आणि अखंडता" प्रभावित करतात."
- GAO ला VA च्या EHR रोलआउट दरम्यान डेटा गुणवत्ता समस्या आढळतात - "VA ने त्याच्या नवीन Cerner EHR सिस्टममध्ये स्थलांतरित केलेल्या डेटाची गुणवत्ता सुनिश्चित केली नाही."
काही मार्गांनी - अगदी बिझनेस इंटेलिजन्सच्या तिसऱ्या दशकातही - डेटाची गुणवत्ता मिळवणे आणि राखणे आणखी कठीण आहे. डेटा गुणवत्ता राखण्याच्या सतत संघर्षात योगदान देणारी काही आव्हाने आहेत:
- विलीनीकरण आणि अधिग्रहण जे भिन्न प्रणाली, प्रक्रिया, साधने आणि एकाधिक संस्थांकडील डेटा एकत्र आणण्याचा प्रयत्न करतात.
- डेटाचे एकत्रीकरण करण्यासाठी मानकांशिवाय डेटाचे अंतर्गत सायलोस.
- स्वस्त स्टोरेजमुळे मोठ्या प्रमाणात डेटा कॅप्चर करणे आणि टिकवून ठेवणे सोपे झाले आहे. आम्ही विश्लेषण करू शकतो त्यापेक्षा जास्त डेटा आम्ही कॅप्चर करतो.
- डेटा सिस्टमची जटिलता वाढली आहे. जिथे डेटा प्रविष्ट केला जातो आणि वापराचा बिंदू, मग ते डेटा वेअरहाऊस असो किंवा क्लाउड असो, रेकॉर्डच्या सिस्टममध्ये अधिक टचपॉइंट्स आहेत.
आम्ही डेटाच्या कोणत्या पैलूंबद्दल बोलत आहोत? डेटाचे कोणते गुणधर्म त्याच्या गुणवत्तेत योगदान देतात? डेटा गुणवत्तेत योगदान देणारे सहा घटक आहेत. यातील प्रत्येक संपूर्ण शाखा आहेत.
- वेळेवर
- जेव्हा आवश्यक असेल तेव्हा डेटा तयार आणि वापरण्यायोग्य आहे.
- पुढील महिन्याच्या पहिल्या आठवड्यात डेटा महिन्याच्या शेवटी अहवालासाठी उपलब्ध आहे, उदाहरणार्थ.
- वैधता
- डेटाबेसमध्ये डेटाचा योग्य डेटा प्रकार आहे. मजकूर मजकूर आहे, तारखा तारखा आहेत आणि संख्या संख्या आहेत.
- मूल्ये अपेक्षित श्रेणींमध्ये आहेत. उदाहरणार्थ, 212 अंश फॅरेनहाइट हे वास्तविक मोजता येण्याजोगे तापमान असले तरी ते मानवी तापमानासाठी वैध मूल्य नाही.
- मूल्यांना योग्य स्वरूप आहे. 1.000000 चा अर्थ 1 सारखा नाही.
- सातत्य
- डेटा अंतर्गत सुसंगत आहे
- रेकॉर्डचे कोणतेही डुप्लिकेट नाहीत
- सचोटी
- टेबलांमधील संबंध विश्वसनीय आहेत.
- तो अनावधानाने बदललेला नाही. मूल्ये त्यांच्या उत्पत्तीवर शोधली जाऊ शकतात.
- पूर्णता
- डेटामध्ये कोणतेही "छिद्र" नाहीत. रेकॉर्डमधील सर्व घटकांची मूल्ये असतात.
- कोणतीही NULL मूल्ये नाहीत.
- अचूकता
- अहवाल किंवा विश्लेषणात्मक वातावरणातील डेटा - डेटा वेअरहाऊस, मग ते ऑन-प्रेम असो किंवा क्लाउडमध्ये - स्त्रोत प्रणाली किंवा सिस्टम किंवा रेकॉर्ड प्रतिबिंबित करते
- डेटा पडताळणीयोग्य स्त्रोतांकडून आहे.
आम्ही सहमत आहोत की, डेटा गुणवत्तेचे आव्हान हे डेटाइतकेच जुने आहे, समस्या सर्वव्यापी आणि सोडवणे आवश्यक आहे. तर, आम्ही याबद्दल काय करू? तुमच्या डेटा क्वालिटी प्रोग्रामचा दीर्घकालीन, कधीही न संपणारा प्रकल्प म्हणून विचार करा.
डेटाची गुणवत्ता हा डेटा वास्तवाचे किती अचूकपणे प्रतिनिधित्व करतो हे बारकाईने दर्शवते. खरे सांगायचे तर, काही डेटा इतर डेटापेक्षा अधिक महत्त्वाचा असतो. ठोस व्यावसायिक निर्णय आणि संस्थेच्या यशासाठी कोणता डेटा महत्त्वपूर्ण आहे हे जाणून घ्या. तिथून सुरुवात करा. त्या डेटावर लक्ष केंद्रित करा.
डेटा गुणवत्ता 101 म्हणून, हा लेख या विषयाचा एक नवीन-स्तरीय परिचय आहे: इतिहास, वर्तमान घटना, आव्हान, ही समस्या का आहे आणि संस्थेमध्ये डेटा गुणवत्तेचे निराकरण कसे करावे याचे उच्च-स्तरीय विहंगावलोकन. तुम्हाला 200-स्तरीय किंवा पदवी-स्तरीय लेखात यापैकी कोणत्याही विषयावर सखोल विचार करण्यात स्वारस्य असल्यास आम्हाला कळवा. तसे असल्यास, आम्ही येत्या काही महिन्यांत तपशीलांमध्ये खोलवर जाऊ.