आप डेटा गुणवत्ता चाहते हैं, लेकिन आप गुणवत्ता डेटा का उपयोग नहीं कर रहे हैं

by अगस्त 24, 2022बीआई/एनालिटिक्स0 टिप्पणियां

टीज़र

हमने पहली बार डेटा कब देखा?

  1. मध्य बीसवीं सदी
  2. वल्कन के उत्तराधिकारी के रूप में, Spock
  3. 18,000 ई.पू.
  4. कौन जाने?  

जहाँ तक हम खोजे गए इतिहास में जा सकते हैं, हम मनुष्यों को डेटा का उपयोग करते हुए पाते हैं। दिलचस्प बात यह है कि डेटा लिखित संख्या से भी पहले का है। डेटा संग्रहीत करने के कुछ शुरुआती उदाहरण लगभग 18,000 ईसा पूर्व के हैं जहां अफ्रीकी महाद्वीप पर हमारे पूर्वजों ने बहीखाता पद्धति के रूप में लाठी पर निशान का इस्तेमाल किया था। उत्तर 2 और 4 भी स्वीकार किए जाएंगे। यह बीसवीं सदी के मध्य में था, हालांकि, जब बिजनेस इंटेलिजेंस को पहली बार परिभाषित किया गया था जैसा कि हम आज इसे समझते हैं। लगभग 21वीं सदी के अंत तक बीआई व्यापक नहीं हुआ।

डेटा गुणवत्ता के लाभ स्पष्ट हैं। 

  • ट्रस्ट. उपयोगकर्ता डेटा पर बेहतर भरोसा करेंगे। "75% कार्यकारी अपने डेटा पर भरोसा नहीं करते"
  • बेहतर निर्णय. आप बेहतर निर्णय लेने के लिए डेटा के विरुद्ध विश्लेषण का उपयोग करने में सक्षम होंगे।  आँकड़े की गुणवत्ता एआई को अपनाने वाले संगठनों के सामने दो सबसे बड़ी चुनौतियों में से एक है। (दूसरा स्टाफ स्किल सेट है।)
  • प्रतिस्पर्धात्मक लाभ।  डेटा की गुणवत्ता परिचालन दक्षता, ग्राहक सेवा, विपणन और नीचे की रेखा - राजस्व को प्रभावित करती है।
  • सफलता. डेटा की गुणवत्ता व्यवसाय से बहुत अधिक जुड़ी हुई है सफलता.

 

डेटा गुणवत्ता के 6 प्रमुख तत्व

यदि आप अपने डेटा पर भरोसा नहीं कर सकते, तो आप इसकी सलाह का सम्मान कैसे कर सकते हैं?

 

आज, डेटा की गुणवत्ता बीआई टूल्स, एनालिटिक्स, मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस के साथ किए गए निर्णयों की वैधता के लिए महत्वपूर्ण है। इसके सरलतम रूप में, डेटा गुणवत्ता वह डेटा है जो वैध और पूर्ण है। आपने डेटा गुणवत्ता की समस्याओं को सुर्खियों में देखा होगा:

कुछ मायनों में - यहां तक ​​कि बिजनेस इंटेलिजेंस के तीसरे दशक में भी - डेटा की गुणवत्ता को प्राप्त करना और बनाए रखना और भी कठिन है। डेटा गुणवत्ता बनाए रखने के निरंतर संघर्ष में योगदान देने वाली कुछ चुनौतियों में शामिल हैं:

  • विलय और अधिग्रहण जो कई संस्थाओं से अलग-अलग प्रणालियों, प्रक्रियाओं, उपकरणों और डेटा को एक साथ लाने का प्रयास करते हैं। 
  • डेटा के एकीकरण को समेटने के लिए मानकों के बिना डेटा का आंतरिक साइलो।            
  • सस्ते भंडारण ने बड़ी मात्रा में डेटा को पकड़ना और बनाए रखना आसान बना दिया है। हम जितना विश्लेषण कर सकते हैं उससे अधिक डेटा कैप्चर करते हैं।
  • डेटा सिस्टम की जटिलता बढ़ी है। रिकॉर्ड की प्रणाली जहां डेटा दर्ज किया जाता है और खपत के बिंदु के बीच अधिक टचपॉइंट होते हैं, चाहे वह डेटा वेयरहाउस या क्लाउड हो।

हम डेटा के किन पहलुओं के बारे में बात कर रहे हैं? डेटा के कौन से गुण इसकी गुणवत्ता में योगदान करते हैं? छह तत्व हैं जो डेटा गुणवत्ता में योगदान करते हैं। इनमें से प्रत्येक संपूर्ण अनुशासन है। 

  • सामयिकता
    • डेटा तैयार है और जरूरत पड़ने पर प्रयोग करने योग्य है।
    • उदाहरण के लिए, डेटा अगले महीने के पहले सप्ताह के भीतर महीने के अंत में रिपोर्टिंग के लिए उपलब्ध है।
  • वैधता
    • डेटाबेस में डेटा का सही डेटा प्रकार होता है। टेक्स्ट टेक्स्ट है, तिथियां तिथियां हैं और संख्याएं संख्याएं हैं।
    • मान अपेक्षित सीमाओं के भीतर हैं। उदाहरण के लिए, जबकि 212 डिग्री फ़ारेनहाइट एक वास्तविक मापने योग्य तापमान है, यह मानव तापमान के लिए मान्य मान नहीं है।  
    • मानों का सही प्रारूप होता है। 1.000000 का अर्थ 1 के समान नहीं है।
  • कंसिस्टेंसी (Consistency)
    • डेटा आंतरिक रूप से सुसंगत है
    • रिकॉर्ड की कोई डुप्लीकेट नहीं हैं
  • अखंडता
    • तालिकाओं के बीच संबंध विश्वसनीय हैं।
    • यह अनजाने में नहीं बदला गया है। मूल्यों का उनके मूल से पता लगाया जा सकता है। 
  • संपूर्णता
    • डेटा में कोई "छेद" नहीं हैं। रिकॉर्ड के सभी तत्वों का मान होता है।  
    • कोई NULL मान नहीं हैं।
  • शुद्धता
    • रिपोर्टिंग या विश्लेषणात्मक वातावरण में डेटा - डेटा वेयरहाउस, चाहे वह ऑन-प्रिमाइसेस हो या क्लाउड में - स्रोत सिस्टम, या सिस्टम या रिकॉर्ड को दर्शाता है
    • डेटा सत्यापन योग्य स्रोतों से है।

फिर, हम सहमत हैं कि डेटा गुणवत्ता की चुनौती उतनी ही पुरानी है जितनी कि डेटा ही, समस्या सर्वव्यापी और हल करने के लिए महत्वपूर्ण है। तो हम इस बारे में क्या कर सकते हैं? अपने डेटा गुणवत्ता कार्यक्रम को एक दीर्घकालिक, कभी न खत्म होने वाली परियोजना के रूप में देखें।  

डेटा की गुणवत्ता बारीकी से दर्शाती है कि डेटा कितनी सटीकता से वास्तविकता का प्रतिनिधित्व करता है। ईमानदार होने के लिए, कुछ डेटा अन्य डेटा की तुलना में अधिक महत्वपूर्ण है। जानें कि ठोस व्यावसायिक निर्णयों और संगठन की सफलता के लिए कौन सा डेटा महत्वपूर्ण है। वहाँ शुरू करो। उस डेटा पर ध्यान दें।  

डेटा गुणवत्ता 101 के रूप में, यह लेख विषय के लिए एक नए स्तर का परिचय है: इतिहास, वर्तमान घटनाएं, चुनौती, यह एक समस्या क्यों है और किसी संगठन के भीतर डेटा गुणवत्ता को कैसे संबोधित किया जाए, इसका एक उच्च-स्तरीय अवलोकन। यदि आप 200-स्तर या स्नातक-स्तर के लेख में इनमें से किसी भी विषय पर गहराई से विचार करने में रुचि रखते हैं, तो हमें बताएं। यदि ऐसा है, तो हम आने वाले महीनों में विशिष्टताओं में गहराई से उतरेंगे।   

बीआई/एनालिटिक्ससंयुक्त राष्ट्र वर्गीकृत
माइक्रोसॉफ्ट एक्सेल #1 एनालिटिक्स टूल क्यों है?
एक्सेल #1 एनालिटिक्स टूल क्यों है?

एक्सेल #1 एनालिटिक्स टूल क्यों है?

  यह सस्ता और आसान है. Microsoft Excel स्प्रेडशीट सॉफ़्टवेयर संभवतः व्यावसायिक उपयोगकर्ता के कंप्यूटर पर पहले से ही स्थापित है। और आज कई उपयोगकर्ता हाई स्कूल या उससे भी पहले से माइक्रोसॉफ्ट ऑफिस सॉफ़्टवेयर के संपर्क में हैं। यह बिना सोचे समझे दी गई प्रतिक्रिया...

विस्तार में पढ़ें

बीआई/एनालिटिक्ससंयुक्त राष्ट्र वर्गीकृत
अपनी अंतर्दृष्टि को व्यवस्थित करें: एनालिटिक्स स्प्रिंग क्लीनिंग के लिए एक गाइड

अपनी अंतर्दृष्टि को व्यवस्थित करें: एनालिटिक्स स्प्रिंग क्लीनिंग के लिए एक गाइड

अपनी अंतर्दृष्टि को व्यवस्थित करें एनालिटिक्स स्प्रिंग क्लीनिंग के लिए एक गाइड नया साल एक धमाके के साथ शुरू होता है; साल के अंत की रिपोर्टें बनाई जाती हैं और उनकी जांच की जाती है, और फिर हर कोई एक सुसंगत कार्यसूची में तय हो जाता है। जैसे-जैसे दिन बड़े होते हैं और पेड़ और फूल खिलते हैं,...

विस्तार में पढ़ें

बीआई/एनालिटिक्ससंयुक्त राष्ट्र वर्गीकृत
एनवाई स्टाइल बनाम शिकागो स्टाइल पिज्जा: एक स्वादिष्ट बहस

एनवाई स्टाइल बनाम शिकागो स्टाइल पिज्जा: एक स्वादिष्ट बहस

हमारी लालसाओं को संतुष्ट करते समय, कुछ चीज़ें पिज़्ज़ा के गरमा गरम टुकड़े के आनंद की बराबरी कर सकती हैं। न्यूयॉर्क-शैली और शिकागो-शैली पिज्जा के बीच बहस ने दशकों से भावुक चर्चा को जन्म दिया है। प्रत्येक शैली की अपनी अनूठी विशेषताएं और समर्पित प्रशंसक होते हैं...

विस्तार में पढ़ें

बीआई/एनालिटिक्सकॉग्नोस एनालिटिक्स
कॉग्नोस क्वेरी स्टूडियो
आपके उपयोगकर्ता अपना क्वेरी स्टूडियो चाहते हैं

आपके उपयोगकर्ता अपना क्वेरी स्टूडियो चाहते हैं

आईबीएम कॉग्नोस एनालिटिक्स 12 की रिलीज के साथ, क्वेरी स्टूडियो और एनालिसिस स्टूडियो की लंबे समय से घोषित अस्वीकृति अंततः उन स्टूडियो को छोड़कर कॉग्नोस एनालिटिक्स के एक संस्करण के साथ वितरित की गई। हालाँकि इसमें लगे अधिकांश लोगों के लिए यह आश्चर्य की बात नहीं होनी चाहिए...

विस्तार में पढ़ें

बीआई/एनालिटिक्ससंयुक्त राष्ट्र वर्गीकृत
क्या टेलर स्विफ्ट प्रभाव वास्तविक है?

क्या टेलर स्विफ्ट प्रभाव वास्तविक है?

कुछ आलोचकों का सुझाव है कि वह सुपर बाउल टिकट की कीमतें बढ़ा रही हैं, इस सप्ताहांत के सुपर बाउल के टेलीविजन इतिहास में शीर्ष 3 सबसे ज्यादा देखे जाने वाले कार्यक्रमों में से एक होने की उम्मीद है। संभवतः पिछले वर्ष की रिकॉर्ड-सेटिंग संख्या से अधिक और शायद 1969 के चंद्रमा से भी अधिक...

विस्तार में पढ़ें

बीआई/एनालिटिक्स
एनालिटिक्स कैटलॉग - एनालिटिक्स इकोसिस्टम में एक उभरता सितारा

एनालिटिक्स कैटलॉग - एनालिटिक्स इकोसिस्टम में एक उभरता सितारा

परिचय एक मुख्य प्रौद्योगिकी अधिकारी (सीटीओ) के रूप में, मैं हमेशा उभरती प्रौद्योगिकियों की तलाश में रहता हूं जो विश्लेषण के प्रति हमारे दृष्टिकोण को बदल देती हैं। ऐसी ही एक तकनीक जिसने पिछले कुछ वर्षों में मेरा ध्यान खींचा है और जिसमें अपार संभावनाएं हैं, वह है एनालिटिक्स...

विस्तार में पढ़ें