સતામણી કરનાર
અમે પ્રથમ ડેટા ક્યારે જોયો?
- વીસમી સદીના મધ્યમાં
- વલ્કન, સ્પૉકના અનુગામી તરીકે
- 18,000 BC
- કોણ જાણે?
જ્યાં સુધી આપણે શોધાયેલ ઇતિહાસમાં જઈ શકીએ છીએ ત્યાં સુધી આપણે ડેટાનો ઉપયોગ કરતા માણસો શોધીએ છીએ. રસપ્રદ વાત એ છે કે, ડેટા પણ લેખિત સંખ્યાની આગળ છે. માહિતી સંગ્રહિત કરવાના કેટલાક પ્રારંભિક ઉદાહરણો લગભગ 18,000 બીસીના છે જ્યાં આફ્રિકન ખંડ પરના આપણા પૂર્વજોએ હિસાબના સ્વરૂપ તરીકે લાકડીઓ પર નિશાનોનો ઉપયોગ કર્યો હતો. જવાબ 2 અને 4 પણ સ્વીકારવામાં આવશે. તે વીસમી સદીના મધ્યભાગનો હતો, જોકે, જ્યારે આપણે આજે સમજીએ છીએ તેમ બિઝનેસ ઇન્ટેલિજન્સની પ્રથમ વ્યાખ્યા કરવામાં આવી હતી. 21મી સદીના લગભગ વળાંક સુધી BI વ્યાપક બન્યું ન હતું.
ડેટા ગુણવત્તાના ફાયદા સ્પષ્ટ છે.
- વિશ્વાસ. વપરાશકર્તાઓ ડેટા પર વધુ સારી રીતે વિશ્વાસ કરશે. "75% એક્ઝિક્યુટિવ્સ તેમના ડેટા પર વિશ્વાસ કરતા નથી"
- વધુ સારા નિર્ણયો. તમે સ્માર્ટ નિર્ણયો લેવા માટે ડેટા સામે એનાલિટિક્સનો ઉપયોગ કરી શકશો. ડેટા ગુણવત્તા AI અપનાવતી સંસ્થાઓ સામે બે સૌથી મોટા પડકારો પૈકી એક છે. (અન્ય સ્ટાફ કૌશલ્ય સમૂહ છે.)
- સ્પર્ધાત્મક લાભ. ડેટાની ગુણવત્તા ઓપરેશનલ કાર્યક્ષમતા, ગ્રાહક સેવા, માર્કેટિંગ અને બોટમ લાઇન - આવકને અસર કરે છે.
- સફળતા. ડેટાની ગુણવત્તા વ્યવસાય સાથે ખૂબ જ જોડાયેલી છે સફળતા.
ડેટા ગુણવત્તાના 6 મુખ્ય ઘટકો
જો તમે તમારા ડેટા પર વિશ્વાસ કરી શકતા નથી, તો તમે તેની સલાહને કેવી રીતે માન આપી શકો?
આજે, BI ટૂલ્સ, એનાલિટિક્સ, મશીન લર્નિંગ અને આર્ટિફિશિયલ ઇન્ટેલિજન્સ વડે વ્યવસાયો દ્વારા લેવામાં આવતા નિર્ણયોની માન્યતા માટે ડેટાની ગુણવત્તા મહત્વપૂર્ણ છે. તેના સરળમાં, ડેટા ગુણવત્તા એ ડેટા છે જે માન્ય અને સંપૂર્ણ છે. તમે હેડલાઇન્સમાં ડેટા ગુણવત્તાની સમસ્યાઓ જોઈ હશે:
- CDC નો COVID-19 ડેટા સુધારણા - "રોગચાળા દરમિયાન, સીડીસી પ્રતિસાદ માટે નિર્ણાયક ડેટાની સમયસરતા, સંપૂર્ણતા અને ગુણવત્તામાં સુધારો કરી રહી છે."
- કચરો અંદર, કચરો બહાર; સિટી વોચડોગને અવિશ્વસનીય ડેટા ગુણવત્તાની મુશ્કેલીજનક પેટર્ન મળી છે - "[શિકાગો] કાર્યકારી નિરીક્ષક જનરલનો એક નવો અહેવાલ કહે છે કે "ડેટા ગુણવત્તાની સમસ્યાઓ" સંસાધનોની ફાળવણી કરવા, કર્મચારીઓની કામગીરીને માપવા અને ઘણા કાર્યક્રમોનું નિરીક્ષણ કરવા માટે ઉપયોગમાં લેવાતી માહિતીની "ઉદ્દેશ્યતા, ઉપયોગિતા અને અખંડિતતાને અસર કરે છે."
- GAઓ VA ના EHR રોલઆઉટ દરમિયાન ડેટા ગુણવત્તા સમસ્યાઓ શોધે છે - "VA એ તેની નવી Cerner EHR સિસ્ટમમાં સ્થાનાંતરિત ડેટાની ગુણવત્તાની ખાતરી કરી નથી."
કેટલીક રીતે - બિઝનેસ ઇન્ટેલિજન્સના ત્રીજા દાયકામાં પણ - ડેટાની ગુણવત્તા હાંસલ કરવી અને જાળવવી વધુ મુશ્કેલ છે. ડેટા ગુણવત્તા જાળવવાના સતત સંઘર્ષમાં ફાળો આપતા કેટલાક પડકારોમાં નીચેનાનો સમાવેશ થાય છે:
- મર્જર અને એક્વિઝિશન કે જે બહુવિધ સંસ્થાઓમાંથી અલગ અલગ સિસ્ટમો, પ્રક્રિયાઓ, સાધનો અને ડેટાને એકસાથે લાવવાનો પ્રયાસ કરે છે.
- ડેટાના સંકલન માટેના ધોરણો વિના ડેટાના આંતરિક સિલોઝ.
- સસ્તા સ્ટોરેજે મોટી માત્રામાં ડેટા કેપ્ચર અને રીટેન્શનને સરળ બનાવ્યું છે. અમે વિશ્લેષણ કરી શકીએ તે કરતાં વધુ ડેટા કેપ્ચર કરીએ છીએ.
- ડેટા સિસ્ટમ્સની જટિલતા વધી છે. રેકોર્ડની સિસ્ટમ જ્યાં ડેટા દાખલ કરવામાં આવે છે અને વપરાશના બિંદુ વચ્ચે વધુ ટચપોઇન્ટ્સ છે, પછી ભલે તે ડેટા વેરહાઉસ હોય કે ક્લાઉડ.
અમે ડેટાના કયા પાસાઓ વિશે વાત કરી રહ્યા છીએ? ડેટાના કયા ગુણધર્મો તેની ગુણવત્તામાં ફાળો આપે છે? ત્યાં છ ઘટકો છે જે ડેટાની ગુણવત્તામાં ફાળો આપે છે. આ દરેક સંપૂર્ણ શાખાઓ છે.
- સમયસરતા
- જ્યારે જરૂરી હોય ત્યારે ડેટા તૈયાર છે અને ઉપયોગ કરી શકાય છે.
- ડેટા આવતા મહિનાના પ્રથમ સપ્તાહમાં મહિનાના અંતની રિપોર્ટિંગ માટે ઉપલબ્ધ છે, ઉદાહરણ તરીકે.
- માન્યતા
- ડેટાબેઝમાં ડેટાનો સાચો ડેટા પ્રકાર છે. ટેક્સ્ટ એ ટેક્સ્ટ છે, તારીખો તારીખો છે અને સંખ્યાઓ સંખ્યાઓ છે.
- મૂલ્યો અપેક્ષિત શ્રેણીની અંદર છે. ઉદાહરણ તરીકે, જ્યારે 212 ડિગ્રી ફેરનહીટ વાસ્તવિક માપી શકાય તેવું તાપમાન છે, તે માનવ તાપમાન માટે માન્ય મૂલ્ય નથી.
- મૂલ્યો યોગ્ય ફોર્મેટ ધરાવે છે. 1.000000 નો અર્થ 1 જેવો નથી.
- સુસંગતતા
- ડેટા આંતરિક રીતે સુસંગત છે
- રેકોર્ડની કોઈ ડુપ્લિકેટ્સ નથી
- અખંડિતતા
- કોષ્ટકો વચ્ચેના સંબંધો વિશ્વસનીય છે.
- તે અજાણતા બદલાતો નથી. મૂલ્યો તેમના મૂળમાં શોધી શકાય છે.
- પૂર્ણતા
- ડેટામાં કોઈ "છિદ્રો" નથી. રેકોર્ડના તમામ ઘટકોની કિંમતો હોય છે.
- ત્યાં કોઈ NULL મૂલ્યો નથી.
- ચોકસાઈ
- રિપોર્ટિંગ અથવા વિશ્લેષણાત્મક વાતાવરણમાંનો ડેટા - ડેટા વેરહાઉસ, પછી ભલે તે ઓન-પ્રેમ હોય કે ક્લાઉડમાં - સ્ત્રોત સિસ્ટમ્સ અથવા સિસ્ટમ્સ અથવા રેકોર્ડને પ્રતિબિંબિત કરે છે
- ડેટા ચકાસી શકાય તેવા સ્ત્રોતોમાંથી છે.
અમે સંમત છીએ, તો પછી, ડેટા ગુણવત્તાનો પડકાર ડેટા જેટલો જ જૂનો છે, સમસ્યા સર્વવ્યાપી અને ઉકેલવા માટે મહત્વપૂર્ણ છે. તો, આપણે તેના વિશે શું કરીએ? તમારા ડેટા ક્વોલિટી પ્રોગ્રામને લાંબા ગાળાના, ક્યારેય ન સમાપ્ત થતા પ્રોજેક્ટ તરીકે ધ્યાનમાં લો.
ડેટાની ગુણવત્તા નજીકથી દર્શાવે છે કે તે ડેટા વાસ્તવિકતાને કેટલી સચોટ રીતે રજૂ કરે છે. પ્રમાણિક બનવા માટે, કેટલાક ડેટા અન્ય ડેટા કરતાં વધુ મહત્વપૂર્ણ છે. નક્કર વ્યવસાયિક નિર્ણયો અને સંસ્થાની સફળતા માટે કયો ડેટા મહત્વપૂર્ણ છે તે જાણો. ત્યાં શરૂ કરો. તે ડેટા પર ફોકસ કરો.
ડેટા ક્વોલિટી 101 તરીકે, આ લેખ એ વિષયનો ફ્રેશમેન-સ્તરનો પરિચય છે: ઇતિહાસ, વર્તમાન ઘટનાઓ, પડકાર, શા માટે તે સમસ્યા છે અને સંસ્થામાં ડેટા ગુણવત્તાને કેવી રીતે સંબોધિત કરવી તેની ઉચ્ચ-સ્તરની ઝાંખી છે. જો તમને 200-સ્તરના અથવા સ્નાતક-સ્તરના લેખમાં આમાંથી કોઈપણ વિષય પર ઊંડાણપૂર્વક જોવામાં રસ હોય તો અમને જણાવો. જો એમ હોય તો, અમે આગામી મહિનાઓમાં સ્પષ્ટીકરણોમાં ઊંડા ઉતરીશું.