ಟೀಸರ್
ನಾವು ಮೊದಲು ಡೇಟಾವನ್ನು ಯಾವಾಗ ನೋಡಿದ್ದೇವೆ?
- ಇಪ್ಪತ್ತನೇ ಶತಮಾನದ ಮಧ್ಯಭಾಗ
- ವಲ್ಕನ್ನ ಉತ್ತರಾಧಿಕಾರಿಯಾಗಿ, ಸ್ಪೋಕ್
- 18,000 BC
- ಯಾರಿಗೆ ಗೊತ್ತು?
ಪತ್ತೆಯಾದ ಇತಿಹಾಸದಲ್ಲಿ ನಾವು ಹೋಗಬಹುದಾದಷ್ಟು ಹಿಂದೆಯೇ ನಾವು ಡೇಟಾವನ್ನು ಬಳಸುತ್ತಿರುವ ಮಾನವರನ್ನು ಕಾಣುತ್ತೇವೆ. ಕುತೂಹಲಕಾರಿಯಾಗಿ, ಡೇಟಾವು ಲಿಖಿತ ಸಂಖ್ಯೆಗಳಿಗೆ ಮುಂಚೆಯೇ ಇರುತ್ತದೆ. ಸುಮಾರು 18,000 BC ಯಿಂದ ದತ್ತಾಂಶವನ್ನು ಸಂಗ್ರಹಿಸುವ ಆರಂಭಿಕ ಉದಾಹರಣೆಗಳೆಂದರೆ, ಆಫ್ರಿಕನ್ ಖಂಡದಲ್ಲಿ ನಮ್ಮ ಪೂರ್ವಜರು ಬುಕ್ಕೀಪಿಂಗ್ನ ಒಂದು ರೂಪವಾಗಿ ಕೋಲುಗಳ ಮೇಲೆ ಗುರುತುಗಳನ್ನು ಬಳಸುತ್ತಿದ್ದರು. ಉತ್ತರ 2 ಮತ್ತು 4 ಅನ್ನು ಸಹ ಸ್ವೀಕರಿಸಲಾಗುತ್ತದೆ. ಇದು ಇಪ್ಪತ್ತನೇ ಶತಮಾನದ ಮಧ್ಯಭಾಗವಾಗಿತ್ತು, ಆದರೂ, ನಾವು ಇಂದು ಅರ್ಥಮಾಡಿಕೊಂಡಂತೆ ವ್ಯಾಪಾರ ಬುದ್ಧಿಮತ್ತೆಯನ್ನು ಮೊದಲು ವ್ಯಾಖ್ಯಾನಿಸಿದಾಗ. ಸುಮಾರು 21 ನೇ ಶತಮಾನದವರೆಗೆ BI ವ್ಯಾಪಕವಾಗಿ ಹರಡಲಿಲ್ಲ.
ಡೇಟಾ ಗುಣಮಟ್ಟದ ಪ್ರಯೋಜನಗಳು ಸ್ಪಷ್ಟವಾಗಿವೆ.
- ಟ್ರಸ್ಟ್. ಬಳಕೆದಾರರು ಡೇಟಾವನ್ನು ಉತ್ತಮವಾಗಿ ನಂಬುತ್ತಾರೆ. "75% ಕಾರ್ಯನಿರ್ವಾಹಕರು ತಮ್ಮ ಡೇಟಾವನ್ನು ನಂಬುವುದಿಲ್ಲ"
- ಉತ್ತಮ ನಿರ್ಧಾರಗಳು. ನೀವು ಉತ್ತಮ ನಿರ್ಧಾರಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ಡೇಟಾದ ವಿರುದ್ಧ ವಿಶ್ಲೇಷಣೆಗಳನ್ನು ಬಳಸಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. ಡೇಟಾ ಗುಣಮಟ್ಟ AI ಅನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳುವ ಸಂಸ್ಥೆಗಳು ಎದುರಿಸುತ್ತಿರುವ ಎರಡು ದೊಡ್ಡ ಸವಾಲುಗಳಲ್ಲಿ ಒಂದಾಗಿದೆ. (ಇನ್ನೊಂದು ಸಿಬ್ಬಂದಿ ಕೌಶಲ್ಯ ಸೆಟ್ ಆಗಿದೆ.)
- ಸ್ಪರ್ಧಾತ್ಮಕ ಅನುಕೂಲತೆ. ಡೇಟಾದ ಗುಣಮಟ್ಟವು ಕಾರ್ಯಾಚರಣೆಯ ದಕ್ಷತೆ, ಗ್ರಾಹಕ ಸೇವೆ, ಮಾರ್ಕೆಟಿಂಗ್ ಮತ್ತು ಬಾಟಮ್ ಲೈನ್ - ಆದಾಯದ ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ.
- ಯಶಸ್ಸು. ಡೇಟಾ ಗುಣಮಟ್ಟವು ವ್ಯವಹಾರಕ್ಕೆ ಹೆಚ್ಚು ಸಂಬಂಧ ಹೊಂದಿದೆ ಯಶಸ್ಸು.
ಡೇಟಾ ಗುಣಮಟ್ಟದ 6 ಪ್ರಮುಖ ಅಂಶಗಳು
ನಿಮ್ಮ ಡೇಟಾವನ್ನು ನೀವು ನಂಬಲು ಸಾಧ್ಯವಾಗದಿದ್ದರೆ, ಅದರ ಸಲಹೆಯನ್ನು ನೀವು ಹೇಗೆ ಗೌರವಿಸಬಹುದು?
ಇಂದು, ಬಿಐ ಉಪಕರಣಗಳು, ವಿಶ್ಲೇಷಣೆಗಳು, ಯಂತ್ರ ಕಲಿಕೆ ಮತ್ತು ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯೊಂದಿಗೆ ವ್ಯವಹಾರಗಳು ಮಾಡುವ ನಿರ್ಧಾರಗಳ ಸಿಂಧುತ್ವಕ್ಕೆ ಡೇಟಾದ ಗುಣಮಟ್ಟವು ನಿರ್ಣಾಯಕವಾಗಿದೆ. ಅದರ ಸರಳವಾಗಿ, ಡೇಟಾ ಗುಣಮಟ್ಟವು ಮಾನ್ಯವಾದ ಮತ್ತು ಸಂಪೂರ್ಣವಾದ ಡೇಟಾವಾಗಿದೆ. ಮುಖ್ಯಾಂಶಗಳಲ್ಲಿ ಡೇಟಾ ಗುಣಮಟ್ಟದ ಸಮಸ್ಯೆಗಳನ್ನು ನೀವು ನೋಡಿರಬಹುದು:
- CDC ಯ COVID-19 ಡೇಟಾ ಸುಧಾರಣೆ - "ಸಾಂಕ್ರಾಮಿಕ ಅವಧಿಯಲ್ಲಿ, ಸಿಡಿಸಿ ಪ್ರತಿಕ್ರಿಯೆಗಾಗಿ ನಿರ್ಣಾಯಕ ಡೇಟಾದ ಸಮಯ, ಸಂಪೂರ್ಣತೆ ಮತ್ತು ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸುತ್ತಿದೆ."
- ಕಸ ಒಳಗೆ, ಕಸ ಹೊರಗೆ; ಸಿಟಿ ವಾಚ್ಡಾಗ್ ವಿಶ್ವಾಸಾರ್ಹವಲ್ಲದ ಡೇಟಾ ಗುಣಮಟ್ಟದ ತೊಂದರೆದಾಯಕ ಮಾದರಿಯನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತದೆ - "[ಚಿಕಾಗೋ] ಆಕ್ಟಿಂಗ್ ಇನ್ಸ್ಪೆಕ್ಟರ್ ಜನರಲ್ನ ಹೊಸ ವರದಿಯು "ಡೇಟಾ ಗುಣಮಟ್ಟದ ಸಮಸ್ಯೆಗಳು" ಸಂಪನ್ಮೂಲಗಳನ್ನು ನಿಯೋಜಿಸಲು, ಉದ್ಯೋಗಿ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಅಳೆಯಲು ಮತ್ತು ಕಾರ್ಯಕ್ರಮಗಳ ಹೋಸ್ಟ್ ಅನ್ನು ಮೇಲ್ವಿಚಾರಣೆ ಮಾಡಲು ಬಳಸುವ ಮಾಹಿತಿಯ "ವಸ್ತುನಿಷ್ಠತೆ, ಉಪಯುಕ್ತತೆ ಮತ್ತು ಸಮಗ್ರತೆ" ಮೇಲೆ ಪರಿಣಾಮ ಬೀರುತ್ತದೆ ಎಂದು ಹೇಳುತ್ತದೆ.
- VA ನ EHR ರೋಲ್ಔಟ್ ಸಮಯದಲ್ಲಿ GAO ಡೇಟಾ ಗುಣಮಟ್ಟದ ಸಮಸ್ಯೆಗಳನ್ನು ಕಂಡುಕೊಳ್ಳುತ್ತದೆ - "VA ತನ್ನ ಹೊಸ Cerner EHR ಸಿಸ್ಟಮ್ಗೆ ವರ್ಗಾವಣೆಗೊಂಡ ಡೇಟಾದ ಗುಣಮಟ್ಟವನ್ನು ಖಚಿತಪಡಿಸಲಿಲ್ಲ."
ಕೆಲವು ವಿಧಗಳಲ್ಲಿ - ವ್ಯಾಪಾರ ಬುದ್ಧಿಮತ್ತೆಯ ಮೂರನೇ ದಶಕದಿಂದಲೂ - ಡೇಟಾದ ಗುಣಮಟ್ಟವನ್ನು ಸಾಧಿಸುವುದು ಮತ್ತು ನಿರ್ವಹಿಸುವುದು ಇನ್ನೂ ಕಷ್ಟ. ಡೇಟಾ ಗುಣಮಟ್ಟವನ್ನು ಕಾಪಾಡಿಕೊಳ್ಳುವ ನಿರಂತರ ಹೋರಾಟಕ್ಕೆ ಕೊಡುಗೆ ನೀಡುವ ಕೆಲವು ಸವಾಲುಗಳು:
- ವಿಲೀನಗಳು ಮತ್ತು ಸ್ವಾಧೀನಗಳು ವಿಭಿನ್ನವಾದ ವ್ಯವಸ್ಥೆಗಳು, ಪ್ರಕ್ರಿಯೆಗಳು, ಉಪಕರಣಗಳು ಮತ್ತು ಬಹು ಘಟಕಗಳಿಂದ ಡೇಟಾವನ್ನು ಒಟ್ಟಿಗೆ ತರಲು ಪ್ರಯತ್ನಿಸುತ್ತವೆ.
- ಡೇಟಾದ ಏಕೀಕರಣವನ್ನು ಸಮನ್ವಯಗೊಳಿಸಲು ಮಾನದಂಡಗಳಿಲ್ಲದ ಡೇಟಾದ ಆಂತರಿಕ ಸಿಲೋಸ್.
- ಅಗ್ಗದ ಸಂಗ್ರಹಣೆಯು ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಡೇಟಾವನ್ನು ಸೆರೆಹಿಡಿಯುವುದು ಮತ್ತು ಉಳಿಸಿಕೊಳ್ಳುವುದನ್ನು ಸುಲಭಗೊಳಿಸಿದೆ. ನಾವು ವಿಶ್ಲೇಷಿಸುವುದಕ್ಕಿಂತ ಹೆಚ್ಚಿನ ಡೇಟಾವನ್ನು ನಾವು ಸೆರೆಹಿಡಿಯುತ್ತೇವೆ.
- ಡೇಟಾ ವ್ಯವಸ್ಥೆಗಳ ಸಂಕೀರ್ಣತೆ ಬೆಳೆದಿದೆ. ಡೇಟಾವನ್ನು ನಮೂದಿಸಿದ ದಾಖಲೆಯ ವ್ಯವಸ್ಥೆ ಮತ್ತು ಬಳಕೆಯ ಬಿಂದುಗಳ ನಡುವೆ ಹೆಚ್ಚಿನ ಸ್ಪರ್ಶ ಬಿಂದುಗಳಿವೆ, ಅದು ಡೇಟಾ ವೇರ್ಹೌಸ್ ಅಥವಾ ಕ್ಲೌಡ್ ಆಗಿರಬಹುದು.
ನಾವು ಡೇಟಾದ ಯಾವ ಅಂಶಗಳ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದೇವೆ? ಡೇಟಾದ ಯಾವ ಗುಣಲಕ್ಷಣಗಳು ಅದರ ಗುಣಮಟ್ಟಕ್ಕೆ ಕೊಡುಗೆ ನೀಡುತ್ತವೆ? ಡೇಟಾ ಗುಣಮಟ್ಟಕ್ಕೆ ಕೊಡುಗೆ ನೀಡುವ ಆರು ಅಂಶಗಳಿವೆ. ಇವುಗಳಲ್ಲಿ ಪ್ರತಿಯೊಂದೂ ಸಂಪೂರ್ಣ ಶಿಸ್ತುಗಳಾಗಿವೆ.
- ಸಮಯೋಚಿತತೆ
- ಡೇಟಾ ಸಿದ್ಧವಾಗಿದೆ ಮತ್ತು ಅಗತ್ಯವಿದ್ದಾಗ ಬಳಸಬಹುದಾಗಿದೆ.
- ಉದಾಹರಣೆಗೆ ಮುಂದಿನ ತಿಂಗಳ ಮೊದಲ ವಾರದಲ್ಲಿ ತಿಂಗಳಾಂತ್ಯದ ವರದಿಗಾಗಿ ಡೇಟಾ ಲಭ್ಯವಿದೆ.
- ಸಿಂಧುತ್ವ
- ಡೇಟಾವು ಡೇಟಾಬೇಸ್ನಲ್ಲಿ ಸರಿಯಾದ ಡೇಟಾ ಪ್ರಕಾರವನ್ನು ಹೊಂದಿದೆ. ಪಠ್ಯವು ಪಠ್ಯವಾಗಿದೆ, ದಿನಾಂಕಗಳು ದಿನಾಂಕಗಳು ಮತ್ತು ಸಂಖ್ಯೆಗಳು ಸಂಖ್ಯೆಗಳಾಗಿವೆ.
- ಮೌಲ್ಯಗಳು ನಿರೀಕ್ಷಿತ ವ್ಯಾಪ್ತಿಯಲ್ಲಿವೆ. ಉದಾಹರಣೆಗೆ, 212 ಡಿಗ್ರಿ ಫ್ಯಾರನ್ಹೀಟ್ ನಿಜವಾದ ಅಳೆಯಬಹುದಾದ ತಾಪಮಾನವಾಗಿದ್ದರೂ, ಇದು ಮಾನವ ತಾಪಮಾನಕ್ಕೆ ಮಾನ್ಯವಾದ ಮೌಲ್ಯವಲ್ಲ.
- ಮೌಲ್ಯಗಳು ಸರಿಯಾದ ಸ್ವರೂಪವನ್ನು ಹೊಂದಿವೆ. 1.000000 1 ರಂತೆ ಅದೇ ಅರ್ಥವನ್ನು ಹೊಂದಿಲ್ಲ.
- ಸ್ಥಿರತೆ
- ಡೇಟಾವು ಆಂತರಿಕವಾಗಿ ಸ್ಥಿರವಾಗಿರುತ್ತದೆ
- ದಾಖಲೆಗಳ ಯಾವುದೇ ನಕಲುಗಳಿಲ್ಲ
- ಸಮಗ್ರತೆ
- ಕೋಷ್ಟಕಗಳ ನಡುವಿನ ಸಂಬಂಧಗಳು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿವೆ.
- ಇದು ಉದ್ದೇಶಪೂರ್ವಕವಾಗಿ ಬದಲಾಗಿಲ್ಲ. ಮೌಲ್ಯಗಳನ್ನು ಅವುಗಳ ಮೂಲದಿಂದ ಗುರುತಿಸಬಹುದು.
- ಸಂಪೂರ್ಣತೆ
- ಡೇಟಾದಲ್ಲಿ ಯಾವುದೇ "ರಂಧ್ರಗಳು" ಇಲ್ಲ. ದಾಖಲೆಯ ಎಲ್ಲಾ ಅಂಶಗಳು ಮೌಲ್ಯಗಳನ್ನು ಹೊಂದಿವೆ.
- ಯಾವುದೇ NULL ಮೌಲ್ಯಗಳಿಲ್ಲ.
- ನಿಖರತೆ
- ವರದಿ ಮಾಡುವ ಅಥವಾ ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಪರಿಸರದಲ್ಲಿನ ಡೇಟಾ - ಡೇಟಾ ವೇರ್ಹೌಸ್, ಆನ್-ಪ್ರೇಮ್ ಅಥವಾ ಕ್ಲೌಡ್ನಲ್ಲಿ - ಮೂಲ ವ್ಯವಸ್ಥೆಗಳು, ಅಥವಾ ಸಿಸ್ಟಮ್ಗಳು ಅಥವಾ ದಾಖಲೆಯನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತದೆ
- ಡೇಟಾವು ಪರಿಶೀಲಿಸಬಹುದಾದ ಮೂಲಗಳಿಂದ ಬಂದಿದೆ.
ಆದ್ದರಿಂದ, ಡೇಟಾ ಗುಣಮಟ್ಟದ ಸವಾಲು ಡೇಟಾದಷ್ಟೇ ಹಳೆಯದಾಗಿದೆ ಎಂದು ನಾವು ಒಪ್ಪುತ್ತೇವೆ, ಸಮಸ್ಯೆಯು ಸರ್ವತ್ರವಾಗಿದೆ ಮತ್ತು ಪರಿಹರಿಸಲು ಮುಖ್ಯವಾಗಿದೆ. ಆದ್ದರಿಂದ, ನಾವು ಅದರ ಬಗ್ಗೆ ಏನು ಮಾಡಬೇಕು? ನಿಮ್ಮ ಡೇಟಾ ಗುಣಮಟ್ಟದ ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ದೀರ್ಘಾವಧಿಯ, ಎಂದಿಗೂ ಮುಗಿಯದ ಯೋಜನೆಯಾಗಿ ಪರಿಗಣಿಸಿ.
ಡೇಟಾದ ಗುಣಮಟ್ಟವು ಆ ಡೇಟಾವು ವಾಸ್ತವವನ್ನು ಎಷ್ಟು ನಿಖರವಾಗಿ ಪ್ರತಿನಿಧಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನಿಕಟವಾಗಿ ಪ್ರತಿನಿಧಿಸುತ್ತದೆ. ನಿಜ ಹೇಳಬೇಕೆಂದರೆ, ಕೆಲವು ಡೇಟಾವು ಇತರ ಡೇಟಾಕ್ಕಿಂತ ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿದೆ. ಘನ ವ್ಯಾಪಾರ ನಿರ್ಧಾರಗಳು ಮತ್ತು ಸಂಸ್ಥೆಯ ಯಶಸ್ಸಿಗೆ ಯಾವ ಡೇಟಾ ನಿರ್ಣಾಯಕವಾಗಿದೆ ಎಂಬುದನ್ನು ತಿಳಿಯಿರಿ. ಅಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿ. ಆ ಡೇಟಾದ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ.
ಡೇಟಾ ಗುಣಮಟ್ಟ 101 ರಂತೆ, ಈ ಲೇಖನವು ವಿಷಯಕ್ಕೆ ಫ್ರೆಶ್ಮ್ಯಾನ್-ಮಟ್ಟದ ಪರಿಚಯವಾಗಿದೆ: ಇತಿಹಾಸ, ಪ್ರಸ್ತುತ ಘಟನೆಗಳು, ಸವಾಲು, ಇದು ಏಕೆ ಸಮಸ್ಯೆಯಾಗಿದೆ ಮತ್ತು ಸಂಸ್ಥೆಯೊಳಗೆ ಡೇಟಾ ಗುಣಮಟ್ಟವನ್ನು ಹೇಗೆ ಪರಿಹರಿಸುವುದು ಎಂಬುದರ ಕುರಿತು ಉನ್ನತ ಮಟ್ಟದ ಅವಲೋಕನ. 200-ಹಂತ ಅಥವಾ ಪದವಿ-ಹಂತದ ಲೇಖನದಲ್ಲಿ ಈ ಯಾವುದೇ ವಿಷಯಗಳ ಬಗ್ಗೆ ಆಳವಾದ ನೋಟವನ್ನು ತೆಗೆದುಕೊಳ್ಳಲು ನೀವು ಆಸಕ್ತಿ ಹೊಂದಿದ್ದರೆ ನಮಗೆ ತಿಳಿಸಿ. ಹಾಗಿದ್ದಲ್ಲಿ, ಮುಂಬರುವ ತಿಂಗಳುಗಳಲ್ಲಿ ನಾವು ನಿರ್ದಿಷ್ಟತೆಗಳಿಗೆ ಆಳವಾಗಿ ಧುಮುಕುತ್ತೇವೆ.