お誘い
最初にデータを見たのはいつですか?
- XNUMX世紀半ば
- バルカンの後継機として、スポック
- 18,000 BC
- 知るか?
発見された歴史をさかのぼると、人間がデータを使用していることがわかります。 興味深いことに、データは数字の前にさえあります。 データを保存する最も初期の例のいくつかは、紀元前 18,000 年頃のもので、アフリカ大陸の先祖が簿記の形式として棒の印を使用していました。 回答 2 と 4 も受け入れられます。 しかし、ビジネス インテリジェンスが今日私たちが理解しているように最初に定義されたのは、21 世紀半ばのことでした。 BI は、ほぼ XNUMX 世紀の変わり目まで普及しませんでした。
データ品質の利点は明らかです。
- 信頼. ユーザーはデータをより信頼できるようになります。 「エグゼクティブの 75% は自分のデータを信頼していません
- より良い決定. データに対して分析を使用して、より賢明な意思決定を行うことができます。 データ品質 は、AI を採用する組織が直面する XNUMX つの最大の課題の XNUMX つです。 (もう一つはスタッフのスキルセットです。)
- 競争上の優位性。 データの品質は、運用効率、顧客サービス、マーケティング、および最終的な収益である収益に影響を与えます。
- ご注文完了. データ品質はビジネスに大きく関係しています 成功.
データ品質の 6 つの重要な要素
データを信頼できない場合、そのアドバイスをどのように尊重できますか?
今日、データの品質は、企業が BI ツール、分析、機械学習、人工知能を使用して行う意思決定の有効性にとって重要です。 簡単に言えば、データ品質とは、有効で完全なデータです。 見出しでデータ品質の問題を見たことがあるかもしれません。
- CDC の COVID-19 データの改善 – 「パンデミックの過程で、CDC は対応のための重要なデータの適時性、完全性、および品質を改善してきました。」
- ガベージ イン、ガベージ アウト。 市の監視機関が信頼性の低いデータ品質の厄介なパターンを発見 – 「[シカゴ] 監察官代理からの新しいレポートによると、「データ品質の問題」は、リソースの割り当て、従業員のパフォーマンスの測定、および多数のプログラムの監視に使用される情報の「客観性、有用性、および完全性」に影響を与えます。
- GAO は VA の EHR 展開中にデータ品質の問題を発見 – 「VA は、新しい Cerner EHR システムに移行されたデータの品質を保証しませんでした。」
いくつかの点で、ビジネス インテリジェンスの XNUMX 年代に入っても、データの品質を達成して維持することはさらに困難です。 データ品質を維持するための絶え間ない努力に貢献する課題には、次のようなものがあります。
- 複数のエンティティからの異種のシステム、プロセス、ツール、およびデータを統合しようとする合併と買収。
- データの統合を調整するための標準がない内部データのサイロ。
- 安価なストレージにより、大量のデータのキャプチャと保持が容易になりました。 分析できる以上のデータを取得します。
- データ システムの複雑さが増しています。 データが入力される記録システムと、それがデータ ウェアハウスであれクラウドであれ、消費ポイントとの間には、より多くのタッチポイントがあります。
データのどの側面について話しているのでしょうか? データのどのような特性がその品質に貢献していますか? データ品質に寄与する要素は XNUMX つあります。 これらのそれぞれは、完全な分野です。
- 適時性
- データは、必要なときにすぐに使用できます。
- たとえば、データは翌月の第 XNUMX 週以内に月末レポートに使用できます。
- 妥当性
- データベース内のデータのデータ型が正しい。 テキストはテキスト、日付は日付、数字は数字です。
- 値は想定範囲内です。 たとえば、華氏 212 度は実際に測定可能な温度ですが、人間の体温としては有効な値ではありません。
- 値は正しい形式です。 1.000000 は 1 と同じ意味ではありません。
- 一貫性
- データは内部的に一貫しています
- レコードの重複はありません
- 統合性
- テーブル間の関係は信頼できます。
- 意図せずに変更されることはありません。 値は、その起源までたどることができます。
- 完全
- データに「穴」はありません。 レコードのすべての要素には値があります。
- NULL 値はありません。
- 正確さ
- レポートまたは分析環境 (オンプレミスかクラウドかを問わず、データ ウェアハウス) のデータは、ソース システム、またはシステムまたはレコードを反映します。
- データは検証可能な情報源からのものです。
したがって、データ品質の課題はデータ自体と同じくらい古いものであり、問題はいたるところにあり、解決が不可欠であることに同意します。 それで、私たちはそれについて何をしますか? データ品質プログラムは、長期にわたる終わりのないプロジェクトと考えてください。
データの品質は、そのデータが現実をどれだけ正確に表しているかを厳密に表しています。 正直なところ、一部のデータは他のデータよりも重要です。 堅実なビジネス上の意思決定と組織の成功に不可欠なデータを理解します。 そこから始めましょう。 そのデータに注目してください。
Data Quality 101 として、この記事はこのトピックの新入生レベルの紹介です: 歴史、現在の出来事、課題、それが問題である理由、および組織内でデータ品質に対処する方法の概要。 200 レベルまたは大学院レベルの記事で、これらのトピックのいずれかを詳しく調べることに興味がある場合はお知らせください。 もしそうなら、私たちは今後数ヶ月で詳細をより深く掘り下げます.