データの品質が欲しいが、高品質のデータを使用していない

by 2022 年 8 月 24 日BI /分析0コメント

お誘い

最初にデータを見たのはいつですか?

  1. XNUMX世紀半ば
  2. バルカンの後継機として、スポック
  3. 18,000 BC
  4. 知るか?  

発見された歴史をさかのぼると、人間がデータを使用していることがわかります。 興味深いことに、データは数字の前にさえあります。 データを保存する最も初期の例のいくつかは、紀元前 18,000 年頃のもので、アフリカ大陸の先祖が簿記の形式として棒の印を使用していました。 回答 2 と 4 も受け入れられます。 しかし、ビジネス インテリジェンスが今日私たちが理解しているように最初に定義されたのは、21 世紀半ばのことでした。 BI は、ほぼ XNUMX 世紀の変わり目まで普及しませんでした。

データ品質の利点は明らかです。 

  • 信頼. ユーザーはデータをより信頼できるようになります。 「エグゼクティブの 75% は自分のデータを信頼していません 
  • より良い決定. データに対して分析を使用して、より賢明な意思決定を行うことができます。  データ品質 は、AI を採用する組織が直面する XNUMX つの最大の課題の XNUMX つです。 (もう一つはスタッフのスキルセットです。)
  • 競争上の優位性。  データの品質は、運用効率、顧客サービス、マーケティング、および最終的な収益である収益に影響を与えます。
  • ご注文完了. データ品質はビジネスに大きく関係しています 成功.

 

データ品質の 6 つの重要な要素

データを信頼できない場合、そのアドバイスをどのように尊重できますか?

 

今日、データの品質は、企業が BI ツール、分析、機械学習、人工知能を使用して行う意思決定の有効性にとって重要です。 簡単に言えば、データ品質とは、有効で完全なデータです。 見出しでデータ品質の問題を見たことがあるかもしれません。

いくつかの点で、ビジネス インテリジェンスの XNUMX 年代に入っても、データの品質を達成して維持することはさらに困難です。 データ品質を維持するための絶え間ない努力に貢献する課題には、次のようなものがあります。

  • 複数のエンティティからの異種のシステム、プロセス、ツール、およびデータを統合しようとする合併と買収。 
  • データの統合を調整するための標準がない内部データのサイロ。            
  • 安価なストレージにより、大量のデータのキャプチャと保持が容易になりました。 分析できる以上のデータを取得します。
  • データ システムの複雑さが増しています。 データが入力される記録システムと、それがデータ ウェアハウスであれクラウドであれ、消費ポイントとの間には、より多くのタッチポイントがあります。

データのどの側面について話しているのでしょうか? データのどのような特性がその品質に貢献していますか? データ品質に寄与する要素は XNUMX つあります。 これらのそれぞれは、完全な分野です。 

  • 適時性
    • データは、必要なときにすぐに使用できます。
    • たとえば、データは翌月の第 XNUMX 週以内に月末レポートに使用できます。
  • 妥当性
    • データベース内のデータのデータ型が正しい。 テキストはテキスト、日付は日付、数字は数字です。
    • 値は想定範囲内です。 たとえば、華氏 212 度は実際に測定可能な温度ですが、人間の体温としては有効な値ではありません。  
    • 値は正しい形式です。 1.000000 は 1 と同じ意味ではありません。
  • 一貫性
    • データは内部的に一貫しています
    • レコードの重複はありません
  • 統合性
    • テーブル間の関係は信頼できます。
    • 意図せずに変更されることはありません。 値は、その起源までたどることができます。 
  • 完全
    • データに「穴」はありません。 レコードのすべての要素には値があります。  
    • NULL 値はありません。
  • 正確さ
    • レポートまたは分析環境 (オンプレミスかクラウドかを問わず、データ ウェアハウス) のデータは、ソース システム、またはシステムまたはレコードを反映します。
    • データは検証可能な情報源からのものです。

したがって、データ品質の課題はデータ自体と同じくらい古いものであり、問​​題はいたるところにあり、解決が不可欠であることに同意します。 それで、私たちはそれについて何をしますか? データ品質プログラムは、長期にわたる終わりのないプロジェクトと考えてください。  

データの品質は、そのデータが現実をどれだけ正確に表しているかを厳密に表しています。 正直なところ、一部のデータは他のデータよりも重要です。 堅実なビジネス上の意思決定と組織の成功に不可欠なデータを理解します。 そこから始めましょう。 そのデータに注目してください。  

Data Quality 101 として、この記事はこのトピックの新入生レベルの紹介です: 歴史、現在の出来事、課題、それが問題である理由、および組織内でデータ品質に対処する方法の概要。 200 レベルまたは大学院レベルの記事で、これらのトピックのいずれかを詳しく調べることに興味がある場合はお知らせください。 もしそうなら、私たちは今後数ヶ月で詳細をより深く掘り下げます.   

BI /分析未分類
Microsoft Excel がナンバーワンの分析ツールである理由
なぜ Excel がナンバーワンの分析ツールなのでしょうか?

なぜ Excel がナンバーワンの分析ツールなのでしょうか?

  安くて簡単です。 Microsoft Excel スプレッドシート ソフトウェアは、ビジネス ユーザーのコンピュータにすでにインストールされている可能性があります。そして今日の多くのユーザーは、高校時代、あるいはそれ以前から Microsoft Office ソフトウェアに触れてきました。についてのこの不可解な反応は...

続きを読む

BI /分析未分類
ニューヨークスタイル vs. シカゴスタイルピザ: おいしい論争

ニューヨークスタイル vs. シカゴスタイルピザ: おいしい論争

私たちの欲求を満たすとき、熱々のピザの喜びに匹敵するものはほとんどありません。ニューヨーク風ピザとシカゴ風ピザの論争は、何十年にもわたって情熱的な議論を引き起こしてきました。それぞれのスタイルには独自の特徴があり、熱心なファンがいます。

続きを読む

BI /分析コグノス アナリティクス
Cognos クエリスタジオ
ユーザーは Query Studio を望んでいます

ユーザーは Query Studio を望んでいます

IBM Cognos Analytics 12 のリリースにより、長い間発表されていた Query Studio と Analysis Studio の非推奨が、最終的にこれらのスタジオを除いたバージョンの Cognos Analytics で提供されました。これは、この分野に携わるほとんどの人にとって驚くべきことではありませんが、...

続きを読む

BI /分析未分類
テイラー・スウィフト効果は本当ですか?

テイラー・スウィフト効果は本当ですか?

一部の批評家は、彼女がスーパーボウルのチケット価格をつり上げているのではないかと示唆している 今週末のスーパーボウルは、テレビ史上最も視聴率の高いイベントのトップ3に入ることが予想されている。おそらく、昨年の記録を樹立した数字よりも多く、おそらく 1969 年の月よりも多いでしょう...

続きを読む