您想要数据质量,但您没有使用质量数据

by 2022 年 8 月 24 日商业智能/分析0评论

玩笑

我们什么时候第一次看到数据?

  1. 二十世纪中叶
  2. 作为 Vulcan 的继任者,Spock
  3. 18,000 BC
  4. 谁知道?  

早在我们发现的历史中,我们就会发现人类使用数据。 有趣的是,数据甚至先于书面数字。 存储数据的一些最早的例子是在公元前 18,000 年左右,我们在非洲大陆的祖先使用木棍上的标记作为记账的一种形式。 答案 2 和 4 也将被接受。 然而,在 21 世纪中叶,商业智能首次被定义为我们今天所理解的。 直到 XNUMX 世纪之交,BI 才开始普及。

数据质量的好处是显而易见的。 

  • 信任. 用户会更好地信任数据。 “75% 的高管不信任他们的数据=
  • 更好的决策. 您将能够对数据使用分析来做出更明智的决策。  数据质量 是采用人工智能的组织面临的两大挑战之一。 (另一个是员工技能。)
  • 竞争优势。  数据质量会影响运营效率、客户服务、营销和利润——收入。
  • 成功. 数据质量与业务密切相关 成功.

 

数据质量的 6 个关键要素

如果你不能信任你的数据,你怎么能尊重它的建议?

 

如今,数据质量对于企业使用 BI 工具、分析、机器学习和人工智能做出的决策的有效性至关重要。 简而言之,数据质量是有效且完整的数据。 你可能已经在头条看到了数据质量的问题:

在某些方面——甚至进入商业智能的第三个十年——实现和维护数据质量甚至更加困难。 导致维护数据质量的持续斗争的一些挑战包括:

  • 试图将来自多个实体的不同系统、流程、工具和数据整合在一起的并购。 
  • 内部数据孤岛没有标准来协调数据的集成。            
  • 廉价的存储使大量数据的捕获和保留变得更加容易。 我们捕获的数据多于我们可以分析的数据。
  • 数据系统的复杂性已经增加。 在输入数据的记录系统和消费点之间有更多的接触点,无论是数据仓库还是云。

我们在谈论数据的哪些方面? 数据的哪些属性有助于其质量? 有六个要素有助于数据质量。 每一个都是完整的学科。 

  • 合时
    • 数据在需要时已准备就绪并可使用。
    • 例如,这些数据可用于下个月的第一周内的月末报告。
  • 有效期限
    • 数据在数据库中具有正确的数据类型。 文本是文本,日期是日期,数字是数字。
    • 值在预期范围内。 例如,虽然 212 华氏度是实际可测量的温度,但它不是人体温度的有效值。  
    • 值具有正确的格式。 1.000000 与 1 的含义不同。
  • 持续一致
    • 数据内部一致
    • 没有重复的记录
  • 诚信
    • 表之间的关系是可靠的。
    • 它不是无意中改变的。 价值可以追溯到它们的起源。 
  • 完备性
    • 数据中没有“漏洞”。 记录的所有元素都有值。  
    • 没有 NULL 值。
  • 准确性
    • 报告或分析环境中的数据——数据仓库,无论是在本地还是在云中——反映了源系统、系统或记录
    • 数据来自可验证的来源。

因此,我们同意,数据质量的挑战与数据本身一样古老,这个问题无处不在,解决问题至关重要。 那么,我们该怎么做呢? 将您的数据质量计划视为一个长期的、永无止境的项目。  

数据的质量密切地代表了数据代表现实的准确程度。 老实说,有些数据比其他数据更重要。 了解哪些数据对于可靠的业务决策和组织的成功至关重要。 从那里开始。 专注于这些数据。  

作为数据质量 101,本文是对该主题的新生级别的介绍:历史、时事、挑战、为什么它是一个问题以及如何解决组织内的数据质量问题的高级概述。 如果您有兴趣在 200 级或研究生级别的文章中更深入地了解这些主题中的任何一个,请告诉我们。 如果是这样,我们将在接下来的几个月中更深入地研究细节。