你现在的位置:首页 > 新闻中心
 新闻中心

  公司动态

数据治理五大误区,你都知道吗?

From:    Click:22    Time:2021-07-07

随着新的数据隐私法规、数据所有权和算法偏见等问题的出现,利用数据驱动洞察力并不容易理解。而这数据治理五大误区,你都知道么?  

一、创建数据治理策略

数据是公司的资产。为了更快地做出决策,用户必须信任它。数据治理打破了来自企业内不同系统的数据竖井,并建立了一组流程、标准和策略,以使数据在企业范围内可用。自动化数据治理平台快速、安全地将可信数据交付给业务用户,这些用户需要数据来执行他们的工作。

协作是跨组织成功使用数据的关键。所有业务用户都需要知道在哪里找到正确的数据,并对数据的含义有一个共同的理解。可用的业务数据的数量、种类和范围呈指数级增长,使其越来越难以找到、理解和信任,尽管这对于从中获得价值至关重要。

适当的系统(如受治理的数据目录)使用户能够理解业务术语中的数据,同时还可以建立数据集之间的关系和关联。要正确地做到这一点,CIO需要与首席数据官(CDO)协作,以管理以治理为基础的数据策略,将正确的数据交付给正确的人,以推动业务转型。

CIO和CDO必须在交付业务时相互支持,任何一方都不可能单独成功。数据治理策略要想成功,每个商业领袖都必须有数据意识,用数字化思维思考问题。CDO的任务是构建这些组织实践和行为,以协调基本变化,使之成为一个数据驱动的组织。

为了确保正确的数据在正确的时间被正确的人掌握,组织必须坚持不懈地工作,通过快速采用敏捷的数据流程来识别和减少错误数据孤岛,从而使业务能够更快地移动,并对内部和外部的数据需求作出更快速的响应。重要的是,他们需要确保团队有一个共同的愿景和一个务实的路径来推动期望的结果。

数据正在进入业务的每一个领域,是数字化转型的基础。治理工作应该与数字化工作紧密联系。深入研究云计算、物联网、人工智能和机器学习等技术,在组织能够充分利用这些技术的全部潜力之前,有必要采用数据治理策略。在实现新技术时,数据通常是最大的问题,而且越来越多的消费者受到数据驱动决策的影响。为了让技术产生正确的影响,数据必须是正确和公正的。有缺陷的数据只会减慢数字化转型的速度。

例如,在Forrester的首届数据战略和洞察会议发现,人工智能停滞不前的原因是缺乏对为算法提供数据的信任。数据治理是解决这个问题的关键,它提供了数据可见性和数据质量的好处,没有实施良好的治理,人工智能就没有信任可言。

二、不要把数字化转型当成一个流行语

围绕数据制定战略是成功数字化转型的关键。撇开流行词不谈,企业需要理解他们试图从数字化转型中实现什么,以及它如何在行业中产生影响,如何获得竞争优势。然后,他们必须返回到支持转型的技术和为这些技术提供动力的数据,并实现匹配的数据治理策略。

数据治理需要作为业务中的一个独立实体出现,以帮助组织更好地维护其数据清单,促进数据的使用,提高数据质量,并对整个业务中所有数据用户使用的流程和方法进行控制。

三、数据治理的五大误区

如果企业正在着手一个数据项目,那么可能会遇到一个或多个数据管理挑战。关于如何实施数据治理和如何控制数据流,您所做的决策决定了项目的成功或失败。以下是你应该避免的5个数据治理错误:

1.没有数据治理策略

如果你对自己说,“什么是数据治理?那么你很有可能犯了这个错误。数据治理指的是定义组织如何确保使用的数据干净、准确、可用和安全的总体策略。

当您的组织开始进行数据项目时,您通常会以特别的方式解决其中的一个或多个挑战。这种方法可能在一段时间内有效,但当您获得大数据成功并承担更复杂的项目时,缺乏治理可能会再次困扰您。

数据治理策略有几个组成部分,包括:设置规定如何存储和保护数据的流程;制定一套标准和程序,以确保获授权人员可以查阅和使用数据;建立控制和程序以确保规则得到遵守。

就像生活中的大多数事情和IT一样,数据治理并不是带着“设置好就忘记”的心态工作的。从您的数据治理计划开始,然后随着时间的推移使其不断优化,以满足您组织的特定需求。

2.过度依赖独角兽

许多电商在处理与大数据有关的所有事情时都求助于他们的数据科学家(即独角兽)。公司老板们希望他们的独角兽们能神奇地将原始数据转化为可操作的洞察力。这种方法可能不会长久奏效。事实是,如果你足够幸运,找到了一家独角兽公司,你就得付他们太多钱,让他们去做“数据看门人”,更不用说负责整个数据治理战略了。

数据治理最好由来自IT部门、业务线和遵从性的一组数据涉众领导。数据治理研究所还建议雇佣一名数据治理官(DGO)。

3.数据管理模式失控

这种错误经常与数据湖的实现同时出现。HDFS的宽容使您能够将任何类型的数据、任何类型的模式扔到Hadoop数据湖中,然后再担心如何对其进行分类。这种“读取模式”方法可能适用于某些类型的数据,特别是那些经常更改且不能被归类到预先设定的模式中的数据。但是模式读取只能到此为止,在某种程度上,必须强制使用模式。

Hadoop带来了大量的数据处理引擎,比如Spark、Pig和MapReduce,它们可以帮助你给数据赋予形状和形式——也就是说,使其可用。读取模式与核心数据治理原则相悖,核心数据治理原则要求您知道要存储和处理的数据类型。

4.试图储存一切数据

良好数据治理策略的重要方面之一是数据收集。在某种程度上,每一条数据都必须进入公司的数据回收箱。但通常情况下,企业决定再也不扔掉任何数据了。

如果你的组织遵循“保持一切”的命令,祝你好运。可能需要很多额外的周期来维持腐烂的垃圾堆的秩序。据调查发现,如今一个组织存储的平均40%到60%的数据是冗余的、过时的或微不足道的(ROT)。

组织每年花费数百万美元来存储他们永远不会使用的数据。这不仅是商业意识的失败,也是数据治理的失败。

5.不使用自动化工具

制定有效的数据治理策略,需要付出很多,需要合适的人来实现它,且需要一个好的策略来列出优先级和一般策略,还需要好的流程来在日常的基础上实现数据治理。

但也有理由让正确的产品投入使用。没有一种工具能够为您解决所有的数据治理挑战。但大数据生态系统正在提供越来越引人注目的工具集合,这些工具可以帮助实现大数据块的自动化。比如Hortonworks数据治理计划的开源数据治理框架,正在帮助Hadoop环境中实施数据控制。数据质量工具还有助于解决数据治理挑战的一个特定方面。

数据必须是高质量的、可控的和一致的,以确保可以依赖它适当地满足这些技术,产生业务价值并为决策提供信息—,这也是数据治理的用途及意义。而这数据治理五大误区,你都知道吗?


 首页 | 关于亿科 | 亿科人 | 新闻中心 | 诚聘英才 | 联系亿科 |京ICP备12038005号-6
版权所有:北京亿科创想网络科技有限公司