主数据管理(lǐ)与企业数据治理(lǐ)的區(qū)别

2019/11/26      5401 文(wén)章来源:DAMS 原作者:Jelani Harper

数据管理(lǐ)数据治理(lǐ)有(yǒu)很(hěn)多(duō)地方是互相重叠的,它们都围绕数据这个领域展开,因此这两个术语经常被混為(wèi)一谈。此外,每当人们提起数据管理(lǐ)数据治理(lǐ)的时候,还有(yǒu)一对类似的术语叫信息管理(lǐ)和信息治理(lǐ),更混淆了人们对它们的理(lǐ)解。关于企业信息管理(lǐ)这个课题,还有(yǒu)许多(duō)相关的子集,包括主数据管理(lǐ)、元数据管理(lǐ)、数据生命周期管理(lǐ)等等。于是,出现了许多(duō)不同的理(lǐ)论(或理(lǐ)论家)描述关于在企业中数据/信息的管理(lǐ)以及治理(lǐ)如何运作:它们如何单独运作?它们又(yòu)如何一起协同工作?是“自下而上”还是“自上而下”的方法更高效?

以下重点阐述这些术语的定义和區(qū)别:

1、数据管理(lǐ)包含数据治理(lǐ)

在说明数据和信息的區(qū)别之前,最好从“治理(lǐ)是整體(tǐ)数据管理(lǐ)的一部分(fēn)”这个概念开始,这个概念目前已经得到了业界的广泛认同。数据管理(lǐ)包含多(duō)个不同的领域,其中一个最显著的领域就是数据治理(lǐ)。CMMi协会颁布的数据管理(lǐ)成熟度模型(DMM)使这个概念具體(tǐ)化。DMM模型中包括六个有(yǒu)效数据管理(lǐ)分(fēn)类,而其中一个就是数据治理(lǐ)数据管理(lǐ)协会(DAMA)在数据管理(lǐ)知识體(tǐ)系(DMBOK)中也认為(wèi),数据治理(lǐ)数据管理(lǐ)的一部分(fēn)。在企业信息管理(lǐ)(EIM)这个定义上,Gartner认為(wèi)EIM是“在组织和技术的边界上结构化、描述、治理(lǐ)信息资产的一个综合學(xué)科(kē)”。Gartner这个定义不仅强调了数据/信息管理(lǐ)和治理(lǐ)上的紧密关系,也重申了数据管理(lǐ)包含治理(lǐ)这个观点。

2、治理(lǐ)与管理(lǐ)的區(qū)别

在明确数据治理(lǐ)数据管理(lǐ)的一部分(fēn)之后,下一个问题就是定义数据管理(lǐ)。治理(lǐ)相对容易界定,它是用(yòng)来明确相关角色、工作责任和工作流程的,确保数据资产能(néng)長(cháng)期有(yǒu)序地、可(kě)持续地得到管理(lǐ)。而数据管理(lǐ)则是一个更為(wèi)广泛的定义,它与任何时间采集和应用(yòng)数据的可(kě)重复流程的方方面面都紧密相关。例如,简单地建立和规划一个数据仓库,这是数据管理(lǐ)层面的工作。定义谁以及如何访问这个数据仓库,并且实施各种各样针对元数据和资源库管理(lǐ)工作的标准,这是治理(lǐ)层面的工作。数据管理(lǐ)更广泛的定义包含DATAVERSITY上大部分(fēn)主题為(wèi)数据管理(lǐ)的文(wén)章和博客,其中有(yǒu)一部分(fēn)是特别针对数据治理(lǐ)的。一个更广泛的定义是,在数据管理(lǐ)过程中要保证一个组织已经将数据转换成有(yǒu)用(yòng)信息,这项工作所需要的流程和工具就是数据治理(lǐ)的工作。

3、信息与数据的區(qū)别

在上文(wén)关于数据管理(lǐ)的第三个定义中,提到了数据和信息的區(qū)别。所有(yǒu)的信息都是数据,但并不是所有(yǒu)的数据都是信息。信息是那些容易应用(yòng)于业務(wù)流程并产生特定价值的数据。要成為(wèi)信息,数据通常必须经历一个严格的治理(lǐ)流程,它使有(yǒu)用(yòng)的数据从无用(yòng)数据中分(fēn)离出来,以及采取若干关键措施增加有(yǒu)用(yòng)数据的可(kě)信度,并将有(yǒu)用(yòng)数据作為(wèi)信息使用(yòng)。数据的特殊点在于创造和使用(yòng)信息。在Gartner的术语表中,没有(yǒu)单独解释数据管理(lǐ)数据治理(lǐ)的概念,取与代之的是重点介绍了信息治理(lǐ)和信息管理(lǐ)的概念。

4、数据治理(lǐ)主要围绕对象:角色

与正式的数据治理(lǐ)流程相关的角色是有(yǒu)限的。这些角色通常包括高层的管理(lǐ)者,他(tā)们优化数据治理(lǐ)规划并使资金筹集变得更為(wèi)容易。这些角度也包括一个治理(lǐ)委员会,由个别高层管理(lǐ)者以及针对治理(lǐ)特定业務(wù)和必要流程而赋予相应职责的跨业務(wù)部门的人组成。角色也包括数据管理(lǐ)员,确保治理(lǐ)活动的持续开展以及帮忙企业实现业務(wù)目标。此外,还有(yǒu)部分(fēn)“平民(mín)”管理(lǐ)员,他(tā)们虽然不会明确被指定為(wèi)数据管理(lǐ)员,但他(tā)们仍然在各自业務(wù)领域里的治理(lǐ)流程中扮演活跃的角色。

有(yǒu)效的治理(lǐ)不仅需要IT的介入,这是人们的普遍共识。尤其当业務(wù)必须更主动地参与到治理(lǐ)方式和数据管理(lǐ)其他(tā)层面(例如自助数据分(fēn)析)的时候,目的是要从这些工作参与中获益。在更多(duō)的案例中,特定领域的治理(lǐ)可(kě)以直接应用(yòng)于业務(wù)。这就是為(wèi)什么治理(lǐ)仅需要IT的介入是一个过时且应该摈弃的观点。

5、数据治理(lǐ)主要围绕对象:领域

数据治理(lǐ)包含许多(duō)不同方面的领域:

◇元数据:元数据要求数据元素和术语的一致性定义,它们通常聚集于业務(wù)词汇表上。

◇业務(wù)词汇表:对于企业而言,建立统一的业務(wù)术语非常关键,如果这些术语和上下文(wén)不能(néng)横跨整个企业的范畴,那么它将会在不同的业務(wù)部门中出现不同的表述。

◇生命周期管理(lǐ):数据保存的时间跨度、数据保存的位置,以及数据如何使用(yòng)都会随着时间而产生变化,某些生命周期管理(lǐ)还会受到法律法规的影响。

◇数据质量:数据质量的具體(tǐ)措施包括数据详细检查的流程,目的是让业務(wù)部门信任这些数据。数据质量是非常重要的,有(yǒu)人认為(wèi)它不同于治理(lǐ),它极大提升了治理(lǐ)的水平。

◇参考数据管理(lǐ):参考数据提供数据的上下文(wén),尤其是它结合元数据一起考虑的情况下。由于参考数据变更的频率较低,参考数据的治理(lǐ)经常会被忽视。

虽然上述提及的是数据治理(lǐ)数据管理(lǐ)中所负责的特定领域,但一个至关重要的问题在于,所有(yǒu)组织里的数据必须持续坚持数据治理(lǐ)的原则。

6、数据建模

数据建模是依赖于数据治理(lǐ)的另一个数据管理(lǐ)中的关键领域,它结合了数据管理(lǐ)数据治理(lǐ)两者进行协调工作。可(kě)以说,為(wèi)了将数据治理(lǐ)扩展到整个组织,利用(yòng)一个规范化的数据建模有(yǒu)利于将数据治理(lǐ)工作扩展到其他(tā)业務(wù)部门。遵从一致性的数据建模,令数据标准变得有(yǒu)价值(特别是应用(yòng)于大数据)。一个确保数据治理(lǐ)贯穿整个企业的最高效手段,就是利用(yòng)数据建模技术直接关联不同的数据治理(lǐ)领域,例如数据血缘关系以及数据质量。当需要合并非结构化数据时,数据建模将会更有(yǒu)价值。此外,数据建模加强了治理(lǐ)的结构和形式。

7、关键的不同点

数据管理(lǐ)其他(tā)方面的案例在DMM中有(yǒu)五个类型,包括数据管理(lǐ)战略、数据质量、数据操作(生命周期管理(lǐ))、平台与架构(例如集成和架构标准),以及支持流程(聚集于其他(tā)因素之中的流程和风险管理(lǐ))。在此重申一点,数据治理(lǐ)数据管理(lǐ)非常接近是有(yǒu)事实支撑的,数据质量经常被视為(wèi)与数据治理(lǐ)相结合,甚至被认為(wèi)是数据治理(lǐ)的产物(wù)之一。也许,情景化这两个领域的最好办法,在于理(lǐ)解数据治理(lǐ)是负责正式化任何数据管理(lǐ)当中的流程,数据治理(lǐ)本身着重提供一整套工具和方法,确保企业在实际上治理(lǐ)这些数据。虽然数据治理(lǐ)数据管理(lǐ)中的一部分(fēn),但后者必须要由前者来提供可(kě)靠的信息到核心业務(wù)流程。