谈谈技术驱动的数据治理会产生什么问题

王建峰·2025年08月18日 11:29
谈谈技术驱动的数据治理会产生什么问题

数据治理的最大问题在于技术 ,因为 技术决定了我们要优化的目标。这个过程可能是公开的,也可能是间接的,但确实会发生。 所以,您开始踏上数据治理之旅,或许是因为 了解它的价值,或许是因为您将其视为一项合规性任务,或许是因为人工智能的出现,您的组织意识到需要提高数据质量,而治理似乎已成为必需。您该从哪里开始呢?通常,一些共同的要素标志着一项计划或项目的启动,这些计划或项目将塑造您的数据治理体系。这些要素可能是:

根据项目的触发条件定义一些目标

组建团队

评估你的 愿景 和成熟度

制定数据管理政策、标准和程序的框架

设定角色和职责

问题是:在考虑实施之前,组织应该以及能够 如何清晰地定义这些内容?而此时,情况往往会发生转变:事情变得更加具体,需要实施 ,无论是安全策略、质量指标、元数据存储库等等。对于实施, 工具 供应商 喜欢提供指导,甚至共同定义竞争环境。这似乎是理所当然的。毕竟, 厂 商最了解自己的工具,不是吗?他们提供实施支持,并且通常将自己定位为数据治理专家。

但问题在于:供应商优化工具的功能,而不是 您的组织实际需要的数据治理功能。这种不一致通常会导致数据治理 工作 由于工具功能的原因,更多地关注策略执行,而非战略支持。

随着人工智能的发展,这个问题变得更加严重。我们已经听过很多次了:人工智能的好坏取决于它所输入的数据。以工具而非目的为中心进行优化的数据治理模式,只会延续“垃圾进,垃圾出”的经典陷阱,尤其是在机器速度和规模下。

可以将其视为 GIGO 链:规划不足+供应商优化实施+AI模型不透明=?

观点一:数据治理不是一种工具

供应商销售工具,而工具的构建是为了实施数据治理,而不是定义数据治理。因此,当供应商主导时,重点会迅速转移到:

元数据标记

规则执行

访问控制

监控仪表板

这些都是宝贵的能力,但 前提是 你必须明确治理数据的初衷。数据治理关乎的是数据在 企业信息 系统中使用方式的方向、监督和问责,而非工具配置。

我对数据治理的定义考虑到了这一点:

数据治理是一个以人为本的体系,通过该体系可以指导、监督企业信息系统中的数据资产,并要求组织对实现其既定目标负责。

这个定义并非始于工具,而是始于人和目标。工具是我们深思熟虑、经过深思熟虑的长期和短期选择的结果。短期选择基于业务需求、法规遵从性、市场条件和限制。长期选择则基于我们对组织的愿景。最后,同样重要的是:工具是确保问责和监督的一种方式,而不是定义问责和监督。

这是定义数据治理在现代组织中必须扮演的三个角色的基础 :数据 总监 、数据主管和数据审计。这正是在组织中定义数据治理独立于执行 所需的。

观点二:治理不仅仅是执行制度

当数据治理实施变得由供应商主导或依赖于工具时,定义数据必须满足的要求很容易优化工 具性能。这可能是因为工具附带了域结构、元数据收集的预定义设置,或者例如需要确认数据产品的定义。

如果从工具入手,数据治理的重点将集中在执行策略上,而不是在业务目标、监管要求、市场压力和技术限制之间进行权衡。最终形成的治理框架将具备以下特点:

优先考虑合规性而非可用性

优化政策遵守情况而非创新

创建清单而不是培养数据文化

您最终可能会获得出色的执行工作流程,但对于所执行的内容或原因却没有共同的理解。

一旦人工智能成为流程的一部分,决策就会变得更快、更自主。此时,数据治理缺乏清晰度会造成系统性风险。肤浅的、供应商优化的、工具优先的数据治理模式只会加速“垃圾进,垃圾出”的循环。想想我们的 GIGO 链吧。突然之间,即使我们的数据治理实施已经为数据安全、数据质量、数据沿袭等制定了明确的规则,偏见也会被放大,错误会被扩大,责任也会被模糊,所有这些都是因为基本的数据治理框架从一开始就没有稳定地定义。

行动一:应该优化什么

所以这意味着你需要在转向工具之前投入一些工作。有效的、以人为本的数据治理需要:

1. 从目标开始

您的组织希望利用数据实现什么目标?您的愿景是什么?您必须管理哪些风险?您必须实现哪些价值?数据治理应该源于这些问题,而不是产品功能。

2. 建立监督机制,而不仅仅是监控和控制

明确谁拥有决策权、如何解决分歧以及如何追踪问责。数据治理是一套超越运营范畴的问责体系。这是一个治理主题,因此应该与公司治理方式保持一致。

3. 使用工具来实施和操作,而不是定义

一旦治理框架到位,工具可以加速执行。但它们必须服务于人为定义的数据治理系统,而不是相反。

4. 数据治理作为一个生命系统

数据治理并非一成不变。随着商业模式的演变、法规的变迁以及技术的涌现(例如人工智能),治理必须随之调整。这意味着需要不断反思、衡量和迭代,探究数据治理的核心原因,而不仅仅是如何进行。

行动二:不要外包困难的部分

事实是:定义数据治理并非易事。它涉及持续的艰难 沟通 、权衡利弊、相互冲突的激励机制以及文化变革。

这就是为什么人们倾向于让供应商填补空白,从实施开始,然后再逆向工作。但数据治理不能通过工具进行逆向工程。它必须由了解组织使命、风险和价值观的人员精心设计。

不要再把数据治理视为即插即用的功能,它是 企业数据驱动的核心,这个体系定义了机器与人之间的互联互通,需要指导、协商和问责。当你把它交给供应商时,你不仅仅是购买了一个工具,而是将你的价值观、方向和监督外包出去了。

本文来自微信公众号“数据驱动智能”(ID:Data_0101),作者:晓晓,36氪经授权发布。

+1
4

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

本质上,是一场赤裸裸的权力展示罢了。

7小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业