数据领导力系列:行之有效的数据治理是从监管到大规模实现数据价值
简而言之:有效的数据治理并非在于控制,而在于赋能更快、更值得信赖的决策。探索切实可行的策略,构建能够赋能团队而非限制团队的治理框架。
大多数设计糟糕的数据治理方案之所以失败,是因为它们像安全检查站一样,旨在发现问题而非预防问题。在带领数据团队经历多次治理转型之后,我发现,最佳的治理方案应该秉持积极主动的思维,专注于创造价值,而不是被动地试图减少歧义或仅仅关注合规性。
治理的转变在于从把关式治理转变为赋能式治理。我热爱治理领域的原因在于,如果设计得当,就能与最终用户携手合作,并在解决他们的问题中发挥关键作用。目标是在确保数据质量和信任的前提下,实现数据和数据访问的民主化。如果中心化团队主导治理,而分散化的团队却在执行工作,那么治理必然会失败。
负责治理的人员必须对业务有透彻的了解。目标不应侧重于管道故障等技术指标,而应侧重于与战略重点相关的增值指标。如果客户留存是战略重点,那么在提高客户留存率的同时,用于预防客户流失的数据产品的使用量也需要增长。
一 治理失灵之时
我在工作初期,就深刻体会到简洁、完善的治理机制的重要性。举个例子,当时市场营销团队使用追踪参数进行归因分析,但缺乏统一标准。每个团队都使用自己的命名规则,导致跨团队数据汇总根本无法实现。
解决方案并非实施复杂的策略,而是一份简单的文档页面,解释何时可以使用这些参数、何时不能使用这些参数,以及应遵循的命名规则。数据质量得到提升,团队间的结果能够互操作,而且由于偏离既定结构会影响其他团队,各团队之间也更加自觉地进行自我监管。
在我们规模不大、使用场景有限的时候,这种方法效果很好。但是,随着数据使用场景的增加,数据管理的复杂程度也需要相应提高。而这恰恰是我们遇到问题的时候。
随着我们开始扩大数据治理规模,我们陷入了几个典型的陷阱。这些失败模式在我们自己的组织中表现为典型的“发达国家式增长问题”:
审批瓶颈:我们最初尝试与各个团队合作,对每一项新的跟踪变更或数据集进行审批,但这最终变成了一项极其繁琐的工作。真正需要使用这些数据的人员并没有积极参与审批流程,团队在等待管理负责人处理和批准请求的过程中,开发进度也因此放缓。
文档陷阱:我记得曾与一家大型咨询公司合作进行财务数据转型。他们创建的文档数量惊人,给我们造成了巨大的认知负担,以至于我们需要一次又一次地开会才能弄明白到底需要什么。没有人阅读那些冗长的政策文件,但我们却不断地生成新的文档。
互相指责:我们亲身经历过这种情况:当数据不一致时,中心化团队和分散化团队就开始互相指责。治理团队指责对方违反政策,而业务团队则指责治理存在障碍。这显然是责任归属不清的典型案例。
影子系统应对措施:这种情况发生在我们身上,当时我们作为中心团队提供的交付速度和精细程度无法满足各个团队的需求。团队自行开发变通方案,结果反而造成了治理机制原本旨在防止的碎片化和风险。
这些模式是可以预见的,因为它们是治理规模化而不改进方法所导致的必然结果。好消息是?我们通过从根本上转变思维方式,克服了所有这些挑战。
二 将产品思维应用于数据治理
转变发生在我们将更多产品思维应用于数据目录、策略和联合组的设计之时。我们不再问“我们如何控制数据的使用?”,而是问“我们如何让正确使用数据比错误使用数据更容易?”
这将改变一切:
从制度到平台:我们没有制定关于数据质量的规则,而是投资在数据管道中构建质量检查机制。
从委员会到自动化:我们没有采用人工审批流程,而是投资于更多自动化,并建立了明确的升级路径。
从文档到发现:我们没有采用静态的策略文档,而是投资于动态数据目录,实时显 示质量、沿袭和使用模式。
我所描述的大部分内容都与数据网格框架相符,在我看来,这是我职业生涯中最具影响力的数据管理方法。数据网格强调去中心化的数据架构和运营模式,并将数据视为一种产品。然而,正如我在之前的文章中提到的,数据网格并非适用于所有团队和公司。关键在于找到适合组织规模和需求的平衡点。
三 赋能治理的三大支柱
支柱一:透明的数据质量和背景
您的团队需要在工作流程中了解数据的质量和上下文。透明度不仅仅体现在文档记录上,更重要的是让数据质量在实际使用数据的地方清晰可见。这有助于发现最大的问题,并促进就优先级排序展开有效的讨论。
在 工作中 ,我们在控制面板中添加了质量指标,以便用户了解其数据的状态。我们还对出现故障或跟踪变更的情况进行了标注。显示转化率的控制面板还会显示数据的新鲜度、覆盖范围以及任何已知的质量问题。
这种透明度大大减少了“这些数据是否正确?”的问题,因为用户可以自己看到质量背景。
支柱二:智能默认设置的自助服务
实现合规治理最快的方法是将其作为阻力最小的路径。当团队能够自主快速、正确地解决自身的数据问题时,他们就不会再构建完全绕过治理的变通方案。
关键在于赋予团队基础和自由。在 工作中 ,我们建立了黄金记录,作为公司范围内业务规划数据的可靠起点。但至关重要的是,团队随后可以根据自身特定的运营需求,构建更细粒度的数据集。我们制定了相关政策,但有意放手让团队快速行动,并赋予他们相应的权限。我们相信他们能够做出正确的决策,但也会定期评估,以确保他们确实做到了。
当团队能够在符合自身实际需求的智能指导原则下自主行动时,他们自然会遵循治理原则,因为这符合他们的利益。而等待中央团队或使用低质量数据的做法,显然就逊色多了。
本文暂未涉及但肯定会在后续文章中探讨的一个方面是,每个数据点都需要进行不同程度的审查。如果是进行快速实验,其需求与持续的欺诈预防截然不同。针对后者进行设计可以迅速见效。
支柱三:嵌入式所有权和问责制
数据治理不应是被动地对数据进行管理,而应是所有数据使用团队积极参与的过程。虽然治理团队应继续发挥核心作用,提供平台和策略,但数据质量的实际所有权需要分配给最了解自身数据的领域专家。
将数据视为产品,要求团队对其创建的数据的质量和使用情况负责。如果数据产品明明具有明显的潜在价值,却没有任何团队使用,那就表明某些环节出了问题。
我们成立了数据产品治理委员会,每个业务部门都派代表参与。这些委员会由数据产品负责人组成,定期召开会议,分享挑战、统一标准,并协调影响多个团队的变更。这些委员会应该由能够有效凝聚各方力量、让参与过程充满乐趣而非官僚主义的领导者来领导。如果治理仅仅沦为又一次例行会议,那就注定失败。
四 让治理真正发挥作用:实施指南
明确质量标准:首先要找出信任缺失之处。哪些数据集受到质疑?优先将治理工作重点放在弥合这些信任鸿沟上。先从三个关键数据产品入手,将其作为典范,而不是自上而下地强制推行全面的政策。
将治理机制融入平台:与日常工具脱节的治理机制将被忽略。将治理决策嵌入到数据平台架构中,实现自动运行的质量检查、基于数据分类的访问控制以及集成到管道工具中的血缘跟踪。统一的数据目录一直是数据增长的基石。
建立反馈机制:良好的治理需要持续改进。利用关于信任度和易用性的调查、显示实际使用治理功能的分析以及质量趋势跟踪等方法。
加强数据素养:缺乏数据素养的治理只是官僚主义。团队不仅需要理解规则是什么,更需要理解规则的重要性。许多治理框架非常技术化,但更重要的是让团队成员参与其中。化繁为简是关键。
五 当治理真正奏效时
良好的治理对用户而言是无形的,但却体现在结果上。当治理有效时,团队可以减少质疑数据的时间,将更多精力投入到基于洞察的行动中。数据质量问题能够更快地被发现和解决。新团队成员无需接受大量培训即可查找和使用数据。
只有当治理惠及所有人,而不仅仅是部分团队时,它才能真正发挥作用。目标是建立一种无 需团队成员操心就能改善工作的治理机制。
本文来自微信公众号“数据驱动智能”(ID:Data_0101),作者:晓晓,36氪经授权发布。















