现代数据建模:推动人工智能驱动型企业的革命

王建峰·2025年10月22日 20:01
现代数据建模的意义

模型的回归

有些想法是永恒的。 

“数据模型”的概念——一种描述信息连接方式的结构化方式 。 已经存在了几十年。但长期以来,建模一直默默地处于幕后。大多数团队专注于管道、分析或仪表板。 

然而,随着组织越来越依赖数据,一些有趣的事情发生了: 该模型又回来了。 

只是这一次,它并不存在于桌面上或孤立的文件中。 

它存在于云端。它是共享的、协作的,并且与数据堆栈的每个部分深度连接——从 Snowflake 和 dbt 到治理系统和  AI  辅助决策 。 

这就是我们谈论 现代数据建模时的意思。

这不仅仅关乎表格和键。它关乎上下文、协作和信任——能够以一种每个人(从工程师到高管)都能理解和依托的方式描述数据。 

动态建模

过去,模型只是快照——漂亮的图表很快就会过时。 

如今,它们已经成为了生命系统。 

现代建模平台,例如 SqlDBM 、dbt 以及其他云原生领域的平台,都将模型视为共享工作区。团队可以通过浏览器设计结构、注释含义、执行标准,并直接连接到生产数据库或版本控制系统。 

你可以将其视为数据架构领域的“Google Docs 时刻”:人们实时协作,发表评论,合并更改,并立即看到效果。这种从静态文档到实时协作的转变,使得建模从一项后台任务转变为一项战略能力。 

原因:复杂中的清晰

如今数据团队的运作复杂程度是十年前根本不存在的。 

他们管理着数十个平台、数千张表格和无数的管道。然而,在这一切之中,人类始终有一个疑问: 这些数据意味着什么? 

这就是现代模型所提供的一种共享语言。 

它将技术世界(模式、连接、键)与商业世界(客户、交易、收入)连接起来。 

它可以帮助新人更快地上手,工程师自信地进行构建,并且人工智能系统准确地解释信息。 

如果做得正确,建模就成为一种 理解 的行为,而不仅仅是工程。 

现代建模平台

新一代建模工具不仅仅转向云端 , 它们不断发展以反映团队的实际工作方式。 

它们具有协作性、版本化、集成性和智能性。 

它们的定义如下: 

统一的建模环境: 逻辑模型和物理模型并存。您可以在保持技术精度的同时进行概念设计。 

核心协作: 实时编辑、分支合并工作流程以及内联评论反映了现代软件开发。 

无缝集成: 直接连接到 Snowflake、BigQuery、Databricks、dbt 或治理目录 - 无需手动导出或文件处理。 

内置治理: 标准、命名规则和元数据标记是创建的一部分,而不是事后。 

人工智能辅助设计: 辅助决策 根据您的数据环境建议结构、文档和最佳实践。 

这种体验不像是使用工具,而更像是参与有关数据的不断发展的对话的一部分。 

建模与 dbt:逻辑与设计的合作

dbt 改变了团队对转换的看法 , 代码成为新的管道、模块化和版本控制。 

但即使是最好的转换代码也需要一张地图。 

现代建模工具现在通过 清单导入 和元数据同步直接与 dbt 集成。 

这意味着每个 dbt 模型(其谱系、依赖关系和结构)都可以与其逻辑设计一起被可视化、理解和管理。 

这并不是要取代 dbt;而是要看清全局。 

当您将建模和转换连接起来时,您就弥合了“数据如何构建”和“数据代表什么”之间的差距。 

语义层的兴起

现代建模中最令人兴奋的前沿之一是 语义层 ——一种在模型内直接描述业务含义的结构化方式。 

您无需在每个 BI 工具中对“收入”进行不同的定义,而是可以在与模型共存的共享层中定义一次。 

这成为一致报告、人工智能查询甚至理解您的业务术语的自然语言界面的基础。 

建模平台越来越多地承担这一角色,允许团队在表格旁边定义业务指标、层次结构和定义。 

这是一个微妙的转变,但却意义深远:模型不再只是技术产物,而是组织语言的 真理来源。 

人工智能进入建模领域

生成式人工智能改变了各个学科的期望,数据建模也不例外。 

我们现在正进入人工智能辅助建模 时代, AI 可以: 

• 从自然语言中建议实体结构。 

• 自动记录模型。 

• 识别不一致或缺失的关系。 

• 用人类的语言解释复杂的模式。 

例如,在 SqlDBM,企业团队正在测试 AI Copilot,以制作原型模型、丰富元数据,并比较“装饰”(业务环境)与“未装饰”(技术结构)设计。 

我们的目标不是让 架构 师实现自动化,而是 增强 他们的能力。 

人工智能有助于在意图和实施之间进行转换,将分散的输入转化为人类和机器都能理解的连贯、受控的模型。 

零摩擦治理

SaaS 建模的一个不为人知的超能力是它处理治理的方式。 

它不是将治理视为一个单独的步骤,而是将其嵌入到建模工作流程本身中。 

当您定义命名标准、列分类或所有权规则时,平台会在您工作时自动应用它们。 

这意味着更少的监管、更少的人工审查,以及更高的信心,您的数据环境符合公司政策。 

治理变得无形——不是中断,而是一种保证。 

从结构到故事

这一进化最精彩的部分不是技术,而是人 。 

现代建模正在帮助团队重新发现数据中的 故事。 

当工程师、分析师和业务用户都能看到同一个模型并真正理解它时,协调就会自然而然地发生。 

团队较少争论定义,而更多地关注结果。 

文档不再是一种负担——它是设计过程的副产品。 

数据模型曾经是一个静态图表,现在却变成了组织运作方式的生动叙述。 

建模即服务的商业案例

SaaS 建模平台也具有商业意义。 

它们易于部署、轻松扩展并与现有工具集成。 

无需安装软件,无需管理服务器,并且更新可立即进行。 

但更深层次的投资回报率在于 节省时间并实现一致性 。 

当仓库或 dbt 项目中的每个更改都自动同步到模型时,您可以消除冗余工作、减少沟通不畅并加快交付。 

对于企业数据团队(尤其是管理数十个域的团队)来说,这不仅仅是效率,更是规模上的清晰度。 

这一切将走向何方

我们现在正进入一个数据建模不仅仅是数据库的基础的阶段——它将塑造 人工智能如何理解组织 。 

模型已经成为大型语言模型的结构化蓝图,帮助人工智能系统安全地查询、推理和解释数据。 

未来几年,建模工具将: 

• 为人工智能代理提供语义理解。 

• 实时检测谱系变化。 

• 根据使用模式提出新的模式设计。 

• 作为人工智能治理的合规支柱。 

这是一个非凡的想法:不起眼的数据模型最终可能会成为道德的、可解释的人工智能最重要的推动因素之一。 

悄无声息却意义深远的转变

我们经常庆祝数据堆栈的可见部分——仪表板、管道、AI 演示。 

但在这一切的背后是一个安静的理解基础设施——模型。 

现代建模工具已经将这个基础变成了鲜活的 事物 : 

协作、智能、互联。 

他们不仅为团队提供了一种绘制数据库的方法,还提供了一种共同思考的方法。 

在人工智能、自动化和不断变化的时代,这种共同的理解可能是最强大的技术。 

最后的想法

现代数据建模并非要取代以往的数据模型,而是要提升它。它尊重结构和逻辑的原则,并赋予其协作、智能和意义。它是架构与同理心的交汇,也是数据的未来将更加人性化的地方。 

本文来自微信公众号 “数据驱动智能”(ID:Data_0101),作者:晓晓,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

张健华建议,适时调整数字人民币功能定位,推动其从M0逐步向M1、M2功能延伸。积极探索数字人民币账户余额记息并开发相应理财产品,实行部分准备金制度,并拓展数字人民币的批发型央行数字货币功能

7小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业