医疗 AI 进入“操作系统”阶段 谁来承接基础设施角色?

时氪分享·2026年05月29日 15:44
中国医疗AI循证AgentOS轻松健康证元芳发布,走差异化路线

一位 50 岁、有高血压病史、对青霉素过敏的肺炎患者,应该用哪种抗生素方案?

在 2026 年春天的国内某医院呼吸科会诊室,一位主治医生没有翻指南,也没有打开 PubMed。他用的是一个叫“证元芳”的工具,输入了简短的病例描述。30 秒后,屏幕上返回了一份分级建议——主推方案、备选方案、禁忌项一目了然,每一个判断后面都挂着具体的循证依据:来自哪份指南、第几页、原文引用。

这是一家中国港股上市公司提供的医疗 AI 产品。它的设计原则只有一条:答案必带证据。

如果把视线拉远,证元芳并不孤单。海外的 OpenEvidence 截至 2026 年初估值约 120 亿美元,覆盖率据其披露已经达到约 40% 的美国医生;Hippocratic AI 选择做“有副驾的护士”,Glass Health 选择做“医生的病历笔记本”。在很多公开评论里,这一波被概括为“AI 终于学会引用了”。

这场“引用”只是第一层,下面正在发生的事情更值得观察:在 AI Agent 进入操作系统时代的语境下,医疗赛道开始出现具备“循证 + 多智能体协作 + 技能商店”完整形态的下一代产品。它不是一个聊天框,也不是一个搜索框,更接近于“医疗版的 Agent OS”。

在这条路径上,OpenEvidence 是参照系,证元芳和它身后的轻松健康集团(HKEX:02661),则是中国这一侧的代表案例之一。

医疗 AI 的三条路,和那个“缺失的层级”

过去三年,医疗 AI 的产品形态大致分成三条路。

第一条是“检索流”——把 PubMed、UpToDate、临床指南做成向量库,配一个对话框,回答医生的问题。这条路最熟悉,但天花板低,能力本质是“更好的搜索引擎”。

第二条是“生成流”——基于通用大模型外挂医学知识,做开放式问答。这条路话术好听,但医生圈子并不买账,最大的问题是“幻觉”:答案听起来合理,引用经不起复核。在中国,曾经有过一段时间,“医疗大模型”发布会满天飞,真正进入医院日常使用的却很少。

第三条是“循证智能体流”——围绕循证医学方法论重新设计产品。它的关键不是“回答得快”,而是“回答的过程能被复核”。这条路在 OpenEvidence 走通之后开始被市场重新审视:当一家美国创业公司能在两年时间里把 40% 的美国医生卷进自己的工作流,这意味着“医生愿意为可被复核的 AI 答案付出注意力”这件事,被验证了。

中国市场的窗口也在 2025 年下半年集中打开。2025 年 10 月,国家卫健委、国家中医药局、国家疾控局联合发布《关于促进和规范“人工智能+医疗卫生”应用发展的实施意见》,给出了 2027、2030 两个阶段性目标;北京、四川、上海等地陆续出台地方实施细则。“严肃医疗 AI”第一次有了清晰的政策坐标。

但当我们和几位卖方分析师交流时,他们也指出了同一件事:这三条路其实都是“产品层”的故事——围绕“医生问什么、AI 答什么”。真正缺的是更下一层:当多个智能体需要协作完成一个临床任务(病例讨论、用药复核、临床研究方案设计),当不同医院、不同科室需要把自己的领域知识接入到 AI 里、又要保证数据隔离和合规审计,这件事谁来承接?

通俗讲,就是:医疗 AI 缺一层操作系统。

证元芳:把“引用”做成产品架构

证元芳 2026 年 3 月发布。它的英文名是 QSevidence,evidence 是这个产品的本体。

和绝大多数医疗大模型外挂场景不同,证元芳的工作流是反过来的:先判断这道题在医学知识库里有没有可信证据、证据等级如何,然后再生成答案,再把每一个判断对应的证据链条挂到答案下面。它的内部团队把这个机制叫“System 2 慢思考”,意思是不抢着回应,而是先把证据走完一遍。

支撑这套机制的,是一个由公司自建的全球医学知识融合底座,5000 万实体级别的医学大图谱。在医学知识图谱领域,单源是常态,多源跨语种跨形态融合并不多见。

这套架构在 2026 年 5 月迎来了一次外部审视。中国信通院旗下的泰尔实验室对证元芳进行了“医疗健康智能助手(MedClaw)能力测评”,13 项功能用例全部通过——包括循证问答即时响应、证据来源追溯、复杂病例深度分析、多 Agent 协作、企业级数据隔离、临床试验方案设计、真题备考、用户记忆等。测评证书编号 2026TZ000321,有效期至 2027 年 5 月。

在更早的能力测试里,证元芳在 CMB 中国执业医师资格考试中取得满分——这是国内首家通过该考试 100% 正确率的医疗 AI 产品。在肿瘤科正高、副高考试中,它的表现达到该领域 SOTA 水平。

Health OS、MedClaw、Skills Store:医疗版的 Agent 操作系统

但证元芳本身只是产品层, 真正有意思的,是它身后的架构。

轻松健康自研的 AI 技术栈,对外的正式名字叫“AIcare”。它由“大模型层 + 业务场景模型矩阵 + 数据底座”三个底座,向上承载五个应用平台(i-Galaxy 银河、i-Odin 奥丁、i-Centaurus 半人马、i-Phoenix 凤凰、i-Magellanic 麦哲伦)。其中 i-Magellanic 是医药研究平台,证元芳就在这里。

把它翻译成大众更熟悉的语言:这是一套“医疗 Agent 操作系统”。

从中间层看,Health OS 承接了“智能体编排、工具调用框架、知识系统、记忆系统、评估系统、安全合规系统”等通用能力的封装。它的功能位置,类似 Manus、AIOS 在通用 Agent 领域里的位置——上层产品(CareMate 健康管家、证元芳、全科医生等)不需要重复造“调模型、管会话、调工具、存记忆、做安全审核”的能力,而是通过 Health OS 的统一接口去调用。

MedClaw 协作体是这个系统的智能体编排层。它能把单一对话拆解为“任务规划 → 证据检索 → 指南比对 → 结论生成 → 过程归档”等多个子任务,分配给不同角色的子智能体并行处理,最后由主控完成结论汇总。在 CAICT 的测评用例里,这一项被列为“多 Agent 协作”并通过。

MedClaw Skills Store 则是这个系统的应用层。它把“医学问答能力”进一步拆分成可独立调用、可组合的标准化技能单元——一个“Skill”可能是“读懂某一类血液检验报告”,也可能是“按 PICOS 原则生成一份临床试验方案大纲”。轻松健康方面对外披露,截至 2026 年 5 月底,MedClaw Skills Store 已上线 2000+ 个标准化 Skill,覆盖临床诊疗、公共卫生、医学影像、检验、医院管理、护理、病历、药物 8 大场景。在测评的送审快照里,这个数字是 886;过去三个月里它增长了一倍以上。

“医生问什么、AI 答什么”是产品;“一个 Skill 可以被另一个 Skill 调用、一个智能体可以编排另一个智能体”,是基础设施。这是两件事。

把这套架构和海外比一下也许更清楚:OpenEvidence 在产品层做到了“每个答案都带引用”,但它没有公开自己的智能体编排框架,也没有 Skills 商店;Hippocratic AI 做了“有上下文的护士”,但它是端到端的封闭产品;Glass Health 是个人医生工作工具。换句话说,海外这一波明星产品大多在“产品层”完成 PMF,但还没有任何一家明确把自己定位成“医疗 Agent 操作系统”。

这是中国市场可能跑得更快的一条路。

证元芳产品架构速览

数据来源:公司公开披露;36kr 整理

商业化:医生免费,机构付费

在医疗 AI 这件事上,“技术做出来”和“能卖钱”之间通常隔着一道窄缝。这道缝的成因很简单:医生侧付费意愿天然较低;医院信息化预算受限于年度采购周期;药企的市场预算又有非常严格的合规边界。

证元芳给出的答案是“医生免费 + 机构付费”的分层模式。医生侧零门槛使用,把变现压力交给医院和药企两类 B 端。医院侧通过院内系统集成、定制化部署、培训等方式付费;药企侧则通过围绕特定疾病、药品的学术推广合作付费——后者在中国市场是一个被低估的变现路径,因为药企的学术推广预算本身就在向数字化迁移。

公司方面披露的数据显示了这套模式的初步运转情况。截至 2026 年 3 月 31 日,经证元芳赋能的医路轻松平台医学专业人士用户达到 69,615 人,同比增长 46.4%,其中副主任以上医师占比 52.7%;2026 年 5 月,证元芳在国际护士节前后实现全国百家重点医院规模化落地,覆盖护理记录、病历核对、护理方案、患者宣教等高频场景。

把镜头拉到集团层面,2025 年这家公司的年报数据更能说明问题。2025 年全年收入达到人民币 12.56 亿元,同比增长 32.9%;其中健康相关服务收入 9.26 亿元,同比增长 50.2%,占比从 65.3% 提升至 73.7%;经调整净利润(非国际财务报告准则计量)为 9200 万元,同比增长 9.0%。经营活动所得现金净额 8200 万元,期末现金及等价物 8.62 亿元。

一个对照——在中国港股的数字综合健康赛道里,能够同时满足“已实现经调整盈利”、“健康服务收入占比超过 70%”、“AI 产品矩阵已落地并通过权威测评”这几个条件的公司,仍然是少数。

不过这家公司也并不是“一切都在向好”的故事。同一份年报里,整体毛利率从 2024 年的 38.3% 下降到 34.6%,主要原因是健康相关服务(一般毛利率较低)的收入占比上升。保险相关服务呈现了结构性变化:保险经纪服务收入同比下降 21.1%,保险技术服务收入同比增长 17.6%,整体几乎持平。这是数字健康公司在转型期普遍会经历的过程:业务结构在切换,毛利曲线在重塑。

一位看了这家公司年报的卖方分析师告诉 36kr:“它的财务结构和大多数互联网医疗第一梯队不一样。它的客户结构正在从保险公司主导转向制药公司主导,2025 年制药公司贡献了 67.9% 的收入,这是个不小的变化。如果证元芳和 MedClaw 真的能跑到他们说的规模,这种结构会进一步加深。”

操作系统会跑出来吗,谁会跑出来

写到这里,回到开头那个问题:当 AI Agent 进入操作系统时代时,垂直行业的 Agent OS 会在哪里率先跑出来?

答案是会在金融、医疗、法律、政务这类“高合规壁垒 + 高数据壁垒 + 高专业壁垒”的领域率先出现。原因不复杂——通用 Agent OS 难以承接行业语义、合规背书、数据资产沉淀和领域工作流;只有在某个垂直行业里,把这四样东西做厚、做硬、做久的公司,才有机会把单点产品演化成基础设施。

医疗是其中数据资产最厚、合规壁垒最高的一类。这是医疗 Agent OS 可能比金融、法律先跑出来的结构性原因。

但中国医疗 AI 的产业化仍然在早期。监管细则在迭代,医院 IT 预算的释放节奏并不快,医生的使用习惯的形成需要时间,海外的 OpenEvidence 模式在中国能不能复制、要不要复制,都仍是开放问题。

接下来一年里值得观察的,不是“谁先发布了一个新模型”,而是:谁能把“循证 + 多智能体协作 + 技能商店”的产品形态做得足够深、合规足够厚、医生付费意愿足够稳。并且,把这个产品形态从“医生工具”演化成“医疗机构的基础设施”。

这是医疗 AI 真正进入“操作系统阶段”的标志。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

2026 OPPO Reno16系列等新品发布,5月开售享补贴

7小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业