国内的健康数据交易卡在了哪里?
自2024年11月首都医科大学宣武医院完成北京首例健康数据交易后,2025年4月又有福州市长乐区医院向福州数据技术研究院销售100余例颅脑MRI影像数据,所得收入纳入国库,成为医疗数据资产使用费纳入国库的“全国首单”。
头部医院纷纷下场之后,二级医院、民营医院、第三方检查检验中心等机构纷纷开始申请数据资产凭证,在当地交易所上架自己的健康数据资产。
部分上架线上交易所的健康数据交易标的(统计截至2025年7月10日,非完全统计)
然而,健康数据供应方数量的增加尚未突破质变的临界点,以及对于买方使用数据的安全性没有进一步政策规范,导致供需双方的需求点暂无匹配,整个健康数据交易市场的生长速度依旧缓慢。
以至于为了拓展更多客户,部分交易所的工作人员会拨通每一个注册者的电话,抓紧每一个促成数据交易成果的可能。
自2023年10月国家数据集成立以来,我国的数据要素已经经历了近两年时间发展,几乎完备了所有职能部门。那么,究竟是什么阻碍了医疗健康数据交易,乃至整个数据交易市场的发展?
01
供给探讨:过高的成本,过少的标的
先从数据供给角度分析问题。将原始数据转变为可供交易的医疗健康数据标的,供给方通常需要完成收集数据、治理数据、律所评估、确立资产、平台交易五个环节。
这是一个耗时的流程,更是一个耗钱的流程。
流程之中产生成本的模块主要可以拆解为三个部分。首先是数据清洗环节,这一部分的难点在于确立数据集的内容,找到原始数据及对原始数据进行清洗。这一环节中,影像数据比文本数据难做得多,但影像数据的价值也非文本数据可以比拟。
中国第三方医学影像服务上市企业一脉阳光在今年上半年上架了第一份健康数据交易标的,内容为一个20G大小的CT胸部病变交易数据集,并于9月成功完成了首笔数据交易。据该公司介绍:三甲医院医生标准一张胸部 CT 片子的成本大概为50元-60元/张,一个包含1000例患者的数据集,数据治理的成本便需要5万-6万元。
完成数据治理后,下一步供给方需要请律师事务所进行合规评估,保证数据资产的来源符合法律要求。一脉阳光告诉动脉网:“现阶段每个律所的收费标准差不多,费用与数据内容无关,仅按体量、次数计量。一般而言,单次数字资产评估的费用在5万-6万元这个区间。”
完成上述两个步骤后,数据供给方最后需要找到交易所进行资产确权,出具一份用于公示和交易的数据资产证书。这一步骤相较前面要便宜些,不同交易所收费不同,但都限定在数千元内。
由于没有成规模的数据交易,暂时无法讨论交易所是否会根据交易金额按比例提取佣金。等到市场成熟时,企业大概率还需再添一笔交易成本。
如此算下来,现在机构上架一个数据集需要支付6-7万元的基础费用与随数据集大小变动的数据资产治理成本,一个影像数据集的固定成本轻轻松松便会超过10万元。在数据交易市场未能成型前,这一规模的成本或在一定程度上阻碍了二级医院、非公医疗的入局。
02
合规探讨:归宿权之争决定兴衰
除了成本方面的考量,数据供应方更在意的是健康数据的合规问题。很多供应商拥有大量数据资产,但不参加数据交易,这里的核心问题便是健康数据的归属权确权。
自动驾驶领域是目前数据交易市场中交易比较成熟的细分领域:主机厂商能够轻而易举地采集用户的语音数据、文本数据,以及驾驶过程中产生的各类传感器数据、激光雷达数据。这些数据完全归属于厂商自己,他们不需要处理数据归属权的争议。
更为细分的语音赛道中,海天瑞声、科大讯飞等企业可以根据市场需求安排人员生成不同语气、不同语言的录音数据,进而快速形成标准化的产品,进而完整重复性的数据销售。这个过程中,供给方不需要考虑环境是否可信,它甚至简便到可以直接把数据拷进U盘,交给需求方带走。
显然,健康数据显然与上述品类不同。它不仅需要在训练模型时脱敏,还要追踪后续使用环境,保证整个数据使用流程可信。造成这一区别的关键,在于供给方并不具备健康数据的所有权。
一脉阳光告诉动脉网:“健康数据的归属权一定属于患者的。我们日常使用健康数据进行模型研究时必须先征求患者同意,在患者知情的前提下,借用患者的数据。
作为医疗机构,我们拥有的是数据的管理权和使用权,这些权利赋予我们进行数据清洗的权利,或是生成自己的模型。但若进行数据资产交易,数据的属性便由‘研究’转变为‘商用’。在现有的协议中,两者的界限是模糊的,因而医疗机构不能承担这个风险,在权利界定不清晰前进行健康数据资产化。”
要解决这一核心难题得花些时间,要么监管机构出台法律进行权利的重新界定,要么医疗机构修改知情协议,寻求患者的‘商用’授权。有企业估计,健全的健康数据交易体系估计还需要搭建2~3年。
03
需求探讨:海量的数据需求始终存在
那么,需求方愿意为这些数据集成规模地买单吗?
从动机上分析,数据需求方直接购买健康数据产生的成本会高于自己找医生标准训练产生的成本,但前者可以规避与合作方建立合作关系,共享AI的知识产权。据动脉网调研显示,多家企业都表示在健康数据价格合理、数据质量有保证的前提下愿意购买健康数据资产。
不过,需求方现阶段面临的问题在于可供交易的数据资产品类太过稀少,且同种数据几乎没有竞争企业。多中心研究只能买到单中心的数据,这里的交易体量自然难以提升起来。
同时,价格也是需求方会考虑的因素。由于整个市场仍处于成长初期,市场之内尚未形成一个公允的价格体系去评价数据资产的定价是否合理,这种不确定性也在一定程度上阻碍了交易的进展。
理论上说,医健企业始终存在的海量的健康数据需求,只要交易所做好供给,能够想到办法上架成体量、高质量的健康数据标的,整个交易市场便能自行运作起来。
04
健康数据交易的价值不止于交易本身
在讨论中国医疗AI的发展挑战时,中国数字经济学术年会大会主席江小涓曾感叹国内的健康数据复用率实在太低了,很多耗费大力气做出的高质量数据集,没能发挥出它们应该发挥的价值。
医疗健康数据交易产业的出现无疑为上述难题找到了解法。通过交易实现的复用,能够借助市场这一推手最大化医疗数据的价值。
对于AI企业而言,过去他们基于临床数据进行应用研发时,往往受限于有限数量医院的合作,可能导致算法运行时出现地域性,难以广泛应用。
而当健康数据交易成规模后,这些企业有望摆脱对于医院的依赖,在研发之初便综合多家医院的数据,制造鲁棒性更强的人工智能。此外,新的模式还能使他们在销售人工智能产品时更加独立,避免了潜在的知识产权纠纷。
对于医疗机构而言,过去数十年间他们一直谈论医疗大数据的治理价值,并为挖掘价值建起众多大数据中心。
如今数据交易初有起色,他们终于有望将数据治理从成本转化为收入,开拓新的收入增长空间。
DeepSeek涌现后,行业对于医疗健康数据交易的需求更为迫切。毕竟,从通用大模型转向专科垂直大模型,这里需要远超传统AI训练规模的标准化医疗健康数据。
需要注意的是,健康数据交易的价值不止于交易本身。健康数据资产本身具备极具弹性的价值空间,若能借助这些数据加速药械的研发、提升医院运营效率,随之爆发的效益将远超与交易过程产生的价值。
同所有产业一般,医疗健康数据商业模式的跑通也需要经历一个爆发式的投资期,越过峰谷,方能感受到边际成本降低带来的收益。
目前投资未至,好在医疗交易涉及的诸多主体都已达成共识,正为下一步资金的入驻做出准备。
据悉,已有多个城市的卫健委完成立项,与企业达成合作,厘清数据收集、数据治理、数据交易等全流程中可能遇到的困难,进而实现示范性的探索,最终形成指导链路,为供给方提供标准化的数据资产化路径。
或许不足3年,我们便能够看到医疗健康数据交易这个拥有千亿级潜在市场的产业真正崛起,并以新的方式重塑数智医疗的价值创造路径,带动整个数字医疗迭代升级。
本文来自微信公众号“动脉网”(ID:vcbeat),作者:赵泓维,36氪经授权发布。