搜索

华控清交CEO张旭东:数据“可用不可见”和“规定用途用量”,让数据真正成为生产要素

真梓 · 2020-06-24
不同于土地、资本和技术等生产要素,数据一旦“被看见”就会泄露具体信息,难以限制用途和用量。

在长达数千年的农业社会,经济发展的决定因素是土地和劳动。进入工业时代,资本和技术等要素逐渐成为更重要的社会资源。而当数字经济时代到来,大数据人工智能等前沿科技不断涌现,全球数据呈现爆发性增长的趋势,海量数据在AI、金融、医疗等领域的价值已经成为各方共识,数据俨然正成为这个时代最核心的生产要素,驱动人类社会迈向更高发展阶段。

然而,不同于土地、资本和技术等生产要素,数据一旦“被看见”就会泄露具体信息,难以限制用途和用量,使得各方的数据都不愿不敢共享,当下数据割裂、数据壁垒和数据孤岛现象严重。同时,数据极易被无限复制的特性也使得价值难以衡量,无法通过市场供需进行定价或者交易,阻碍了数据作为生产要素在市场上的大规模有序流通。

具体到现实生活中,数据已经被各行各业视为一种“隐形资产”,许多企业都在积极探索如何通过技术手段来解决数据流通和隐私数据保护之间的的矛盾,从而能够使手中的数据能够真正成为一种“隐形资产”进行增值。目前业内摸索出的解法是通过隐私计算的方式,帮助各方在使用数据时只获取数据价值,避免暴露原始数据,使数据“可用不可见”。据36氪了解,自2018年起,提供隐私计算解决方案的公司逐步增多,资本市场的关注度也随着市场趋势提高。 

华控清交信息科技(北京)有限公司(以下简称华控清交)是该行业的知名公司之一。该公司是由清华大学于2018年6月发起的信息技术公司,专注于研究、开发和建设基于现代密码学和博弈论的大数据安全融合技术、标准和基础设施。前高盛全球合伙人张旭东先生出任CEO,清华大学徐葳教授担任首席科学家。

目前华控清交员工团队近百人,其中75%以上拥有博士和硕士学位,员工来自华为、阿里、百度、IBM、谷歌、甲骨文和汤森路透等科技行业头部公司。公司的主要股东包括清华大学、中国互联网金融协会、北京市海淀区创业扶持基金、香港交易及結算所有限公司(港交所)、联想集团和高榕资本。

在产品端,该公司目前已自主开发并推出了基于多方安全计算(MPC)的数据安全融合平台,可以使多个非互信数据库在数据相互保密的前提下进行高效数据融合计算。该平台运用严格数学证明的密码学理论,在计算机指令集和编译器层面用密文计算替代明文计算,数据提供方和数据使用方之间的基于计算合约来调配算力执行隐私计算服务,并把计算结果给到合约指定的结果获得方,从而真正实现了“数据可用不可见”同时“规定数据的用途和用量”(“计算合约”)。

并且,华控清交开发的数据融合平台是一个拥有企业级部署、开发便利、承载技术和计算扩展性的通用性平台。同时还可以提供灵活组合的多层次产品和服务。           

华控清交的的数据融合平台

事实上,早在上个世纪八十年代,图灵奖得主姚期智院士就用数学理论证明了凡是可以在数据明文上进行的计算理论上都可以在密文上直接进行计算并得出与明文计算完全一致的结果,从而创立了多方安全计算理论。

然而往往理论到现实之间常常有着难以逾越的鸿沟。在日前的一次直播分享中,华控清交CEO张旭东介绍说,多方安全计算的安全性虽然很早就得到数学理论验证,但是和明文计算相比,全密文的计算对于算力和性能的要求也要多出百万倍以上。如何实现多方安全计算密码学理论到隐私计算技术的跨越在全球范围都是一个巨大的挑战。

据他介绍,华控清交已经通过一系列工程化研究的探索和实践,以实现数据“可用不可见”的多方安全计算技术为基础,结合联邦学习、可信计算,数据脱敏和差分隐私等基于明文的数据隐私保护技术和区块链存证技术,开发创建了一套基于多方安全计算的密文计算和明文计算相结合的隐私计算技术体系,实现了多方安全计算技术的实用化和产品化,使得密文计算的性能提升到可以满足商业应用的水平。

张旭东认为,密文计算和明文计算并不是竞争关系,而是相辅相成的关系。在解决计算效率问题时,需要将明文计算和密文计算结合,前者保证效率,后者在最关键处保证数据的隐私安全。两者灵活运用才能最大程度平衡计算的准确性、保密性和效率。

从密码学理论到通用隐私保护计算技术体系

在“规定用途和用量”方面,张旭东进一步解释,规定用途就是指定算法,规定用量就是限定使用的次数或频率。数据计算过程中的数据使用方和数据提供方根据需求在发起计算任务前达成一个使用协议,按约定的协议进行计算,这也就是前文提到的“计算合约”。在合约的约束下完成计算任务,则数据提供方所共享的使数据的特定使用权,而不暴露任何明文信息。华控清交表示通过建立从密码学理论到通用隐私保护计算体系,能够为助力数据的要素化提供技术抓手,并为建设数据互联、融合与流通的基础设施奠定基础。

据36氪了解,目前业内已有不少关于隐私计算技术手段的研究和探索,且各有优劣。在行业中也已有多家公司提供隐私计算相关解决方案,各公司由于背景和技术积淀差异性,对各技术路线的倚重也有所不同,不过各方都认为单独一项技术手段难以满足现实场景中数据安全融合的实际需求,切实可用的方案必然是结合多种技术的综合性解决方案。

目前常用的隐私计算技术手段

36氪通过采访发现,目前隐私计算的主流技术路线主要可分为多方安全计算(MPC)、可信执行环境(TEE)和联邦学习等。华控清交目前可提供全面的隐私计算解决方案,广泛适用于查询、联合统计、联合建模等多种场景。业内其他相关公司还包括数牍科技、翼方健数、锘崴科技等,BAT也有自身的方案提供。

在直播里,华控清交CEO张旭东从行业趋势出发,围绕“数据成为生产要素”的原因、难点、如何做以及对未来的展望四个方面剖析了自己对数据生产要素化的理解,并通过对数据价值“波粒二象性”的重新定义,提出了如何在数据流通中通过采用数据安全融合的新方式,使用数据的计算价值,解决传统信息共享的发展瓶颈。36氪也根据相关内容进行了整理。

数据成为生产要素的前提

张旭东认为,随着生产力发展水平,不同历史时期有着不同的核心生产要素,农业社会是土地和劳动力,工业社会是资本、技术与管理,信息时代是知识,而如今的数字经济时代,数据是信息处理和计算的对象与结果载体,是对自然资源和社会资源在分配和使用时进行优化的决策依据,利用数据对社会资源和自然资源进行整体监测调控和局部优化分析,可以大幅度提高社会劳动生产率。这是数据“天然”是数字经济的核心要素。

但是,数据不会“天然”成为生产要素,要解决两个核心问题才会真正成为生产要素。一是流通,二是确权。

数据有着与其他生产要素的不同的特征:复制成本低、可以无限地被复制、可以同时被多方使用、同时使用过程中还会生产出新的数据。传统的信息基于明文数据分享,而明文数据一旦被看见就会泄露具体信息,难以限制其用途和用量,难以厘清“责、权、利”,这导致了明文数据难以通过供需关系定价,难以大规模市场流通。

针对这些,张旭东提出了数据的“波粒二象性”,即数据的价值一方面在于其可见的信息价值,类似于量子力学的“粒子”;另一方面在于其参与计算得出的结果价值,即其计算价值,类似于量子力学的“波”。

数据“可用不可见”和规定计算价值用途用量的意义

在大数据、人工智能得以广泛应用的今天,数据的价值被更多的地体现在其计算价值上。将数据承载的信息价值和计算价值分开,使得数据“可用不可见”,才能避免明文数据因被看见导致的无限供应和使用。

同时需要规定数据计算价值的具体用途和用量,只有这样才能实现对数据定性定量的供应。因此,通过市场进行定价并大规模进行流通的将不是数据本身,而是数据的特定使用权。数据“可用不可见”和“规定用途和用量”可以实现数据的归属权、使用权、受益权和处置权的分立,为数据真正成为生产要素奠定确权基础。

张旭东也强调了“数据融合”的概念,即多种数据一起使用,可以叠加数据的内在维度,大幅提高(1+1>2)数据的计算价值。数据的计算价值是通过计算体现出来的,将多方的数据通过“可用不可见”的方式按规定用途进行计算,每一个算法产生的计算结果就是一个新的价值,而每次参与运算的数据就是一次对特定使用权的消费。“数据融合”可以有效解决之前数据“不能共享”、“不愿共享”、“不敢共享”的流通难题。

数据实现生产要素化的展望

在展望未来时,张旭东用“数据打电话”对数据实现生产要素化的蓝图进行了比喻。用“电话机”比喻客户端数据服务(DS),DS将遍布每个提供或使用数据特定使用权的社会个体,用“程控交换机”比喻隐私计算服务,在“电话机”和“程控交换机”之间流动的是计算因子- 数据的密文碎片,本身不承载任何可以“看见”的信息。“程控交换机”和“程控交换机”之间还将连接成一张多维立体的国家数据网,可以连接每一个社会个体。

数据要素化基础设施的基本模块

整体来看,张旭东认为基于合约的隐私计算技术能够有效地构建社会化数据闭环,真正打消数据价值链的不同环节对数据归属、数据安全和隐私保护的顾虑,为数据融合、为数据参与社会化大生产、为数据真正成为生产要素奠定技术基础。

+1
10

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

下一篇

有友食品线上渠道亟待强化。

2020-06-24

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业