相芯科技秦昊:虚拟人“淘金热”,我们是“卖铲子”的人 | 解码数字新浙商No.84

数字经济发布·2022年08月08日 14:58
人是数字新世界的中心。

相芯的使命,就是为每个人在元宇宙建立统一的身份,实现虚拟形象跨应用、跨平台的统一和流转。 

——相芯科技 秦昊 

“2020年元宇宙的概念火了,行业得到了更广泛的社会认知,但我们一直在朝着既定的脉络向前走。” 

2016年,XR领域的创业公司还没有像现在这么火。浙江大学周昆教授带领团队创立了相芯科技(下称相芯)。“相芯”,寓意人脸皮相背后的机器之“芯”,也暗含团队对技术的坚守。 

查阅相芯的资料,最早的采访可以追溯到2017年。彼时,周昆教授的学生秦昊作为技术带头人,带领团队一边打磨AR视频特效产品的落地,一边探索虚拟化身的核心技术。 

今天,以“刻画人的音容笑貌”和“描绘物的流光溢彩”为目标,相芯自主研发了虚拟数字人引擎和超写实数字物平台。那些曾被视为“神级”的好莱坞特效技术,开始走近普罗大众——只需一台手机、一款应用,就可以分分钟生成虚拟形象,来一场奇妙的科幻之旅。在数字娱乐、文化教育、智慧营销、新零售、智慧城市等领域,相芯的虚拟人都实现了落地应用。 

回看五年前相芯对于技术路线、应用场景的描述与畅想,与今天的实践一一吻合。五年时间,相芯长成了准独角兽,秦昊也从技术负责人成长为相芯CTO和执行总裁。接受访谈的秦昊专注而低调,只谈团队在做的、能做的事。在“人人都谈元宇宙”、“一切皆可元宇宙”的热潮之下,这种理性的“克制”,尤为真诚。 

“元宇宙其实代表着下一代计算平台。”在谈及可能的未来,这位务实的技术男透露出一丝野心,“我们的使命,是在元宇宙里实现虚拟人跨应用、跨平台的统一和流转,为每个人建立统一的身份。” 

这支从浙江大学实验室出发的团队,带着“求是创新”的基因,走在同样年轻的赛道上。“小宇宙”的威力,值得期待。 

谈虚拟人

CG表观结合AI技术的产物,技术路线没有高下之分

章丰:“虚拟人”“数字人”“虚拟数字人”这些概念对于大众还很陌生,业内如何区分?

秦昊:其实业内对这些概念尚没有明确定义。目前行业过热,产业处于初期阶段,场景面临落地,定义尚不成熟。抛开AI技术,虚拟化身的概念并不新鲜,已经在影视、动漫、游戏领域出现了相当多的应用,最典型的比如阿凡达。

CG(Computer Graphics,计算机图形学)生成的形象结合AI技术后,衍生出了虚拟人、数字人。行业内又细分出身份型虚拟人和功能型虚拟人。身份型,比如大家熟知的洛天依、初音未来;服务型,包括电视上的虚拟新闻主播、app里的虚拟客服助手。它们的技术路线、实现方式不同,但从功能上来讲,都是CG表观结合AI技术的产物。

章丰:技术路线之间有高下之分吗,抑或只是面向未来的不同场景?

秦昊:目前行业内应用的主流技术,很难说有绝对的壁垒,基本相差一年到两年的时间窗口。像相芯这样的强技术公司,就会持续更新迭代现有技术。我们拥有全栈的技术能力,以CG为核心,打通软硬件,以XR技术解决各类场景的连接互动需求。

不同技术面向的场景和产品不同,面临的挑战也不一样。如果是强消费级的,比如虚拟形象,挑战在于降低使用门槛;做超写实,就要集中精力做好人物效果。

相芯科技多风格虚拟数字人

 章丰:据你观察,这些年行业的技术逻辑有没有发生变化?

秦昊:底层的逻辑始终是虚实结合,变化可能在于技术应用场景的拓宽。2010年开始,专业级CG的技术开始向消费级场景发展,在面部捕捉、人物建模、投放动画等核心技术上,我们做了大量研究。到2016年,技术有了一定积累,我们希望能在产业上有所突破,相芯这家公司就应运而生。 

成立初期,相芯主攻AR视频特效技术,利用摄像头做表情捕捉,驱动虚拟形象,这项技术沿用至今。2018年、2019年,发展出虚拟客服、虚拟主播等功能型数字人。2020年“元宇宙”概念大火,行业得到了更广泛的关注,但我们一直沿着既定的脉络向前走。 

谈布局逻辑

元宇宙的虚拟形象及背后的驱动机制,是相芯要解决的核心命题

章丰:去年,相芯的愿景从“XR技术创新者”变为了“元宇宙搭建者”。

秦昊:“元宇宙”并没有给我们带来路线改变,无论是概念出现之前还是之后,我们都在做虚拟人,瞄准的是“下一代互联网的体验”。将其称之为“元宇宙”,可能更容易理解和传播。

从互联网发展的角度来看,计算平台在过去几十年经历了变迁的过程:PC互联网,以博客、微博等图文结构传播信息;移动互联网,手机APP、短视频和直播开始成为主流。每一次计算平台的演化,都带来了新的机遇,国外的科技巨头,已经投入了10多年研究它的底层规律和发展趋势。所以我们认为,下一代计算平台一定会到来。

章丰:我同意你的观点,元宇宙概念眼下有点过火,但本质上是社会演进的一种形态。你觉得“下一代计算平台”会以什么样的形式呈现?

秦昊:形式可以多样,可能是AR/VR,也可能是物联网等。可以确定的是,我们现在所创造的ID、身份都是抽象数据,下一代计算平台,对现实世界的数字化需要更具象,所有的人、物、数据,都会和现实世界有更紧密、更具体的对应。

在现实世界里,我们每个人都有音容笑貌、穿着打扮,构成了我们的形象。那在数字世界或网络空间里,又会怎样?用户将不再满足于用一串字符、一个ID、一张照片诠释自己,而希望拥有一个可实时互动的、具有“音容笑貌”的专属虚拟形象(Avatar),我们称之为3D数字形象。

相芯科技部分虚拟人形象 

章丰:人是数字新世界的中心。

秦昊:虚拟形象从创建到互动,是一项高度交叉领域的技术创新。其中涉及建模、驱动、渲染三大关键技术,每一项的技术实现难度都很高,且涉及软硬件的支持。传统CG技术做一段动画要花费大量时间、成本,我们开发了全套低成本的自动生成技术,用户只需要一张自拍照片,就可以同步生成个性化3D卡通形象,并轻松接入到各种VR/AR的应用中进行互动。

我们也提供AI虚拟助手、虚拟主播的解决方案。因为在元宇宙中,会有真实的人,也会有具备AI功能的数字人服务于人,CG可在视觉通道上优化人机交互体验。

再下一步,我们也开始解决虚拟物技术。因为元宇宙中一定会有重要活动比如电商、展览等,要实现物的流通,物的数字化是前提。

相芯复杂物体高精度数字化模型

章丰:数字世界的构建通常围绕人、物、景三个基本元素,“景”的部分你们不涉及?

秦昊:景更适合谷歌这样有数据、有实力的大公司去做,创业公司很难形成规模效应。如何将人带到元宇宙,解决虚拟形象以及背后的驱动机制问题——其中的技术命题就是相芯要解决的。打个比方,我们是淘金热里“卖铲子”的一群人,不知道金矿在哪里,但是大家一定需要铲子,我们提供必需的工具。

谈商业模式

在技术驱动、产品驱动和商务驱动之间来回转换

章丰:作为虚拟人这条赛道里出发较早的公司,相芯如何把握技术演进和商业化这对关系? 

秦昊:相芯的基因是一家技术驱动的公司,但从成立的第一天起,就考虑了产品化的问题。我们不希望透支行业和产品承诺,而是要考虑技术到底用在什么场景、如何让用户大规模使用。

从路线上看,相芯是在技术驱动、产品驱动和商务驱动之间切换的。公司成立初期专注技术,慢慢打磨产品,再转向商务驱动拓展市场;到一定阶段,可能又回来提升产品……技术、产品、商务三个齿轮,在不同的时期作为重心发力,来回转换,实现螺旋式发展。

章丰: 元宇宙概念的兴起,对相芯的商业化提速效果如何? 

秦昊:我们服务的客户、行业在激增,过去以消费、社交领域为主,现在各行各业都希望找到和虚拟人的结合点。越是热潮之下,越考验公司的战略定力和产品实力,也对解决方案提出了更高的要求:要快速接入客户的需求,同时降低他们的使用门槛和成本。

章丰: 另一方面入局者也会蜂拥而至。从虚拟人行业的竞争来看,是否形成了成熟的定价机制? 

秦昊:这几年技术创业的环境变化快,大厂开始做to B的技术输出,小厂也纷纷加入内卷,新产品快速涌现。一件在售的产品,不到半年,就会有友商展开攻势,打价格战。所以我们在定价上,要结合产品的价值、客户的承受力以及市场竞品的价格,来锚定定价区间。 

章丰: 相芯是否考虑将虚拟人技术封装成SaaS产品,让前端完成能力部署? 

秦昊:在考虑范围内。因为面向的客户群体不同,使用诉求不同,我们选择打造数字人的能力底座,提供不同的产品矩阵。

举个例子,618期间我们主推了虚拟直播带货助手解决方案。直播带货目前是电商的主流趋势,但一场直播需要团队、场地、主播等,成本动辄两三万,对中小店铺是一笔不小的成本。虚拟主播的解决方案就比较友好,支持定制,可以协同真人主播,实现互动串场、介绍产品、回答问题,店铺可以进一步活用自己的私域流量。

谈技术与人文边界

虚拟人的“灵魂”,更多是一种浪漫的畅想

2021年9月,相芯联手次世文化出品了国风虚拟偶像“南梦夏”。“虚拟偶像的流行,并非替代现有的文娱行业,而是用XR技术,让数字世界和现实世界互补互联,创造新的需求和流量,撬动一个更庞大的市场。”

章丰:南梦夏的“音容笑貌”可以用技术实现,但还需要人设和灵魂。如何解决虚拟人内容运营的可持续性?

秦昊:相芯的定位一直是底层平台的技术提供商,运营不是重点发力的方向,而是寻求与行业内的专业公司合作。产业链已经形成了比较明确的分工,出现了专门负责虚拟人运营、营销的公司,比如我们的合作方次世文化。各自发挥所长,我们可以更专注地能够做好技术和工具,支持更高频、低成本的内容产出。

这也有助于打通商业模式,留住产品和技术的商业价值。几年前,没有人提超写实,因为商业模式跑不通。普通的虚拟人,建模可能就要几十万,每做一个片子,要再叠加几十万的成本。市场上谁敢买单?所以我们致力于把成本降到最低,并提高生产力,比如两天完成南梦夏的超写实硬照,一到两周生成视频。

章丰:此前大家在热议谷歌的LaMDA拥有“意识”和“灵魂”的问题。你怎么看待虚拟人的技术和人文边界?

秦昊:我们会尽可能避免讨论这些问题。务实地说,目前的技术进展没法实现,所谓的“灵魂”更多是一种浪漫的畅想;即便实现也不见得是一件好事,可能会衍生出其他的人文问题。

从技术的角度,虚拟人灵魂的打造与AI关联更大,比如NLP(自然语言处理)或语义分析领域。现在虚拟人的作用更像机器人,更多是完成一些具体的功能,比如当虚拟主播、做内容生产、回答用户问题等,更务实一些。

章丰:AI机器人我们过去接触更多,应用也相对成熟。专注功能性AI技术的友商,和相芯是怎样的关系?

秦昊:合作协同,我们做好底层配合。AI机器人追求聊天式的自然交互,AI技术厂商侧重于知识库构建和问答逻辑,我们把界面化的东西做好,一起营造更有温度的产品。

这不是简单的从85分到100分的过程,而是产品功能和形态相互融合的过程。市场上做知识训练的公司不少,但做表观的、能做得好的公司较少。因为AI发展那么多年,门槛是逐渐走低的,但CG的门槛相对偏高。

谈愿景

为每个人建立元宇宙统一身份,实现跨应用跨平台的流转

章丰: 虚拟人技术具备天然的C端友好性。面向C端,会有哪些可能的玩法? 

秦昊:虚拟形象仍处于成长期,行业内的玩家都在探索落地场景。个人认为,早期的主要商业模式,还是通过赋能B端的产业,完善行业解决方案。同时,大部分的相关产品会触达C端用户,比如游戏场景捏脸,短视频和直播中的AR美颜特效、AR道具,虚拟偶像,车载助手等。 我们是以2B2C的方式触达用户,目前在打造消费级虚拟人平台 AvatarX ,让用户先一起做UGC,再开放工具,降低使用门槛。 

最终我们想实现的是大众对数字身份的认识,因为现在大家对数字身份、虚拟形象其实没有一个非常好的认知。 今天,我们每个人在网络空间里具备了很多形象,比如你的微信、微博等会有不同的 ID 及头像,而这种形象和现实生活中你给朋友们的印象是不完全一样的。 

相芯的使命,就是让每个人在元宇宙建立统一的身份,实现虚拟形象跨应用、跨平台的统一和流转。

章丰: 在元宇宙这样的下一代计算平台里,每个人能够跨应用去管理自己的数字形象,这确实是一个重要的话题。甚至可以基于区块链这样的底层技术,实现对自己的虚拟形象的价值管理。 

秦昊:如果目标完成,我们不仅提供了产品和工具,还有可能参与下一代计算平台的规则建立。 技术提供商的定位并不占优势,尤其是从商业模式来看。我们需要再往前走一走,无论是通过平台的方式,还是通过内容生产,把平台做得更扎实。 

章丰: 相芯的生态位很有价值,因为计算平台无论怎么演化,本质都是以人为主体的连接。 

秦昊:没错。我认为元宇宙形成之前,一定会先带动千千万万的“小宇宙”产生,它们是新型沉浸式体验在电商、社交、娱乐等场景的具体落地。 未来,千万个“小宇宙”会逐步融合成平台,真正构成下一代互联网,人们可以通过统一的界面,在其中获得更具沉浸感的体验。

快问快答

达成目标后,你如何犒劳自己?

我爱好广泛,没有特定的犒劳方式。

挑选合作伙伴,你最看重的品质?

追求极致,是我们团队从实验室沿袭至今的气质。

给创业者的一个锦囊?

实事求是。比如做产品要结合市场需求,而不是把新技术直接“摁”给用户。

你最想改变世界的一件事?

说不上来。 

如何定义“数字新浙商”?

我们的团队是从浙大出来的,代表了一类“用技术驱动商业”的人。

作者 | 程一苇 

编辑 | 王小猛 

发现未来独角兽,项目BP发过来!

如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:zhejiang@36kr.com,我们会及时回复。 

36氪浙江——让浙江创业者先看到未来!

本文来自微信公众号“数字经济发布”(ID:DigitalEconomy),作者:数字经济学会,36氪经授权发布。

+1
4

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

专注为企业提供“无需报销”解决方案。

2022-08-08

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业