数字人登上亚运会,大模型是幕后功臣 | Future

林炜鑫·2023年09月25日 11:28
在大模型时代,数字人获得新的生命力。

当瓦特蒸汽机的齿轮转动了第一圈;当乔布斯从牛皮纸袋掏出Macbook;当ChatGPT用流畅优美的语言回答第一个问题。科技,曾经、正在、也将改变未来。

【Future】是36氪科技报道团队主理的一档专栏,我们将围绕科技产业的前沿突破,记录那些实验室里令人振奋的新技术,是如何穿越PMF(Product Market Fit 产品与市场结合)的惊险周期,进而影响更广阔的商业社会。

在这里,看见【Future】。

文 | 林炜鑫

编辑 | 苏建勋

谁也没想到,点燃亚运会开幕式火炬的,竟是超一亿数字人。

这在亚运会历史上尚属首次。手持火炬的巨型“数字人”,踏过钱塘江,绕体育场飞奔,近10万观众爆发出巨大的欢呼声。

工程师方凯坐在看台,和身旁的人一块庆祝。他是支付宝团队的技术专家,为亚运会数字人项目提供技术支持,前后忙了一年半。20多万行代码,10多万次测试,圣火点燃,方凯长舒一口气。

数字点火仪式是整个项目的高潮,在此之前,支付宝花费数月时间,召集用户加入线上火炬传递。方凯告诉36氪,每位用户都拥有各自的3D数字人形象,点火仪式后会获得一张专属证书,永久存储在区块链上。

数字人玩法成功吸引了超一亿普通用户。这些数字人在开幕式上,化身一个个小火苗,汇聚钱塘江,形成具象的“数字人”,跑进场馆内的185米立体网幕。

“数字人”在传递火炬

方凯表示,为了让用户的数字人达到“千人千面”的效果,团队在研发前期折腾许久,最终把目光投向最新的人工智能技术。

生成式AI没有让他们失望。技术人员开发了58个捏脸控制器,AI根据人脸识别画出数字火炬手的面孔,自由调整脸型、头发、鼻子、嘴巴、眉毛等。方凯透露,AI最多提供2万亿种形象搭配。

他们还研发了AI动作捕捉,只需输入少量的真人动作,AI便可驱动数字人自主学习更多动作。

“3D数字人的工作流比2D要复杂非常多,起初内部评估工期,大家都很崩溃。”方凯说。幸运的事,生成式AI极大提升了产能,不夸张的说,拯救了焦头烂额的技术团队。

开幕式还未结束,“亚运会数字人”便冲上了微博热搜。

开幕式现场的巨型“数字人”

国内数字人赛道的从业者也在讨论开幕式。一位业内人士告诉36氪,亚运会数字人在技术上不难实现,但创意很新鲜,更重要的是“对数字人这个概念做了重要的推广”。

亚运会这一年,也是AI蒙眼狂奔的一年,数字人则是老树生新芽,有了新的生命力。

大模型把数字人抢救回来

数字人不是新鲜词,2021年,元宇宙还是风口,数字人被认为是元宇宙不可或缺的一环,成为资本追捧的宠儿。翻开数据表,2021-2022年数字人赛道出现57起融资,总金额达44.61亿元。热钱砸过来,数字人借势起航。

数字人公司良胜数字CEO张大胜回忆,那会市面上爆红的数字人“大多是Q版(卡通)形象”,原因则是制作团队大多出自游戏领域。

如果你还记得,在抖音吸粉无数的“柳夜熙”,凭借国风美妆“捉妖”人设,拿下超过200个品牌合作,其中包括安踏、vivo、字节游戏、小鹏汽车等。风光无限之际,没人在意“柳夜熙”背后的公司仅制作投入就烧了百万元,制作第一条短视频又花了几十万。

结果“柳夜熙”在抖音快两年,一共只发了48条短视频。人们这才意识到成本高昂是大问题。小冰公司首席运营官徐元春曾对媒体说,一个3D数字人运营一年可能要花掉五六百万。更要命的是,成本很难砍下来。

彼时数字人缺少大规模的商用场景,仅有的一些B端需求则杯水车薪。烧钱成了无底洞。

当元宇宙被大厂们渐渐冷落,数字人的寒冬也就来了。

直到生成式AI崛起,进入各行各业,数字人的命运发生变化。张大胜表示,“大模型对数字人的影响是翻天覆地的。”而新壹科技CEO雷涛对36氪说,“大模型为数字人注入了灵魂。”

大模型直接降低了3D数字人的制作难度。新壹科技有自研的视频大模型,并搭建了数字人工具平台。雷涛表示,过去3D建模依赖传统CG技术,动作捕捉需要采集真人大量数据,现在在他们的平台上,算法可以高效生成3D模型,处理面部细节,“更加逼真”

方凯说,数字人吸引C端用户的关键在于个性化定制。过去受技术限制,数字人长得都差不多,而大模型拓宽了用户“自定义的自由度”。

支付宝工程师设计数字火炬手形象

张大胜选择与科大讯飞合作,在星火大模型的基础上,研发小模型,作为3D数字人的“大脑”。接入大模型能力,数字人获得了“人设”。他谈起公司最近正和一家咖啡店连锁品牌合作,做咖啡客服数字人。“喂了世界上全部的咖啡知识给它,”张大胜告诉36氪,“它会是最懂咖啡的数字人。”

大模型对2D数字人的提效更加夸张。AI的生成能力天然适配2D数字人。近几个月,市面上出现了许多2D数字人定制工具,逻辑基本一致:只要你输入文案素材,就能生成数字人形象。

“我们的2D数字人售价一万元左右,24小时就给你做好了。”雷涛说。价格被打下来后,一些公司果断从3D数字人转向2D数字人,生怕错过商机。

数字人,入侵直播带货

汲取了元宇宙时期的教训,今天的数字人公司有了更强烈的时不我待。等不及打磨技术与产品,就已经在寻找能落地的商业场景。

最容易想到的便是电商直播。

一间200平的大平层,深夜四下无人,20多位数字人主播出现在显示屏上,兢兢业业地直播带货。在电商大本营杭州,这样的办公室如雨后春笋那样冒出来。

即构科技相关负责人杜晓斌对36氪说,电商直播是普通人最容易接触的场景,2D数字人已经做到直播互动,只要企业建立一个知识库,直播时触发关键词,就能让数字人调取相应知识去回答。接入大模型能力,数字人主播的互动效果还能有所提升。即构科技主营音视频云服务,今年开始提供2D数字人服务。

雷涛认为,数字人主播24小时不下播,光这一点就让店铺省下一大笔钱。事实确实如此。一家杭州电商尝试用数字人开播,一星期后,老板裁掉了公司十几位主播。结果,公司照样赚钱不误。

养那么多人还不如数字人能干活,那位老板感慨道。

张大胜告诉36氪,今年许多大厂都下场做2D数字人,赛道内卷严重。作为一家初创公司,他战略放弃了2D数字人,专注打造高端3D数字人。他强调:“超写实”。

良胜数字推出超写实数字人AINIA

他的团队正在研究如何让数字人透过文本懂得正确的情绪,“你得让数字人讲话带有情绪,才能使用户交互体验更好。”

这些3D数字人造价在80-150万之间,将用于金融、教育、旅游等提供服务的行业,也会和一些企业联名打造IP形象。总的来说,要做的生意比直播带货更高级,自然也会更难。

相比之下,一款2D数字人主播,最低只需几百块。卖数字人的公司,率先赚到了钱。

遗憾的是,便宜往往没好货。被数字人主播坑了的电商不在少数。要么数字人实际效果远被夸大,只买了个模版,要么数字人开播,数据惨淡,甚至被平台封号。杜晓斌表示,“目前政策没有特别明确,平台也有自己的规则。”

尽管市场略显混乱,但数字人总算淌出了一条商业道路。

多位从业者对数字人的未来表示乐观,在他们眼里,技术迭代很快,极有可能解决数字人现有的问题。而一切努力的指向便是,让数字人更像人。

打造亚运会数字人的方凯,坚信技术进步会让数字人加速走向大众,而未来将是一个虚实结合的世界。他很期待那个世界。“我是游戏爱好者,”他说。

欢迎交流

+1
316

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

此前油价起飞,为什么能源股没跟上?大型美国能源公司的股票开始反弹,能源股的“至暗时刻”是否已经结束?散户却为何缺乏追涨意愿?

2023-09-25

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业