WAIC办成了嘉年华,AI正在变得更实用
相比还在走跑跳的表演属性明显的人形机器人,AI在一些领域中已经开始尝试解决真正复杂、现实的问题。
今年的WAIC(世界人工智能大会)格外热闹。为期四天的展会涌入了35万人次的观众,展览面积超过7万平米,展品数量超过3000项。每天下午五点展览结束时,总会有大量的观众意犹未尽,要在保安多番催促下才走出展馆。
这种展会盛况是AI加速融入真实社会生活的一个缩影。年初DeepSeek引爆全民AI热潮,一举将今年AI发展的主旋律奠定成了落地应用。可以看到,抖音上开始出现越来越多的AI视频,Agent们开始代替用户完成修图、设计网页等复杂任务,浏览器、表格、眼镜、玩具、汽车都在进行AI化改造……
腾讯研究院联合腾讯优图实验室、腾讯科技共同发布的《共生伙伴:2025人工智能十大趋势》报告指出,AI正在发生从「推理」到「行动」的关键跃迁,其角色将从辅助人类的「数字外脑」,演变为与人类协同共进的「共生伙伴」。
AI在应用领域的大步前进,让WAIC从一个面向B端从业者的技术展会,转变成了一场吸引了大量C端观众的AI嘉年华。他们看到了机器人的拳击比赛,能进行提词、翻译的眼镜,能互动的可爱玩具,尝试了用AI创作视频与音乐,也坐进了由Agent操控的驾驶舱,品尝到了大模型调制出来的鸡尾酒。
这背后,技术和市场在这个时间点建立了一种相互促进的共生关系。一方面,大模型技术还在朝着多模态、强推理、低成本方向持续发展,支撑了AI在更多领域的落地应用。阿里云副总裁叶杰平认为,2025年的大模型已呈现出「周级迭代」的爆发态势。
另一方面,落地应用的不断深化,会支持AI技术发挥出真正的价值。阿里云创始人王坚表示,技术如果不进入市场,是永远不会成熟的。只有被投入市场中去验证,才能锤炼出真正有价值的技术。「很多项目五到十年后可能都会消失,但它们推动了探索,这本身就是价值。」
在WAIC 2025上,我们可以看到AI在Agent、视频、玩具/眼镜、汽车等领域展现出了更快落地应用的可能性。相比还在走跑跳的表演属性明显的人形机器人,AI在这些领域中已经开始尝试解决真正复杂、现实的问题。
Agent让人成为超级个体
阿里和腾讯在WAIC 2025期间举办的活动都与Agent有关。阿里展示了最新的通义大模型,并推出了首款专为AI Agents打造的云端电脑无影Agent Bay,可以执行代码运行、网页浏览、数据分析、程序开发、表格制作等基础任务,还具备视觉理解、自然语言控制、任务解析等多项AI技能。
「开源·开放:阿里云Agent应用生态论坛」上,阿里云副总裁叶杰平表示,我们正在迎来「Agent优先时代」,其核心就是Agent拥有自主完成复杂任务并从交互中持续进化的能力,「当L3智能体成为产业基座,我们将见证涌现智能与生态自组织驱动的指数级生产力革命」。
腾讯则升级了面向B端的智能体开发平台和面向C端的腾讯元器。前者将支持零代码即可轻松创建多个智能体并实现协同交互,后者则可以一键授权矩阵号发布、拉取公众号知识库。腾讯云副总裁、腾讯云智能及腾讯优图实验室负责人吴运声认为,Agent将是让大模型技术能够落地业界、产生价值的一个非常重要的形态。
吴运声表示,Agent让人兴奋的点在于,它是一个群体行为。「可能一个很小的应用,某个人在他的领域把单点做透了,也能做得很好。因为需求端是无限细分的,总是会有各种各样的机会,这个生态一直会往前发展。」
巨头们正在提供更多开发Agent能力的模型、工具和平台,让更多垂类公司能够据此去开发出丰富的垂直领域应用。公众号创作者可以利用元器平台生成账号的Agent,代替自己与粉丝互动。特赞科技的商业研究多智能体atypica.AI,就可以根据用户研究需求自主构建Agent,并模拟互动产出内容。
招聘领域,智联招聘基于多智能体架构让AI能够理解,简历中的「擅长MFC(微软C++开发框架)」意味着候选人掌握了C语言。办公领域,WPS的Agent,让用户可以通过自然语言对话完成文档创作和PPT生成。营销领域,钛动科技的Agent,能够服务于出海营销链路的创意、投放、数据分析等各个环节。
用设计Agent产品Lovart的CTO陈志博的话说就是:「生成式AI现在越来越让大家变成超级个体。」AI拓展了每个人的能力边界,让普通人也可以完成设计、编程、生成视频等任务,而Agent则将这种能力基于场景进一步产品化,降低了普通人利用AI的门槛,提升了AI结果的确定性。
AI在重构视频的创作链条
视频创作是正在被AI改变的一个重要场景。
快手高级副总裁、可灵AI事业部兼社区科学线负责人盖坤在2025WAIC可灵AI生态论坛上表示,2025年一定是生成式AI技术走向深度应用的关键一年。快手相信,视频生成模型会比通用AGI更快迎来爆发时刻,应用的成熟和发展速度也会更快。
目前,可灵已经为超过2万家的企业客户提供了API服务,累计生成了4亿多张图像和2亿多个视频。华策影视北京事业群新剧总经理、制片人赵劼表示,华策2024年已经开始在短剧创作上尝试使用AI生成的场景。蓝色光标CEO潘飞透露,蓝色光标平均每个月用可灵AI创作的影视级别的视频有两三万条。
与用模型生成视频素材相比,通过改造AI工具产品来重塑行业生产关系,是AI变革视频创作的更深层目标。可灵在WAIC上推出了新的视频创意工作台「灵动画布」。这是一个更符合AI时代视频创作习惯的工具,能够在一个界面中覆盖素材生成、协同再到成片的创作全流程。
可灵之外,Vidu、MiniMax、视效公司数字王国也都在致力于优化AI视频的创作流程。其中,Vidu Q1省去了分镜制作环节,仅需上传人物、道具、场景等参考图即可直接生成一段视频。MiniMax的海螺视频Agent则计划逐步完成专业模板化创作、半自定义编辑和完全形态的端到端Agent三级跳。
数字王国此前推出了人工智能驱动的影像创作解决方案「汉堡」,并将其应用于阿里云、联发科技的商业广告创作。在WAIC上,数字王国展示了一站式影像创作平台「AI DOMAIN」,具备文生图、图生频、局部重绘、风格转绘、智能扩图、图频超分、虚拟人生成七项核心功能。
盖坤认为,随着时间的演进,模型的生成效果一定会越来越好;并且,视频生成的可控性会有持续突破。这些将为产业应用层带来更多的可能性和机会,重塑整个行业的生产关系。
玩具/眼镜在被AI重塑
在WAIC现场,除了机器人展台,AI玩具和AI眼镜的展台也总是人潮涌动。商汤的展位展示了多种AI玩具,囊括了珞博智能的毛绒娃娃、可以让吧唧活起来的底座、碰一下头顶天线就能加好友的玩具娃娃。其他展区还有多种AI玩具相关的产品,例如毛绒玩具、电子怀表、电子宠物手表等。
我们认为,AI玩具或AI陪伴类产品会呈现出功能价值和情绪价值两个方向。在功能价值方向上,产品开发者们都普遍想要聚焦儿童成长,让AI玩具在教育功能之外,还能充当孩子与家长之间的沟通中介,帮助家长了解孩子的兴趣、情绪,和孩子进行更平等、有效的沟通。
在情绪价值方向上,年轻女性往往是第一目标群体。这也使得这类产品更重视打造可爱的外观和交互行为。比如,毛绒玩具的外表,一双灵动的眼睛,糯唧唧的声音和不同的性格。甚至,一些产品并不会与人对话,而是通过眼睛、声音和震动来给到用户反馈。
本质上,情绪价值方向上的产品会更接近宠物的定位。我们在WAIC上不仅看到了实体的AI玩具,还看到了虚拟的宠物或男女友产品。智谱的多模态AI陪伴产品「Zooo 动动动物圈」就支持用户上传玩具或人物的图像,生成互动对象。
AI眼镜方面,Rokid、XREAL、Halliday三家的展台是排队的「重灾区」。我在Rokid和Halliday的展台排队一小时才体验到产品。相较Rokid采用的光波导单绿显示方案,Halliday在眼镜框上内嵌一个小屏幕的方案,要更接近传统眼镜的体验。文字不是显示在镜片上,而是需要用户稍微抬眼看向眼镜右上方的小屏幕。
当然,我们也只是看到了夸克发布的AI眼镜,可能要到年底才能了解到把阿里的to C能力装进眼镜是一种什么样的体验。
整体体验下来,我们发现AI眼镜如果能够解决好续航、近视、佩戴舒适度的问题,再将价格打下来一些,会是传统眼镜的有力替代品。
智能座舱变得更主动了
汽车也是我们认为AI会更快得到应用的一个场景。在大模型的加持下,智能座舱正在变得更加主动,从响应式的工具过渡为主动理解意图的助手。
阶跃星辰联合千里科技与吉利汽车在WAIC展位上展示了下一代智能座舱操作系统——Agent OS(预览版)。在现场工作人员的介绍中,这个Agent OS可以主动识别车内的环境变化,捕捉用户的动作与意图,在孩子入睡时会主动调低音量,可以主动识别用户拿着的行李,并及时开启后备厢。
斑马智行则联合通义及高通发布了行业首个基于高通8397平台的端侧多模态大模型解决方案,可以通过纯车端方式实现智能座舱90%的「感知-决策-执行」服务闭环。基于该方案的端原生智能体可以进行多模态意图感知理解和交互,实现从指令接受者到对话参与者的代际升级。现场,观众可以在车内让AI助手帮忙点一杯元神AI咖啡。
同时,在座舱外,自动驾驶出租车也在进一步进入到大众的生活中。WAIC期间,上海市正式宣布发放全国首批智能网联汽车示范运营牌照,允许企业开展主驾无人、收费载客的Robotaxi(自动驾驶出租车)商业化服务。百度、小马智行等8家企业拿到了首批商业化运营牌照。
就如王坚所说,市场的一个核心作用,是推动技术成熟。从WAIC上可以看到,中国正在为AI应用提供这样一个「技术的试验场」,让普通用户有机会见识到AI应用的「几百万种可能」。
本文来自微信公众号“窄播”,作者:李威,36氪经授权发布。