当AI大模型被重新定价:云知声发布U2,迎来「DeepSeek时刻」

晓曦·2026年06月08日 19:23
原生智能体时代,大模型是干净利落的生产力。

大模型行业长期沉浸在一种近乎默认正确的共识。

要大参数,模型才强;要足够长的上下文,能力才会全面;要有足够复杂的推理链条,才能显示其智能水平。

所以过去几年,从千亿参数到万亿参数,从几十万token上下文到百万token,从单次回答到越来越长的reasoning,大模型公司不断刷新技术上限,资本市场也乐于为这种更强的想象买单。模型排行榜频繁更替,训练成本被不断推高,GPU成为最昂贵的生产资料之一。

然而,当盲目堆砌参数的激情退去,行业开始面临一个无法回避的尴尬现实:动辄数千亿乃至上万亿参数的稠密模型,同步推高了天文数字般的训练与推理成本,筑起了极高的部署门槛。

无论对高举高打的企业还是极客个人而言,理想中的“智能涌现”与现实中的“用不起、用不好”之间,正割裂出巨大的落差。

上半场有多疯狂,下半场就有多骨感。

此刻,一些更有远见的玩家已经意识到范式转移正在发生,generative AI(生成式AI)正在全面跨越成为productive AI(生产力AI)。

要将足够硬核的智能能力,以更低的综合成本、更稳定的交付方式,丝滑地融入真实的产业毛细血管中。

在这个关乎行业潮水走向的节点上,有一家AI老兵用一次硬核的基座升级,给出了重构效率的解法。

今天,云知声正式发布新一代通用大语言模型底座——U2。

这不仅是云知声上市以来最重要的一场基座模型技术迭代,更是其全面转向“原生智能体(Agentic)大模型公司”的关键里程碑。

当行业还在追逐生成式AI的聊天炫技时,云知声便已前瞻性地提出了“生产力AI”这一全新概念,其背后的意义也非常明晰:AI的终极价值不是生成内容,而是解决真实世界的复杂任务。

这一概念的提出,让云知声成为当之无愧的先锋派:在同行还在谈论“涌现”时,云知声已经开始思考“干活”;在别人比拼参数规模时,它已经看穿了智能密度与token价值的商业本质。正是这种超前的认知站位,让云知声在大模型正赛开打之前,已经拿到了定义规则的话语权。

这家在AI长河里摸爬滚打十余年的企业,没有选择加入盲目的参数消耗战,而是选择在这个节点,用U2代表的全新底层逻辑,向行业宣告大模型商业价值的重新计算。云知声用十余年垂直场景的know-how,构建了一条几乎无法复制的护城河,这也正是它能够稳居国产大模型第一梯队核心位置的根本底气。

是声,又不止于声

要理解大模型的下半场,必须先看清牌桌上的玩家。

在群雄逐鹿的国产大模型阵营中,2012年成立的云知声是一个颇为独特的存在。最早从语音识别切入,一度活跃于智慧医疗、智能家居、车载座舱等场景。过去十多年,它经历了统计学习、深度学习,再到大模型时代的完整技术周期,也因此常常被看作一个有些“老派”的AI玩家。

在过去很长一段时间里,因为名字里自带一个“声”字,外界习惯性地给它贴上语音识别的标签。在大模型热潮最汹涌的阶段,外界的目光被动辄融资数十亿美金、活跃于镁光灯下的互联网新贵和“六小虎”吸引时,正处于港股上市静默期的云知声显得有些低调。

好在,会聊天的生成式AI的时代在2025年就结束了,所有人都意识到能干活的生产力AI才是重要的。此刻行业蓦然发现,云知声过去被低估的老本行,反而成了它征战智能体(Agent)时代最宽阔的护城河。

声音的背后是语言,语言的背后是意图。我们听的不是声音,是声音背后的意识。”云知声创始人黄伟这样解释云知声名字中的“声”。

在他的理解里,人机交互始终有三个层次:第一层是“听懂”,也就是语音识别,把声音转化成文字;第二层是“理解意图”,用户说“我冷了”,不是想得到一句回应,而是希望空调自动调温、窗帘自动关闭;第三层,则是理解更深层的意识与场景——一个独居老人轻描淡写地说“今天没什么事”,AI能否从语气和停顿中识别出孤独,并主动触发陪伴或提醒。

从语音识别、自然语言理解,到今天的大模型与Agent,云知声做的始终是一件事:让机器真正理解人,并帮人把事情做完。

在人机交互的真实物理世界里,要让机器真正为人服务,必须解决多轮交互、长链路任务、复杂环境噪声、人机协同等一系列工程化难题。

这种在严肃、复杂垂直场景中摸爬滚打出来的场景know-how和多轮交互工程经验,正是原生Agent生存的天然土壤。

基于这一深刻洞察,云知声最新发布的通用大底座U2,内部对其定位是,原生智能体大模型(Agent-Native Model),它的尺寸、训练目标和优化方向,都围绕“执行任务”而设计。

在技术路径上,云知声也没有沿着行业普遍采用的“模型训练完成,再外挂Agent框架”的路线走,而是提出了一套更激进的思路:

首先,是原生Agent模型 + Harness协同演进机制。过去,大部分智能体系统更像是在通用聊天模型外面套了一层壳——模型只管说话,规划、调用工具、执行任务这些事情都交给外部框架来做,模型本身其实并不真正"懂"这些。而U2在训练阶段就将如何规划、如何执行、如何验收结果的完整能力直接内化到了模型层。在训练过程中,模型与Harness(任务执行脚手架)持续协同演进:模型的主体结构越建越复杂,脚手架的支撑节点与验证精度也随之延伸、越发精细;而更精密、更严苛的脚手架,又反过来确保了模型每一层逻辑的坚固,形成一个不断自我强化的循环。

其次,是过程监督与课程学习的系统性应用。为了让Agent像做事干净利落的人一样高效,U2在训练环节引入了“课程学习”方法,让模型从易到难、上下文从短到长、工具调用从简单到复杂逐步进阶。在长程任务的轨迹中,U2引入了先进的过程监督方法,用更优的模型对任务执行的每一个关键节点拆解评估与纠错。U2不仅能看到最后的结果,更能优化中间的每一步执行路径,实现学习的快速收敛。

再者,更偏向服务实体经济与硬核产业的产业级数据配比。当很多大模型仍高度依赖互联网通用语料进行泛化训练时,云知声选择主动降低娱乐等低价值场景语料比例,将更多数据资源倾斜向医疗、医保、保险、政务、工业等高价值行业场景,并结合多年业务落地积累的真实场景脱敏数据进行训练。值得一提的是,云知声用多年业务长期沉淀、难以复制的真实场景脱敏数据进行合成与训练,直接服务于实体经济和硬核产业。

底层能力重构之后,云知声U2在不盲目堆砌参数的前提下,展现出了较强的性能竞争力。在IFBench等指令遵循评测中,U2的表现稳居行业前列;在Claw相关评测中,其Agent与工具调用能力体现出较强优势;在GPQA等硬核知识推理和长上下文任务上,U2同样展现出挑战全球顶尖大模型的能力;在面向真实办公与知识工作交付能力的GDPval上,U2取得72.5分,展现出扎实的专业办公能力。

最重要的是,U2彻底打破了“一流性能必须绑定超大参数”的魔咒。它拒绝参数虚胖,通过极致的MoE(混合专家)架构和算法优化,致力于将对标全球一流的能力压缩进更小的参数规模中,追求强而小、强而省。

低调克制的AI老兵,以领跑者的姿态,跻身国产大模型的第一梯队。

商业逻辑如何闭环?

作为有十余年行业经验的科技公司,云知声比刚入局几年的“小朋友”要清楚,技术的代际跃迁固然要争,商业逻辑也不能忽视。

过去,大模型行业习惯了用硬件和算力的单一视角来讨论token。当全行业都在比拼谁生成的token数量多、谁的计算效率高时,云知声创始人黄伟却算了一笔更有穿透力的商业账:“同样的100万个token被生产出来,如果它承载的都是闲聊和废话,那计算效率再高也没有任何商业价值。”

基于这样的认知,云知声在行业内首次提出了一个极具颠覆性的商业公式:

AI商业价值=智能密度 × token价值。

拆解来看,智能密度意味着用更小的参数、更低的综合资源投入,去达到足够高的智能水平。token价值则强调模型的每一次调用,都必须能直接转化为可衡量的业务结果——要么降低风险,要么提升生产力。

刚刚发布的U2模型,正是这一认知和思考的终极落地载体。为了让客户的每一分钱都花在刀刃上,U2在底层技术上做到了近乎严苛的压榨。

前文提到的原生Agent + Harness协同演进机制,正是在解决这个问题。通过模型与驾驭工具链共同进化,U2能以更少的交互轮次完成任务规划、工具调用、执行与验收,减少大量来回试错带来的token浪费,并进一步提升任务完成率。

与此同时,U2底层采用稀疏混合专家(MoE)架构,相比传统稠密模型需要激活全部参数,MoE面对不同任务,只激活最相关的一部分专家模型。根据云知声披露的信息,U2每次处理任务时只激活约十分之一的参数参与计算,其余参数"按需休眠"。这意味着模型在运行时的实际计算量远小于其完整规模,在保持高性能的同时,显著降低了推理所需的算力成本。 

更特别的一点,则来自U2对思考过程的重新设计。一些大模型在复杂推理时往往会展开冗长的reasoning作为思考过程——一步一步把中间过程完整写出来。虽然这种方式提高了可解释性,但也带来了另一种问题:用户正在为大量并不产生最终价值的Token成本买单。U2优先在隐空间中进行高效探索,避免把每一步中间思考都解码为可见Token;当任务进入关键阶段,模型则切换到显式推理,通过可读、可校验的推理过程完成逻辑校准、过程验证与最终决策。云知声称其为“隐式思考推理+显示思考验证”。

“如果这100万token都是闲聊废话,效率再高也没什么商业价值。”黄伟曾说到。

这种“用高智能密度追求高价值token”的策略,很快在商业化战场上迎来了真金白银的反馈,并在结果上论证了新公式带来的无限天花板。

最新数据显示,受益于高质量场景token需求的暴增,云知声5月token调用收入的ARR环比增长600%,且根据目前的订单势头,6月份将继续保持强劲的高增长态势,预计ARR可达1500万美金。

大模型的下半场,云知声的业务规模天花板已被全面、彻底地打开。

背后是云知声商业模式发生的一场本质跃迁。

长期以来,传统ToB公司都深陷项目制的泥潭——交付周期长、定制化程度高、赚的是一锤子买卖的辛苦钱。但大模型U2的发布,通过高价值token的持续输出,云知声的收入模型成功与客户的AI使用强度实现了深度绑定。只要客户在真实的业务流程中源源不断地调用AI,收入就会像打开的水龙头一样,产生高频、高毛利的自来水式复购。

如今,这套高效的商业闭环正通过云知声独特的双轮驱动版图加速落地:

To B端(兽牙智能体平台),云知声以U2为核心底座,在垂直产业攻城略地。凭借极高的任务完成率,公司近期连续中标了医疗、医保、交通、客服、工牌等一系列对准确率有着硬核要求的行业场景。这些高价值行业不仅持续贡献着高客单价,更用场景中沉淀的真实、高质业务数据,源源不断地反哺模型基座,形成了越用越聪明、智能密度越高的良性循环。

To C与开发者端(公有云MaaS),云知声则依托OPC生态全面铺开。通过更低门槛、更高性价比的模型API调用能力,面向广泛的独立开发者与C端应用生态,持续、稳定地收割高频的token流量与收入。

不盲从Scaling Law的极限,而是找到与自身资源、禀赋完美匹配的生态位。云知声用单月ARR暴涨6倍的硬核技术造血能力证明,在大模型下半场里,算得清效率账、握得住商业闭环的玩家,才拥有真正的无限未来。

正赛刚刚开始

回看港股上市这一年,云知声交出的是一份不盲从、不悬空,用技术重构效率、用商业结果自证的硬核答卷。在全行业深陷参数通胀、为高昂的算力实验买单时,这家AI老兵凭借清醒的战略定调与十余年的产业深耕,实现了技术前瞻,也找到了商业价值。

大模型底座U2的发布,更是一次打破格局的宣言。它以“高智能密度”与“高价值token”的双高解法,正式确立了云知声作为国产通用大模型核心厂商与第一梯队的稳固地位。在全面开启的原生智能体时代,大模型不再是高不可攀的奢侈品,而是干净利落的生产力。

“2023到2025年是大模型的热身赛,2026年正赛才刚开始。”黄伟曾这样说。在黄伟看来,AI的价值不在于生成更多内容,而在于进入真实业务流程,提升生产效率、优化决策质量,并创造可衡量的商业结果。某种程度上,这也是云知声对于“生产力AI”的理解:让模型真正参与工作,而不只是参与对话。

正赛才刚刚开始,AI对人类社会的改造还有很长的路要走,而大模型的底层价值,也正在被云知声这样既有长期积累、又保持技术前瞻性的公司重新定义。从率先喊出“生产力AI”的第一声号角,到U2落地成为原生智能体的标杆之作,云知声用行动诠释了什么是真正的先锋派,那便是抢在风口来临之前,自己去创造风口。

当行业终于意识到生成式AI的泡沫退去、生产力AI的黄金时代刚刚到来时,人们会发现,云知声早已站在赛道的最前沿,手握U2这张王牌,云知声驶入大模型正赛的深海。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业