AI手机还没普及Agent手机又爆了?拆解八大手机巨头的AI底牌

雷科技·2026年06月22日 11:25
AI手机正在进化成Agent手机。

最近数码圈的一场口水战,直接把各大厂在AI时代的滤镜给震碎了。

小米工程师在微博上公开吐槽:“现在做大模型,某些公司只会比嗓门、比情怀、搞捆绑。” 吃瓜群众都觉得,这枪口对准的就是刚在HDC 2026大会上高调宣布余承东重新挂帅、发誓要拿下行业第一的华为盘古大模型。

图源(雷科技)

在外行眼里这不过是日常互怼,但在雷科技(ID:leitech)看来,这几句吐槽刚好戳中了2026年手机AI战场的集体焦虑。

大家都发现云端堆参数、跑分冲榜的戏码已经不吃香了,现在的手机AI想活命,就得看这两个趋势:

一个是端侧AI能不能在本地硬扛住算力压榨;

二是系统级的智能体(Agent)能不能真正帮用户干活,把App之间那堵墙给砸穿。

顺着这两条线,雷科技(ID:leitech)结合近半年的实测体验和行业观察,把各大厂的底层猛料全翻了出来,看看这场AI新战事里,各家手里到底攥着什么牌。

拆解八大手机巨头AI真实底牌

1、华为:手握全栈自主体系,“软硬芯云”筑起围墙

在HDC 2026大会上,华为所展现出的打法不仅是单点技术的突破,更是目前行业内极其罕见的“全栈全场景”体系化作战。

从底层的算力芯片到最上层的AI应用,华为正在用一条完全自主的技术链条筑起生态壁垒。

依托昇腾算力架构和完备的云端算力基础设施,为大模型的持续演进提供了源源不断的数据吞吐保障。

在端侧,华为深度融合了“麒麟芯片亲和”技术,遵循能效比与算力协同的“韬定律”,成功将原生30B入端模型(包含2B激活参数)常驻在常规运存中。借由量化剪枝和专家预测算法,手机在本地运行时不仅做到了高频小任务的低时延响应,还避开了发热功耗红线。

作为整套体系的智力中枢,openPangu 2.0大模型今年再次展现了技术厚度。不仅支持高达512K的长上下文,还计划陆续开源7大核心组件,实现了端云协同。

系统层面,Harmony OS更是国产唯一的全自研系统,最新发布的HarmonyOS 7将“Agent亲和系统架构”放在了核心位置,直接重构了应用与系统的关系,能直接将传统应用拆解、重组为可随时调用的Skills和智能体,实现服务的一语直达。

站在最前端的小艺系统智能体,日均唤醒已高达30亿次,具备2100+系统级能力和500+伙伴精选Skill。在HarmonyOS 7的加持下,小艺变成了一个拥有空间感知、能跨设备执行复杂流转任务的超级调度官。

华为最大的优势,是它终于有机会把芯片、系统、生态和AI串成一套闭环,为拥有多设备的用户提供了高度连贯的Agent流转体验,也进一步夯实了鸿蒙生态的壁垒。

2、苹果:放弃自研AI请外援,借力打力的超级玩家

WWDC 2026上亮出的Apple Intelligence和全新Siri AI,虽然对国行用户来说依旧是海市蜃楼,但它把系统层融合玩出了高段位。苹果的核心大模型AFM,本质上是找谷歌买了一份Gemini的食谱,拿回来自己魔改私有化的产物。

苹果把交互和系统权限挖得极深,Siri AI不仅有了独立的交互历史App,还长出了多模态屏幕感知能力。它能看着屏幕上的账单直接算AA制每个人给多少钱,能跨App翻找私人邮件并自动规划三天两夜的行程。

在应用层,Safari和快捷指令玩起了Vibe Coding。相册甚至能利用端侧模型将2D照片重新渲染,拓展出带有Z轴深度信息的空间构图壁纸。

靠着严苛的私有云计算(PCC)架构,苹果守住了的隐私底线。借谷歌的大脑帮自己充值智商,同时牢牢捏住系统调度大管家的地位,苹果依然精于算计。

加上苹果在软件生态的号召力,Siri AI可能会是成长最快的Agent。

3、小米:深耕自研技术基座,模型与算力两手抓

小米在2026年是深耕端侧算力的代表。今年他们直接投了160多亿元搞AI,刚发布的Xiaomi MiMo-V2.5-Pro旗舰基座,端侧激活参数直接飙到了42B。

为了让如此庞大的模型适配更多设备,小米专攻FP4(4位浮点数)量化技术。它在极限压缩模型体积的同时最大化保留原生推理精度,其特调版甚至在通用GPU上把生成速度飙到了1000 tokens/s。

有了算力兜底,小米之前开启了移动端原生智能体Xiaomi miclaw的小范围封测。它直接深入系统底层,能调用50多种系统级工具。比如收到购票短信,它能自动完成读短信、建日历、设闹钟、查天气甚至提前打开乘车码等7步操作,全程只需你最后确认。

更狠的是,它完整接入了米家IoT生态,能读取并调度超10亿台智能设备。

不拼纯软件应用,而是用Agent去盘活庞大的米家硬件生态,这才是小米独有的护城河。

4、OPPO:让AI不炫技只干活,一切围绕用户需求

两年前高调官宣“all in AI手机”的OPPO,在ODC25和ColorOS 16上,终于用一套AI思路重构了系统。他们没走堆参数的路线,而是推出了三大技术底座:

On-Device Compute(端侧智能计算)在本地跑出了峰值300 tokens/s的理论性能和128K长上下文;

PersonaX记忆共生引擎为用户构建了多模态的“终生记忆”;

Agent Matrix智能体生态框架则赋予了小布跨设备执行任务的能力。

在功能层,刷B站时激活“一键闪记”,AI不仅能近乎实时生成大纲和思维导图,点击大纲时间轴还能一键跳回视频对应段落。利用图像识别的一键记账和一键记录取餐码功能也很实用,甚至配有专属动态图标。

比起模型算力和各种技术细节,这种能帮你省掉日常麻烦、越用越懂你的“小确幸”,对普通用户来说才是最容易感知的。

5、vivo:深耕端侧轻量化,回归最真实场景

作为国内最早深耕自研大模型矩阵的厂商之一,vivo从2023年发布蓝心大模型开始,就一直在端侧轻量化这条路上狂奔。

vivo深知用户的痛点:如果断了网,AI是不是就变成废品了?通过小V记忆 2.0,vivo在手机本地直接构建起了一张完全离线的知识图谱。在不联网、绝对保护隐私的情况下,依然能让蓝心小V从海量照片和复杂文件中精准检索。

前文雷科技(ID:leitech)实测提到,虽然千元机跑大模型被折磨得够呛,但在旗舰机vivo X300 Pro上仅用32秒就能搞定复杂的图片识别。这种算力调度的深厚功底,让人对即将发布的端侧AI折叠屏vivo Fold 6充满期待。

6、荣耀:AI手机激进派,不卷参数卷交互

荣耀在2026年基本不提自家大模型参数,而是走了一条讨巧的路线,把精力砸在了重构底层交互和硬件形态上。

在硬件形态上,MWC 2026展示的Robot Phone背部搭载了微型三轴机械防抖云台,镜头能像脖子一样自动追踪主体,甚至随音乐律动,给同质化的影像旗舰提供了一种物理交互思路。

在系统侧,YOYO智能体基于AHI(个人+全局+边端协同)战略,可自动执行场景突破3000+,并且带头首发接入微信A2A协议。

荣耀这种避实就虚的打法,用系统级的调度去连接第三方垂域大模型,反而让他们在打破App孤岛这条路上跑得相当顺畅。

7、谷歌:将Gemini塞入安卓,建立端侧生态霸权

作为安卓生态的亲爹,谷歌在AI时代的野心绝不仅限于做个App,而是要彻底掌控系统底座。

在端侧下沉方面,谷歌推出了主打完全离线运行的Gemma 4模型,并在Google AI Edge Gallery中测试Mobile Actions功能,试图让自然语言指令直接转化为系统级操作。

虽然前文雷科技(ID:leitech)实测它在千元机上表现不佳,但这其实是谷歌在给全行业“立规矩”,用系统级软件生态的硬性要求,倒逼高通、联发科等芯片厂商加快中低端NPU的算力迭代下放。

谷歌最恐怖的底牌在于其生态的统治力,上有谷歌全家桶,下有安卓生态,Gemini本身也有很强的实力,当苹果需要找Gemini深度融合,当各家安卓旗舰将其作为全场景Agent的核心大脑,谷歌其实已经赢麻了。

谷歌不仅在制定端侧AI的系统级调度标准,更是在重新发放未来十年移动生态的入场券。

8、三星:坚持“外包”路线,全球化左右逢源

在端侧大模型和Agent这条赛道上,三星的走法相当务实,起步太晚,不如直接找外包。

在海外市场,三星深度绑定谷歌,Galaxy S26系列直接用Gemini大模型做底座。在MWC展会演示中,其Agent能直接在后台扫描家庭群聊,检测到大家讨论点披萨,就会自动在后台打开外卖App把商品塞进购物车,直到付款前一步才停下来让用户确认。

而在国内市场,为了合规,三星灵活地接入了百度文心一言、美图等国内大厂的AI服务。

听起来像是在吃百家饭,但我必须承认三星在体验打磨上的功力。

无论是即圈即搜、通话实时翻译,还是相册智能修图,三星把这些看似东拼西凑的能力缝合得极其顺滑。只要能配合自家顶级的硬件让消费者用得舒服,用谁家的引擎并不重要。

旗舰机可以了,如何让AI下沉到中低端?

把大模型直接塞进手机本地运行,听起来很好,不依赖网络、零延迟、还绝对保护隐私。

但现实是,旗舰机跑本地AI是在享受科技,中低端机跑本地AI纯粹是在受刑。

今年4月谷歌推出了主打完全离线运行的移动端模型Gemma 4,网上拿万元旗舰机跑测试全在叫好。

但雷科技(ID:leitech)拿搭载天玑7400中端芯片、配有NPU 655的vivo Y500 Pro去跑,结果直接让人看傻眼。

回答成了无效信息的重灾区:让它推荐长途高铁看的电影,它在本地哼哧哼哧跑了500字,足足花了2.8分钟,最后还废话连篇地提醒我记得带耳机。

逻辑题直接整不会了:做一道排座位的逻辑推理题,它在本地亮屏算了3.3分钟(期间还不能退后台),结果最后给出的还是个错误答案。

识图直接卡到死机:丢一张大商场的图,它认不出图里那么大一个Apple Store招牌;再丢一张绿植图,它直接在原地转圈加载了5分钟,直接卡死。

作为对比,同款模型在旗舰机vivo X300 Pro上,1.6分钟就能跑完逻辑题,图片识别只要32秒。

这就是冰冷的行业现实,没有强大的硬件算力兜底,端侧大模型纯粹就是折磨用户的营销噱头。

为了解决本地运存和带宽被挤爆的痛点,大厂们开始在底层魔改算法。

比如小米专攻FP4(4位浮点数)量化技术,在极限压缩模型体积的同时最大化保留原生推理精度,在通用GPU上把生成速度飙到了1000 tokens/s。

传音则走实用路线,把离线模型压缩进手机,在网络不好的非洲和中东地区,实现了多种复杂方言的离线实时翻译,实打实地用端侧AI消除了数字鸿沟。

不只是搜索画图,智能体手机要帮你干活

2026年的AI手机,本质是在抢操作系统入口。

大厂们集体患上入口焦虑,电源键、负一屏、侧边栏全塞满了AI,甚至有些厂商开始测试实体AI按键。

但入口堆得越多,用户越懵。真正实用的Agent,是要手机自己能完成操作,帮用户减少操作步骤。

行业过去最头疼的是App之间的孤岛效应,手机助手想发个微信,得靠暴力读屏和模拟点击,稍微碰上风控就得卡壳,比如说去年的豆包手机。

而最近微信终于把大门打开了一条缝,联合华为、荣耀、小米等大厂推出了A2A(Agent-to-Agent)协议。大模型不用再装作听不懂,而是手机助手直接把工单发给微信Agent,由微信自己执行并返回结果。

雷科技(ID:leitech)拿荣耀Magic8 RS实测,唤醒YOYO后说一句“给三明治发微信说原神启动”,系统能一句话跨越生态壁垒直接执行。

而没接入A2A的手机助手遇到这指令,最远只能走到“打开微信”这一步,然后就被系统弹窗拒绝。

微信这次开放,给全行业提供了一个大厂智能体之间高效协作、互不抢流量的基建范本。

在MWC 2026上,我们也看到不少优秀样本,努比亚M153则通过端侧Nebula-GUI在后台开虚拟机,直接模拟人类手指去各种没API的App里操作,完成一句话跨平台比价和预订。

结束语

盘完2026年这一整圈大厂的真实底牌,不难发现,不管高管们在台前怎么唇枪舌剑,真到了落地的层面,大家都朝着相同的方向发展:

  • 模型必须向端侧压缩,否则低配算力纯粹是在折磨用户;
  • AI必须进化为多模态Agent,从AI手机到Agent手机,未来的智能手机必须长出眼睛和手去打破App之间的围墙;
  • 隐私安全必须成为不可动摇的底线。

AI手机真正的战争,不在于谁的模型名字更长,在于谁能让普通人每天省出多少时间。毕竟,手机不是论文答辩现场,最后决定胜负的,不是参数表,而是每天拿起来的那几分钟。

本文来自“雷科技”,36氪经授权发布。

+1
16

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业