Arm全新IP解析:功耗值得关注,小核前景堪忧

三易生活·2025年09月11日 20:16
新的旗舰手机注定更快,但入门款则前途未卜。

最近这几天,Arm在上海召开Arm UNLOCKED峰会,正式发布了面向移动端的Arm Lumex计算子系统(Compute Subsystem, CSS)。

什么是Lumex CSS?用最简单的话来说,它其实就是Arm如今的一种“营销概念”。Lumex CSS至少包括Arm全新的C1系列CPU架构设计、G1系列GPU架构设计、C1-DSU核间总线设计,以及其他一些周边系统IP设计,全部“打包”起来的产物。

需要注意的是,Lumex CSS并不等于完整的SoC架构授权,因为它本身并不包括NPU、基带、电源管理、ISP等许多常见移动平台的必备组件。这也是为什么今年“Arm CSS”这个概念最开始引发外界关注时,就有不少人辟谣“即便买了完整的Arm CSS,也没法直接做成手机SoC”的原因。

当然,从目前网络中流传的部分信息来看,现有的各一线大厂,基本都是基于Arm的架构、甚至指令集授权去做二次开发。所以Lumex作为“官方公版”的意义,本质上还是与过去一样,主要针对的是自研能力不足的中小芯片厂商。

但即便如此,这并不意味着此次公布的Lumex CSS对于关注手机行业,对下一代移动设备平台好奇的朋友来说就没有意义了,因为深入探究其中的内容,还是可以发现不少有趣的、值得一讲的东西。

产品命名逻辑大改,但实际效果还有待商榷

首先正如前文中已经提及的那样,Arm Lumex CSS这次包含了全新的CPU和GPU IP。而且与过去Arm经常“只更新大核、不换代小核”的操作不同,这一次他们不仅将全部的CPU、GPU架构都进行了换代,并且将整个产品命名体系都做了很大的调整。

具体来说,Arm发布了四款新的CPU IP,分别是C1-Ultra、C1-Premium、C1-Pro和C1-Nano。

从定位来看,C1-Ultra代表的是旗舰SoC里的“超大核”,也就是接替现在Cortex-X925的位置。

C1-Premium代表的是“次旗舰大核”,Arm对它的解释是架构与超大核相同,但缓存没那么大,且使用密度库(也就是主频会更低、但能耗也更低)制造。换句话说,它其实相当于是将联发科之前用过的Cortex-X4m“转了正”,正式独立为一条CPU产品线。

剩下的C1-Pro和C1-Nano就很好理解了,它们分别继承了Cortex-A725和Cortex-A520的产品定位。

与此同时,Arm还发布了名为“Mali G1”的GPU IP家族。它从最入门的版本到最高配型号之间倒是并无架构区别,而仅以着色器核心数量进行版本区分。其核心数量可在1核心到24核心之间进行定制,并根据核心数量的不同,被区别为G1-Ultra、G1-Premium、G1-Pro至少三个级别。

但这里Arm既没有提到每个版本之间具体的核心数量标志差异,也并未说明是否存在入门款的“G1”或“G1-Nano”。

新IP性能普遍提升,不过功耗值得注意

其实从命名逻辑来说,Arm这一轮新品体系很显然是想要表达它们“全新的”、“与过去不同”的身份。另一方面,与过去的三位数字命名法相比,新的IP命名规律显然是想要让未来换代之后的“代次区分”变得更明显。比如将来的G2、G3,大家很快就能知道比现在的G1更新,的确就会比现在X925、A710、A520这样的命名来得更易区分“新旧”关系。

但Arm现在的这种命名方式也带来了一个问题,那就是消费者更难直观地判断同代次之间的核心性能高低程度了。是的,C1-Ultra当然要比C1-Nano快得多,但具体“快多少”呢,就更不方便进行判断了。

而且哪怕是对比上代产品,Arm也并没有将新IP的性能进步幅度完全说清。

比如他们声称,与前代“超大核”Cortex-X925相比,C1-Ultra的IPC(单时钟周期性能)提升了12%,微架构性能表现提升了26%。

但Arm方面却没有给出C1-Premium相比于前代“次旗舰超大核”的性能改进幅度具体数据。虽然这可能是因为X925本身就没有次旗舰变体,要对比就只能找出前前代的X4m,但也不排除新的次旗舰架构进步幅度没那么大、对比数据不够好看的可能。

相比之下,他们对于C1-Pro的性能进步幅度给出的数据又变得具体了起来。根据Arm方面的说法,与Cortex-A725相比,C1-Pro在同等性能下的功耗要低26%;如果是达到同等功耗,那么C1-Pro的性能将可以比Cortex-A725块11%。同时如果两者均设定为相同的主频,则C1-Pro的性能最高可以比Cortex-A725高出16%。

从这三组数据就可以知道,在相同主频的前提下,新的C1-Pro大核功耗其实是会比Cortex-A725略高一点的,但因为性能进步更大,所以算起来能效比依然是上涨了。

最后,则是“小核心”C1-Nano。Arm对于它的性能数据给得比较详细,但可惜从这些数据来看,C1-Nano本身的改进并没有将重点放在性能上,而是更多地体现为面积的缩小、功耗的降低,以及支持最新的指令集。

按照Arm方面的说法,在SPECint2017中,C1-Nano对比Cortex-A520综合跑分提升大约为5.5%。在处理相同程序的前提下,它的能效提升了26%。

最后,则是Mali G1-Ultra GPU。Arm方面表示,它在跑分软件和游戏中的性能相比上一代(G925)提升了20%,同时单帧功耗降低了9%。那么经过计算就可知,此时它的整体功耗其实是上涨了的,涨幅约为9.2%。好在此时G1-Ultra的光追性能可以达到前代的两倍,对于未来可能出现的“重光追”手游来说,它依然有望带来远超20%的帧率提升幅度。

新的旗舰手机注定更快,但入门款则前途未卜

说了这么多,那么Arm的这一批新架构对于即将到来的新一代智能手机以及SoC来说,意味着什么呢?

首先必须要注意的一点,是无论在Arm的规划还是目前出现的传言中,新的旗舰移动平台都不可能使用C1-Nano“小核心”。Arm的说法,是顶级旗舰可能会使用两颗C1-Ultra搭配六颗C1-Pro,我们甚至不排除厂商减少“中核(C1-Pro)”数量、加入更多的“次大核(C1-Premium)”,来换取更高跑分成绩的可能。

综合前面的分析以及行业里近年的动向来看,除非台积电的N3P工艺再度“发威”,否则在各家大概率会在进一步提高旗舰SoC峰值主频的前提下,基于新CPU、新GPU的新款旗舰平台,峰值功耗恐怕会有进一步的上涨、而非下降。

当然大家倒也不必紧张,因为新架构的IPC确实是提升了,这也就意味着在跑分之外的场景、包括重负载游戏,只要不出现新的“性能杀手”,那么新旗舰的实际运行频率注定会比现在的平台更低。结果就是日常使用的能效肯定会有显著改善,甚至重负载游戏功耗都有可能会进一步降低。

相较之下,更让人担心的反倒是那些单纯基于C1-Nano的低功耗设备。虽然目前的各种证据显示,新架构客观上对比Cortex-A520的确有所改进,但一方面它的性能进步幅度显然比其他的“大核”们要小许多。另一方面,随着越来越多的旗舰、次旗舰平台“弃用”CPU小核,无论软件开发者、芯片设计厂商,甚至是未来的Arm,都有可能会对小核的改进越来越失去“动力”。

要知道在隔壁苹果的Apple Watch里,驱动手表的CPU架构早就已经是源自A16能效核的““Sawtooth”方案,也就是缩小版的“中核(定位更接近A725或这次的C1-Pro)”了。对于主流消费电子产品来说,纯粹低功耗“小核”的退场,很有可能已经只是时间问题。

本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

是什么将疫苗行业带进冬天?价格战、疫苗犹豫、行业内卷……在半年报中,头部疫苗企业将困境部分归因于这些行业共性问题。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业