AMD发布锐龙7000 PRO,首创独立x86 AI引擎
作为过去40年来最具革命性的技术之一,AI人工智能无疑是当下最为火爆的科技话题,也有着无限广阔的未来。
正是越来越聪明的AI,改变着人类的工作、生活、娱乐,影响着人类的方方面面,甚至可以说关乎人类未来的发展。
当然,任何技术的发展和普及,都需要在硬件、软件两个层面协同推进,达到效率的最大化,才能真正带来颠覆性的体验。
用户体验做得好不好,要看基础硬件、核心算法、生态优化等多个层面的综合实力,而拥有这种综合实力的厂商,屈指可数。
作为基础芯片大厂的AMD,不但同时拥有高性能CPU、GPU产品,在收购了赛灵思之后,更是组建了全套的AI解决方案。
无论是云侧还是端侧AI,AMD都正在大展拳脚,其中锐龙7040系列的AI引擎就是在端侧的一个爆发点,这可能会深刻影响未来人们使用笔记本的方式。
一、AI到了变革的时候 AMD锐龙很不一样
事实上,AI本身无论概念还是技术,都处在一个不断演化的过程中,也在随着应用需求的变化而不断拓展提升自己,是技术与应用相互促进、持续升级的一个典型,同时也有着多样化的实现方式、应用场景,整个行业都在深度耕耘。
对于AI实现的载体而言,虽然许多AI任务现在就可以在传统的CPU或GPU上运行,但这些通常不是执行机器学习推理工作负载的理想方案。
回顾历史,最早的AI,只能处理一些传统的固定编码算法,必须由人类编程,比较死板。
如今的AI则基于神经网络,越来越接近人脑在海量神经元之间传输、处理数据的模拟运作方式,再加上机器学习的反复、海量训练,能够越来越灵活、弹性地处理数据,展现出来的结果越来越像是一个真正的人在说话、做事,而不是冷冰冰的、死板的机器。
随着越来越多的AI模型和工作负载的发展,在专为AI任务设计的芯片上使用专门的人工智能引擎,为终端用户提供更好的性能和体验,这一点至关重要。
今年,AMD锐龙移动处理器正式进入了7000系列时代,包含多条不同的产品线,7045、7040、7035、7030、7020……应有尽有,并同时覆盖消费级、商用市场,其中7040系列无疑是最受关注的。
锐龙7040H/HS/U系列代号Phoenix,可以说是整个家族中最闪亮的明星,是主流游戏本、高性能轻薄本的上佳之选,因为它集成了AMD乃至整个移动行业迄今最先进的技术特性。
这不但包括4nm制造工艺、Zen 4 CPU架构、RDNA 3 GPU架构,其中全新的Radeon 780M集显达到了前所未有的高度,更是在x86处理器中第一个集成了独立的AI引擎单元,可为诸多应用场景提供高能效的加速效果。
Zen 4架构在消费级台式机、笔记本市场站稳脚跟之后,AMD正式把它带到了商务企业级领域,这就是全新的AMD锐龙PRO 7000系列处理器,包括锐龙PRO 7045系列台式机版、锐龙PRO 7040HS/U系列移动版。
锐龙PRO 7040HS/U系列移动版和消费级的锐龙7040HS/U系列师出同门,同样有着迄今最先进的4nm工艺、Zen 4 CPU架构、RDNA 3 GPU架构,并且同样也是集成了独立的AI引擎。
首先的一个问题是,我们为什么需要在x86处理器中加入一个本地的、独立的AI引擎?
对于很多端侧AI推理应用来说,一方面,依赖云侧的话必须等待相应资源和服务的到位,而且不可避免地会受到互联网速度、延迟的影响,体验很不稳定。
另一方面,传统的CPU处理器虽然完全可以搞定,只不过基于缓存、内存体系的CPU架构,本身就不是为AI推理而生的,效率和能效自然高不到哪里去。
尤其是缓存和内存之间固定的、共享的互联通道和有限的带宽,会成为数据传输和处理的瓶颈,也无法提供足够的专用算力。
AMD的锐龙AI引擎基于专门设计的XDNA AI架构,核心是多个独立的AIE单元,加上多个独立的内存电压单元以及对应的内存控制器,并有独立的高速互连通道。
XDNA AI架构可以脱离云侧依赖,直接在本地无延迟地灵活处理不同的AI神经网络,包括CNN(卷积神经网络)、RNN(循环神经网络)、LSTM(时间递归神经网络)等,并支持INT8、FP16、FP32、BF16等各种数据类型,还具备实时多任务能力,可处理最多4条并发空间流。
峰值算力可以达到10TOPS(每秒10万亿次计算),而且因为是专为AI推理负载设计的,因此具备远超CPU/GPU的能效。
这样的架构设计也完美解决了CPU架构处理AI时的劣势,一方面拥有独立的互连通道,不存在任何阻碍,应用可以确切地知道自己可利用的资源和可达成的效果。
另一方面AI引擎单元有专属的本地内存空间,不但可以提供更充裕的带宽,也不存在缓存命中缺失的问题。
同时,AMD锐龙AI引擎改变了推理模型的处理方式,不再像传统神经网络那样,只能在多个“神经元”之间一层一层地逐次流动,而是采用了全新的适应性数据流架构和适应性互连,可以针对不同负载、模型、数据,由不同单元、层级进行同步处理,从而大大提高性能、效率和能效,还可以由开发者进行定制,找到更适合特定负载的处理方式,实现效率最大化。
另外,锐龙AI引擎在安全性、隐私保护上也更优秀,因为本地AI网络不依赖云端,数据都是直接在本地完成,不用担心个人数据和内容泄露,更不会成为神经网络模型的一部分。
二、AI落地 AMD和微软做了很多工作
当然了,硬件和架构再优秀,算力再强大,也只是一个载体,AI好不好,最终还是要看用户体验,取决于系统、应用如何将AI能力落到实处,实现丰富的应用场景。
历史上计算领域的多次重大转变,除了硬件上的变革,更依赖于软件和应用上的创新,比如在20世纪90年代末采用64位软件和引入3D加速图形显示,都是在复杂的新硬件功能基础之上,结合丰富的软件加以支持。
目前,AMD正携手微软,加紧应对AI落地应用体验的挑战,无论是开发者还是消费者,无论是在当今还是在未来,都致力于为其提供真正将AI落到实处的环境。
目前,AMD已经与微软联合做了大量工作,Windows 11系统正在逐步释放锐龙AI引擎的能力,并直接集成在系统设置中,使用方法异常简单。
在Windows 11中的Windows Studio Effects已经可以很好地利用锐龙AI实现多项功能的加速,包括目光接触(一种补偿眼睛看屏幕而不是看摄像头的效果)、自动取景(一种在你移动时自动缩放和裁剪图像的效果),以及高级背景效果,包括背景模糊。
对许多人来说,视频通话已经成为工作和日常生活的重要组成部分,Windows Studio Effects的这些功能就是为了从不同角度改善视频通话而设计的,通过机器学习算法实现,恰恰需要用到像锐龙AI这样的NPU(神经处理单元)。
未来,锐龙AI引擎还会在更多领域大展拳脚,比如内容创作,几句话就能将概念设想变成实际的艺术品,Adobe Premiere Pro等生产力软件也可以利用AI硬件加速。
比如智能工作助手,安排日程、撰写演讲稿与邮件、整理预算、制作PPT、语音转文字等等,都可以让AI帮助你高效完成。
比如生活助手,AI可以精准、快速地整理归档大量照片、图片、视频,方便家庭回忆或朋友分享。
比如视觉与游戏增强,AI生成的画面可以直接插入游戏中,提升帧率还有同样出色的画质,AI驱动的NPC角色与实时对话、互动,可以让游戏更有真实感,更有“人性”。
当然,以上很多场景现在也已经能够实现,但要么依赖云端大模型,要么依赖高性能CPU/GPU,而现在有了独立的AI引擎,可以随时随地高效完成,尤其对于笔记本来说,可以彻底解放CPU/CPU资源,提升系统性能,也可以大大延长电池续航。
为了便于开发者以最高效率利用锐龙AI引擎,AMD在开发支持方面也相当用心,尤其是独特的一体化AMD AI堆栈,可以综合利用CPU处理器、XDNA引擎的算力与能力,支持ONNX、TensorFlow、PyTorch等多种模型,微软、OEM厂商、ISV独立软件开发商、个人开发者都可以自由使用它们。
作为其整体AI方向的一部分,AMD正在向Windows开发者提供锐龙AI软件的早期访问权限,开发者可以藉此在锐龙7040系列处理器上运行AI工作负载,并使用开源AI框架Vitis AI Execution Provider (EP),该框架在ONNX Runtime中支持Microsoft Olive。
这个工具包提供卓越的CPU支持,包括无缝和逐步提升AMD XDNA AI引擎加速,在可用性方面几乎没有任何影响。
三、独立AI 未来可期
通过将AI硬件功能集成到超薄笔记本电脑中,AMD和微软带来了出色的AI性能,而如果依赖更传统的处理器,可能是无法享受到这种体验的。
尤其是锐龙7040 PRO系列,突破性地在商用市场上引入独立的AI引擎,开创了x86处理器的新格局。
AI应用是需要生态培养的,锐龙AI也正处于起步阶段。目前虽然仍处于人工智能应用的早期阶段,但像锐龙 AI这样的专用人工智能引擎的重要性只会随着时间的推移而增加。
从内容创作到视频会议,人工智能已经在重塑计算市场的方方面面。随着人工智能使用方面的扩大,对能够更有效地加速这些工作负载的硬件和软件的需求也在增长。
目前,锐龙7040 PRO系列处理器已经赢得众多设计,惠普的EliteBook系列和联想的ThinkPad系列都将推出各自的锐龙7040 PRO系列商用笔记本产品,带来全新的移动AI体验。
未来,通过AMD与生态伙伴的合作优化,锐龙AI还可广泛用于数据分析、智能助手、计算视觉、生产创作等诸多场景。
再加上EPYC处理器、Radeon Instinct加速器、Xilinx加速器等等,AMD已经拥有了完整的AI解决方案产品线,可以灵活满足客户的不同需求,覆盖更广泛的应用。















