最前线|英伟达推新版超级芯片 ,内存容量增加50%
作者 | 虞景霖
编辑 | 杨逍
8月8日,英伟达CEO黄仁勋重返SIGGRAPH发表演讲,宣布即将推出下一代GH200 超级芯片,和基于该芯片的DGX GH200 超级计算平台,主要面向大模型生成式AI构建。
此前,英伟达在3月已推出了GH200 Grace Hopper超级芯片,预计在5月投入全面生产。
如今,上一代还未量产上市,英伟达就推出了新版本的GH200,和上一版一样,新版也采用了72 核 Grace CPU 和 Hopper GPU。变化是采用了更高级的内存HBM3e,替换了此前版本配备的是96GB HBM3。
HBM3e 内存是一种新型的高带宽内存技术,可以在更小的空间内提供更高的数据传输速率。它的容量为141GB,带宽为每秒5TB,能分别达到H100的1.7倍和1.55倍。
较上一版GH200相比,新版GH200的内存容量增加了约 50%,带宽增加了 25% 以上。
芯片算力效果由算力速度、内存、数据传输速度三个重要影响因素决定。英伟达此次产品的突破在于,它增加了显存容量,让芯片能存储更多的数据,加快计算速度。
此外,在发布会上,英伟达宣布推出下一代 GH200 Grace Hopper超级计算平台。借助英伟达的NVLink互联技术,它叠加了两块DGX GH200,拥有 256 个 GH200 Grace Hopper 芯片和 144 TB 的共享内存。
怎么理解这款超级计算机的性能呢?假设用1亿美元预算打造一个超级计算机,能购买8800组x86架构CPU,运行一个Llama 2人工智慧模型、Vector DB向量资料库、SDXL人工智慧图像生成模型所对应算力作为1倍计算基础,花费电力损耗大概为5兆瓦(mW)。若购买GPU,则是采用GH200 Grace Hopper Superchip,可以拥有12倍算力,且电力损耗降低至3兆瓦,较单纯的CPU运作模式能源使用效率提高了20倍。
目前配备 HBM3 内存的 GH200 Grace Hopper 超级芯片已经开始生产,预计9月份正式对外销售。配备 HBM3e 内存的 GH200 Grace Hopper 超级芯片平台处于样品测试阶段,预计将于 2024 年第二季度正式推出。未来,两者将在市场上共存,但后者定价更高。
黄仁勋介绍,配备HBM3e 内存的新款Grace Hopper 超级芯片平台可以完全兼容英伟达的MGX服务器规范,并且可以与现有的服务器设计直接兼容。