光芯片,一些看法

半导体行业观察·2026年01月07日 11:34
AI能耗危机,硅光技术是可持续关键。

近年来,生成式人工智能的迅猛发展导致全球范围内超大规模人工智能集群的部署速度空前加快。随着摩尔定律的放缓,只有通过并行计算才能实现更高的性能,因此,数据处理和/或传输性能的提升必然导致能耗的增加。也就是说,人工智能基础设施的快速增长带来了严重的能源危机。如图 1 所示,随着数据量的指数级增长,所需的能源供应量也将呈指数级增长。从这个意义上讲,解决这一能源问题的唯一有效途径是开发一种能够将能源增长与数据增长分离的技术。

光子学具有巨大的潜力,因为光波的传播和干涉无需消耗能量,因此可以通过工程设计来实现可扩展的功能,而无需增加能耗。硅光子学在过去二十年中得到了广泛的发展,如今已完全具备提供近乎理想的平台的能力,从而释放其巨大的潜力。事实上,硅光子学能够提供高效的高密度互连,实现高带宽和长距离链路;能够实现低能耗的光路切换,且不受信号带宽的限制;以及能够进行光速计算的光子神经网络,从而加速人工智能计算。

在本文中,我们将回顾这些光子技术的发展趋势和进展,我们将论证,为了使这些光子技术成为人工智能时代可持续基础设施的重要组成部分,硬件和软件以及电子和光子学需要以互补的方式进行开发。

光收发器和交换机

A. 能耗扩展

图 2 绘制了光收发器和超大规模数据中心常用的电交换机专用集成电路 (ASIC) 的能效(单位为 pJ/bit)随时间的变化曲线。通过与光收发器的趋势进行比较,发现交换机 ASIC 的可扩展性不如光收发器,这表明瓶颈在于交换机而非收发器。令人惊讶的是,光收发器的能效已经赶上了摩尔定律的步伐,基于硅光子学的近封装/共封装光学器件的能效已经超过了 5 pJ/bit,而交换机 ASIC 的能效提升却明显缓慢。

事实上,ASIC交换机的功耗会随着吞吐量的增加而增加,在100Tbps吞吐量下,每个芯片的功耗会超过1000W;而光交换机的功耗则极低且在吞吐量增加的情况下保持稳定(图3)。因此,使用光交换机替代电交换机越多,系统效率就越高。以下将讨论一些实际问题。

B. 光交换机的系统应用案例

光交换机的一个关键缺点是无法进行数据包处理,而数据包处理正是ASIC交换机的核心功能。光交换机仅作为“光路交换机(OCS:optical circuit switches)”运行,因此不能简单地替代ASIC交换机。为了控制OCS,需要一个控制平面,而编排器或操作系统需要了解OCS的状态,并根据系统需求,通过控制平面发送相应的命令来控制光交换机。这种系统与依赖专用集成电路交换机 (ASIC) 的传统分组系统截然不同,因此,使用光通信系统 (OCS) 需要从零开始重建整个系统,并对架构进行全面优化。显然,目前世界上除了谷歌之外,没有其他公司能够做到这一点。在谷歌宣布已在其数据中心和人工智能基础设施中大规模使用 OCS 之后,光交换机开始得到广泛发展。

早在谷歌推出 OCS 系统之前,日本产业技术综合研究所 (AIST) 就已经开始研发大规模硅光子交换机。图 4 展示了 AIST 开发的硅光子交换机刀片。该交换机提供 32 x 32 个严格无阻塞连接,并带有数字控制接口,通过配置 9 级 Clos 网络,可扩展至 131,072 x 131,072 个连接。实验证明,在可组合的解耦基础设施中,这些交换机可以将网络功耗降低 75%。

用于制造这些大规模硅光子开关的制造设备是日本产业技术综合研究所(AIST)基于标准CMOS技术的内部试验生产线,该技术采用45纳米工艺规则,实现了足够高的均匀性和良率,可以大规模生产包含数千个器件(例如马赫-曾德尔干涉仪(MZI: Mach-Zehnder interferometers))的大规模光子集成电路。

光子神经网络

基于标准CMOS制造技术的硅光子器件具有高均匀性和高良率,这对于实现光子神经网络(PNN:photonic neural networks )至关重要。在PNN中,集成了大量的马赫-曾德尔干涉仪(MZI),形成网状拓扑结构,并在光域中执行矩阵-向量乘法(MVM:matrix-vector multiplications)。PNN上的MVM过程本身速度极快,且不消耗能量,可以显著提升人工智能(AI)的计算能力。因此,人们期望PNN能够分担GPU等高能耗数字处理器的计算任务。然而,PNN缺乏良好的非线性激活函数,而非线性激活函数是AI计算中另一个重要的功能。

为了解决这个问题,我们提出利用电光(EO:electro-optic)非线性效应,仅通过传播即可完成AI计算过程,而无需中间阶段的数字处理。利用马赫-曾德尔干涉仪(MZI)器件可以轻松实现这一点,该器件以电信号作为输入,以调制后的光信号作为输出。电光非线性具有正弦传递函数,这与传统的激活函数(例如 ReLU、Sigmoid 和双曲正切函数)截然不同。因此,需要寻找适用于概率神经网络(PNN)的全新人工智能模型。

A. 基于光电非线性的概率神经网络

目前,我们已提出并演示了几个基于光电非线性的AI模型,如下所示:第一个模型包含一个从输入参数空间到更高维空间的非线性投影映射。通过调整马赫-曾德尔干涉仪(MZI)的工作点来训练其光电传递函数。转换后的光学复空间中的非线性映射数据可以通过寻找超平面进行分离,类似于支持向量机。

图5(a)和5(b)分别展示了我们开发的硅光子芯片和实验装置。我们使用BFO(bacteria foraging optimization)和前向差分两种算法在芯片上进行了训练,并在图5(c)中展示了它们对多个布尔逻辑进行分类的有效性,并在图5(d)中展示了它们对鸢尾花数据集的高精度分类。该PNN仅通过无源光子电路中信号的物理传播即可完成计算,从而保证了低功耗和低延迟计算。

我们在此讨论的第二个模型是上述模型的级联版本,即“垂直分层光电概率神经网络”(,如图 6 所示)。在该模型中,所有光路的长度不会随着层数的增加而增加,从而能够实现更深度学习模型。

图 7 显示了 MNIST、Fashion 和 KMNIST 数据集的测试准确率。三层模型的准确率优于两层模型。我们在此介绍的最后一个(但同样重要)模型是光电霍普菲尔德网络。

图 8(a) 显示了我们提出的架构,其中马赫-曾德尔干涉仪 (MZI) 作为非线性神经元,将输入数据和反馈信号编码到输入的单频连续波 (CW) 光(记为 λ)上。图 8(b) 显示,经过训练后,即使对于半损坏的输入模式,也能回忆起存储的模式,这表明了霍普菲尔德网络特有的联想记忆效应。

B. 流式 PNN 的通用方案

由于运行 PNN 需要不可忽略的开销,因此必须对整个系统进行彻底评估和整体优化。另一方面,PNN 的固有优势是低延迟、高速度、低能耗等。为了充分发挥这些优势,PNN 作为流式处理器,同时具备电域和光域 I/O 时,运行效果最佳。流式 PNN 的概念如图 9 所示。通过该方案,PNN 可以同时在电域和光域中流式处理数据,从而无缝集成到数字基础设施中。

结论

硅光子技术取得了显著进步,如今在诸多方面展现出巨大的潜力,能够从高密度I/O、带宽无关的电路开关以及光速AI加速器等多个方面提升人工智能基础设施的可持续性。然而,将光子功能器件(例如OCS和PNN)引入传统数字基础设施并非易事,因此,未来需要对整体系统设计和实现进行更深入的研究。

本文来自微信公众号“半导体行业观察”(ID:icbank),作者:AIST,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

最有深度的半导体新媒体,实讯、专业、原创、深度。

下一篇

多地景区对属马、姓马或名字带“马”游客免票。

昨天

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业