来源:内容编译自phys,谢谢。
当今最苛刻的机器学习应用所采用的深度神经网络模型已经变得如此庞大和复杂,突破了传统电子计算硬件的极限。
子硬件可以利用光进行机器学习计算,是一种速度更快、更节能的替代方案。但是,有些类型的神经网络计算光子设备无法执行,需要使用片外电子设备或其他会影响速度和效率的技术。
经过十年的研究,麻省理工学院等机构的科学家开发出了一种新型光子芯片,可以克服这些障碍。他们展示了一种完全集成的光子处理器,可以在芯片上以光学方式执行深度神经网络的所有关键计算。
该研究发表在《自然光子学》杂志上。
该光学设备能够在不到半纳秒的时间内完成机器学习分类任务的关键计算,同时实现超过 92% 的准确率,其性能与传统硬件相当。
该芯片由形成光学神经网络的互连模块组成,采用商业代工工艺制造,可实现该技术的扩展并将其集成到电子产品中。
从长远来看,光子处理器可以实现更快、更节能的深度学习,适用于激光雷达、天文学和粒子物理学的科学研究或高速电信等计算要求高的应用。
“在很多情况下,重要的不仅仅是模型的表现如何,还有你能多快得到答案。现在我们有了一个端到端系统,可以在纳秒的时间尺度上运行光学神经网络,我们可以开始在更高的层次上思考应用程序和算法,”电子研究实验室 (RLE) 量子光子学和人工智能组的客座科学家、NTT Research, Inc. 的博士后 Saumil Bandyopadhyay 说道,他是新芯片论文的主要作者。
与 Bandyopadhyay 一起参与撰写论文的还有 Alexander Sludds 博士、资深作者、电气工程与计算机科学系教授、量子光子学与人工智能组及 RLE 首席研究员 Dirk Englund 等人。
利用光进行机器学习
深度神经网络由许多相互连接的节点层或神经元组成,这些节点层或神经元对输入数据进行操作以产生输出。深度神经网络中的一个关键操作是使用线性代数进行矩阵乘法,这会在数据从一层传递到另一层时对其进行转换。
但除了这些线性运算之外,深度神经网络还执行非线性运算,帮助模型学习更复杂的模式。非线性运算(如激活函数)使深度神经网络能够解决复杂问题。
2017 年,Englund 团队与 Marin Soljačić(塞西尔和艾达格林物理学教授)实验室的研究人员合作,在单个光子芯片上展示了一种光学神经网络,可以用光进行矩阵乘法。
但当时该设备无法在芯片上进行非线性运算,必须将光学数据转换成电信号,再送到数字处理器进行非线性运算。
“光学中的非线性非常具有挑战性,因为光子之间并不容易相互作用。这使得触发光学非线性非常耗电,因此构建一个可扩展的系统变得具有挑战性,”Bandyopadhyay 解释道。
他们通过设计一种称为非线性光学功能单元(NOFU)的设备克服了这一挑战,该设备结合电子学和光学技术在芯片上实现非线性操作。
研究人员利用三层执行线性和非线性运算的设备,在光子芯片上构建了光学深度神经网络。
全面集成的网络
首先,他们的系统将深度神经网络的参数编码为光。然后,2017 年论文中演示的可编程分束器阵列对这些输入执行矩阵乘法。
随后,数据传送至可编程 NOFU,后者通过将少量光线吸入光电二极管(光电二极管将光信号转换为电流)来实现非线性功能。这一过程无需外部放大器,而且消耗的能量极少。
“我们始终处于光学领域,直到最后我们想要读出答案。这使我们能够实现超低延迟,”Bandyopadhyay 说道。
实现如此低的延迟使他们能够有效地在芯片上训练深度神经网络,这一过程称为原位训练,通常会消耗数字硬件中的大量能源。
他说:“这对于在域内处理光信号的系统(如导航或电信)尤其有用,而且对于想要实时学习的系统也很有用。”
该光子系统在训练测试中实现了超过 96% 的准确率,在推理中实现了超过 92% 的准确率,这与传统硬件相当。此外,该芯片在不到半纳秒的时间内完成关键计算。
恩格伦说:“这项工作表明,计算(其本质是输入到输出的映射)可以编译到线性和非线性物理的新架构上,从而实现从根本上不同的计算缩放定律与所需工作量。”
整个电路的制造采用了与生产 CMOS 计算机芯片相同的基础设施和代工工艺。这使得芯片能够大规模生产,采用经过验证的技术,在制造过程中几乎不会出现任何错误。
Bandyopadhyay 表示,扩大设备规模并将其与摄像头或电信系统等现实世界的电子设备集成将是未来工作的重点。此外,研究人员希望探索能够利用光学优势的算法,以更快、更节能的方式训练系统。
参考链接
https://phys.org/news/2024-12-photonic-processor-enable-ultrafast-ai.html
END