研究人员介绍了一种可编程框架,解决了光学驱动的人工智能系统面临的重大计算难题。通过一系列图像分类测试,他们利用来自低功率激光器的散射光进行精准且可扩展的计算,同时消耗的能量仅占电子系统所需能量的一小部分。
EPFL 的研究人员介绍了一种可编程框架,有效地解决了基于光学的人工智能系统中的一个关键计算挑战。他们利用来自低功率激光器的散射光进行了一系列图像分类测试,以进行精准和可扩展的计算,与电子方法相比,所需的能量显著较少。
随着数字人工智能系统复杂性和影响力的扩大,其训练和操作所需的能量消耗也在增加,导致碳排放量上升。近期研究表明,如果当前的人工智能服务器生产速度继续下去,到 2027 年,它们的年能耗可能会超过一个小国家。深度神经网络因类似于人脑的设计而特别消耗能量,因为在众多层神经元样处理器之间存在大量连接。
为了解决这种日益增加的能量需求,研究人员加强了创建光学计算系统的努力,这一领域自 1980 年代以来就被探索。这些系统依靠光子进行数据处理,尽管光具有比电子更快、更高效地执行计算的潜力,但目前为止,一个关键障碍阻止了光学系统超越传统电子系统。
“在神经网络中对数据进行分类时,每个节点或‘神经元’必须基于加权输入数据决定是否激活。这一决定导致数据的非线性转化,这意味着输出不简单地与输入成正比,”EPFL 工程学院应用光子学设备实验室的负责人 Christophe Moser 解释道。
Moser 指出,尽管数字神经网络使用晶体管可以轻松处理非线性转化,但光学系统通常需要强大的激光来实现这一步骤。在与学生 Mustafa Yildirim、Niyazi Ulas Dinc 和 Ilker Oguz 以及光学实验室负责人 Demetri Psaltis 的合作下,Moser 开发了一种利用光进行这些非线性计算的节能方法。他们的新颖方法将图像像素等数据编码为低功率激光束的空间调制,该激光束经过自身反射多次,导致像素的非线性相乘。
“我们在三个数据集上的图像分类实验表明,我们的技术具有可扩展性,能效比领先的深度数字网络高出多达 1,000 倍。这表明它可以作为光学神经网络的一个可行平台,”Psaltis 说。
这项研究获得了瑞士国家科学基金会 Sinergia 资助,最近在 Nature Photonics 上发表。
一个简单明了的结构解决方案
在自然界中,光子通常不会像带电电子那样直接相互作用。因此,为了在光学系统中实现非线性转化,科学家们发现有必要以间接方式引发光子之间的相互作用,例如,通过使用足够强的光来改变其通过的材料的光学特性。
研究人员通过一个聪明而简单的解决方案解决了对强激光的需求:他们将图像的像素空间编码到低功率激光束的表面上。通过两次编码这些信息,并在这个过程中调整光束的路径,像素实际上被平方。由于平方是一种非线性转化,这一修改有效地满足了神经网络计算所需的非线性,同时消耗的能量远远较少。这种编码可以多次进行,从而增强变换的非线性并提高计算精度。
“我们估计,我们的系统可以使用比电子系统少八个数量级的能量来进行光学乘法,”Psaltis 指出。
Moser 和 Psaltis 都强调,他们的低能量技术的可扩展性是一个重要优势,因为最终目标是利用混合电子-光学系统来减少数字神经网络的能量消耗。然而,为了实现这种规模化,还需要进一步的工程研究。例如,由于光学和电子系统使用的硬件不同,研究人员已经在开发编译器,将数字数据转换成光学系统能够处理的格式。