摘要:大脑通过神经元之间的电化学信号传递实现信息处理功能,这一生物机制在计算机领域得到了数学化的抽象表达。以 DeepSeek、ChatGPT 等大语言模型为例,它们本质上是在高维数学空间中构建信息互联网络,通过矩阵运算等数学操作模拟神经元的计算功能。
大脑通过神经元之间的电化学信号传递实现信息处理功能,这一生物机制在计算机领域得到了数学化的抽象表达。以 DeepSeek、ChatGPT 等大语言模型为例,它们本质上是在高维数学空间中构建信息互联网络,通过矩阵运算等数学操作模拟神经元的计算功能。
上海理工大学顾敏院士和张启明教授团队近期的一项研究实现了重要的范式突破——利用光传播的物理特性构建了光学神经元之间的连接网络,首次在光学系统中完整实现了神经网络的计算功能。
研究人员通过利用三维双光子纳米光刻技术集成微型光学衍射神经网络(DN2s, Diffractive Neural Networks)和多模光纤,在一根 0.35 米长的多模光纤的远端面上开发了一款尺寸仅为 150 微米×150 微米的新型 AI 芯片,光学神经元密度达 106 个神经元/立方厘米。
该技术的创新性体现在多个方面:
首先,在硬件层面,光学神经网络摆脱了对传统电子芯片的依赖。与需要大量 GPU 堆叠的大模型训练不同,该技术通过光学多层神经网络的光连接过程直接实现计算功能,这一技术路径为 AI 算力提供了新的方向。
其次,在具体应用场景中这项技术也展现出显著优势,例如在多模光纤图像传输场景下,系统可不依赖传统 CPU 即可完成同等功能。
值得关注的是,该技术直接通过光纤实现了全光学图像传输,成像速度约为 100 帧/秒,且训练资源需求极低,仅需不到 4 万个超参数和 4-6 小时的训练时间。与同体积的传统光纤相比,光纤传输的信号通量提升了约 1 万倍,图像最小分辨率达 14 微米,在点对点图像传输模式下分辨率可提升至 1.5 微米。
这意味着在接近头发丝直径(约 100 微米)的圆形光纤通道中,系统能精确传输约 1 万个信号点,而当前互联网广泛使用的单模光纤仅能传输单个信号点。
图丨顾敏院士课题组(来源:课题组)
这项技术有望在多个领域产生革命性影响。顾敏院士对 DeepTech 表示,这种数量级的性能跃迁有望实现接近 8G 量级的信号传输通量,为从现有 5G/6G 向更高阶通信标准的发展提供了关键技术支撑。
在量子信息处理领域,基于光学 AI 芯片的解决方案或能显著提升短距离量子计算芯片的信号传输与信息恢复能力。该课题组正在探索该技术与量子通信的融合应用,目前已完成片上多层神经网络结构的集成验证,并在开展基于该芯片平台的量子密钥分发研究。
图丨光纤端面集成光子芯片成像的概念图(来源:Nature Photonics)
其次,医学内窥镜成像方面,在研究大脑神经活动时,可作为一种类似微针的细小内窥镜探头(直径仅约 100 微米),在不损伤受体大脑组织的前提下,对活体神经元在信息处理过程中的动态情况进行观测。
这一突破性进展不仅为大脑功能研究提供了全新工具,更有望将诊疗范围扩展到传统胃镜难以触及的狭窄解剖区域,如胰腺导管、小肠隐窝等特殊部位,为现有内窥镜检查的技术盲区提供新的解决方案。
首次实现多模光纤内光信号的全光学智能处理
顾敏曾任澳大利亚斯威本大学副校长及杰出教授、澳大利亚研究委员会桂冠教授;澳大利亚皇家墨尔本理工大学副校长及杰出教授。他于 2019 年年末全职回国,现任上海理工大学校务委员会执行主席、光子芯片研究院院长、教授。主要研究领域包括现代光子学,光电子成像和物理光学等。
在光子技术领域,多模光纤因其高容量信息传输能力而备受关注。然而,多模光纤的高散射特性使得直接通过光纤传输图像变得极具挑战性。
该研究源于研究人员在 2021 年年初提出的疑问:是否能够有效解决多模光纤信息传输过程中的散斑效应?为此,他们提出并验证了多种解决方案,包括算法优化以及利用光学人工智能等方法。
经过系统评估,研究人员最终选择了基于光学神经网络的解决方案,这是一种被动式的多层神经网络架构,其兼具速度快和能耗低的显著优势。从本质上来看,该方法利用光学神经网络对光场在传输过程中产生的畸变进行校正,进而恢复因多模光纤散射而失真的图像。
这与我们日常生活中使用的花洒喷头类似,水流在管道中的流动状态具有不确定性,多模光纤中的光传输同样存在复杂的散射现象。
图丨蔚浩义在实验室调试设备(来源:蔚浩义)
该课题组希望将多模光纤与光学神经网络进行系统集成,然而在直径仅约 100 微米的光纤端面上构建多层神经网络结构,面临着巨大的技术挑战。
为此,研究人员创新性地提出了微纳级联方案:通过将微小的多层神经网络结构级联组合,并将其集成在 CMOS 芯片上。这种设计只需将多模光纤与芯片进行三维空间的机械对准,即可显著提升系统的图像恢复能力。
值得注意的是,这种性能提升呈现指数增长趋势——从当前的三层结构扩展到十层结构时,信息处理能力有望实现质的飞跃。“据我们预计,该方案不仅能有效解决光纤弯曲带来的信号失真问题,还能应对信息通量持续增长的技术需求。”蔚浩义表示。
图丨光纤端面集成光子芯片的实验结构图(来源:Nature Photonics)
研究人员采用此前该团队自主研发的三维纳米级激光打印技术,为实现微小光学神经网络结构奠定了重要的基础。
传统的 GPU 芯片中所使用的光刻技术只能在二维平面上进行刻蚀,如果想用传统的方法实现三维刻蚀,需要进行非常复杂的类似于搭积木的多层叠加工艺。
而三维纳米激光打印技术最大的优势在于,其能够实现纳米级精度的一体成型打印。这意味着,研究人员能够在 100 微米大小的光纤端面上,精确加工出任意的复杂光学结构。
值得关注的是,该技术的最小加工分辨率可达 9 纳米,并能够稳定实现十几纳米的加工精度。这不仅在国内处于领先地位,也为光学神经网络的微型化提供了关键技术支撑。
尽管此前技术方面已有一定基础但不容忽视的是,相关系统还不完善。于是,蔚浩义带领课题组成员投入了很多精力“纯手工”打造出了这个系统。在此基础上,研究团队成功制造出了体积小、性能高的光学神经网络芯片。这种芯片不仅在图像传输的分辨率上表现出色,还能够在弯曲光纤的情况下保持较稳定的传输性能。
图丨直型纤维集成微型 DN2s 的实验表征(来源:Nature Photonics)
该技术的实现也离不开研究人员对光纤弯曲技术的持续攻关。在探索性实验中,他们尝试通过控制光纤弯曲角度来优化传输性能,但发现现有方法存在固有局限:由于无法将所有可能的弯曲状态都纳入神经网络的训练数据集,系统的适应能力受到制约。也就是说,神经网络的“智能度”是有限的。
针对这一挑战,研究人员创造性地提出了光电融合的解决方案:一方面,充分发挥光神经网络在信息处理速度和能效比方面的优势;另一方面,通过级联在计算机上预训练的电神经网络,构建混合计算架构来协同处理光纤弯曲导致的复杂图像畸变问题。这一创新思路为突破现有技术瓶颈提供了新的研究方向。
此外,通过空间光调制器投射的 HeLa 细胞图像的直接光学传输还展示了迁移学习,这些图像并不在训练数据集中。审稿人一致认为这项研究具有重要的应用价值。
最终,相关论文以《通过多模光纤使用远端面微型衍射神经网络实现全光图像传输》(All-optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet)为题发表在 Nature Photonics 上 [1]。
上海理工大学蔚浩义特聘副教授是第一作者,张启明教授和顾敏院士担任共同通讯作者。目前,相关代码和数据已开源。
图丨相关论文(来源:Nature Photonics)
预计今年内完成实验室级内窥镜系统的原型开发
在转化应用方面,课题组已利用该技术成功实现细胞组织的高分辨率成像与图像传输,目前正与多家医疗机构合作推进临床前研究,预计将于今年内完成实验室级内窥镜系统的原型开发。
技术的产业化进程也取得了重要进展,据介绍,红杉资本已与该团队达成战略合作,将在技术成熟阶段直接参与产业化孵化,加速其从实验室走向临床应用。
目前,生物细胞图像信息与神经网络的结合已能实现预期功能。为进一步提升医疗体验,研究人员正致力于缩小内窥镜探头的尺寸,使其在体内几乎无感。然而,玻璃材质的光纤存在断裂风险,可能对患者造成伤害,因此研究人员正聚焦于解决光纤涂层的技术难题,确保其即使断裂也不危及患者安全。
这一技术突破需要与新兴的光学计算范式相结合。衍射神经网络凭借其快速计算和低能耗特性,尽管它不能完全取代电子芯片,但能在特定信息通量处理方面可弥补 GPU 的不足,为解决能耗问题提供新思路,有望发展为未来光学计算的新范式。
在技术融合层面,光刻技术与多层神经网络的结合未来有望形成完整的产业链。该产业链可参照电子芯片模式:上游以三维激光纳米打印光刻机等光刻技术为核心,配套光刻胶等材料研发;下游则针对不同功能的神经网络芯片进行开发。
这种架构涉及材料科学、电子工程等多学科的协同。其中,衍射神经网络的光学特性与光刻技术的微纳加工能力形成天然互补。通过整合光纤涂层、光学计算和光刻工艺等技术,不仅能推动医疗内窥镜的微型化发展,还有可能带动从基础材料到终端应用的完整产业链升级。
参考资料:
1.Yu, H., Huang, Z., Lamon, S. et al. All-optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet. Nature Photonics (2025). https://doi.org/10.1038/s41566-025-01621-4
运营/排版:何晨龙
来源:DeepTech深科技