摘要:海外光通信公司COHR、LITE在2Q25财报中均提到已获得OCS(Optical Circuit Switch,光路交换机)初期收入,且预期相关收入将持续增长。Coherent认为OCS存有20亿美元的潜在增量市场空间。我们建议投资人关注OCS产业趋势、及该
中金研究
海外光通信公司COHR、LITE在2Q25财报中均提到已获得OCS(Optical Circuit Switch,光路交换机)初期收入,且预期相关收入将持续增长。Coherent认为OCS存有20亿美元的潜在增量市场空间。我们建议投资人关注OCS产业趋势、及该产业链中的在位厂商和潜在进入厂商。
OCS无需光电转化,相较于电交换机具有低功耗、低延迟、高兼容等优势。 OCS是直接实现光信号在光纤端口间切换的交换设备,其原理是直接对光信号进行物理路径的重构,从而在输入/输出端口之间建立专用光路。无需光电转换的特性带来低时延、低功耗、协议与数据无关的透明性和兼容性、可靠性等性能增益,但其技术原理也导致光路切换时间长、通道灵活性差的局限性,较难满足高并发、多对一、随机性强的通信负载。现阶段,OCS的技术路径尚未完全收敛,包括MEMS(微机电系统)、数字液晶、压电陶瓷直接光束偏转等方案,目前OCS参与者中采用基于3D MEMS技术的厂商较多。
谷歌前瞻自研OCS技术,引领行业应用。 谷歌将OCS引入Jupiter数据中心网络、以及AI大规模集群中跨机柜通信。1)Apollo项目中,谷歌用OCS替换传统数据中心网络架构中的核心层或叶脊架构中的spine(脊)层电交换机,实现不同代际和带宽的汇聚交换机模块之间低成本、高效率互联。2)TPU v4集群中,4096个TPU芯片形成64个cube,cube内部的TPU之间通过铜缆连接,进行低时延、数据包级别的电交换通信;cube之间通过48个OCS构建起一个3D环面网络拓扑,高效扩展AI集群,并提升系统可用性和能效。
OCS产业化逐步开启,潜在市场空间可期。 Cignal AI认为2025年之前主要是谷歌采用OCS,未来会有更多厂商投资于OCS领域,我们看到华为、曦智科技联合中兴通讯等亦推出全光交换方案,OCS在人工智能集群的部署量有望持续增长,Cignal AI预计到2029年OCS的市场规模有望超过16亿美元。Coherent也在2Q25公开业绩会上表示OCS交换机存在20亿美元的潜在市场机会。2025年7月,开放计算项目(OCP)宣布成立OCS子项目,成员包括Lumentum、谷歌、微软、英伟达、Coherent、iPronics等,我们认为行业生态向开放化发展、行业规范的逐步确立有望进一步赋能OCS市场增长。
风险
OCS技术发展不及预期;CPO等其他交换机技术的替代性竞争。
Text
正文
OCS:全光交换创新方案
OCS技术原理与优劣势如何?
光路交换机(Optical Circuit Switch,OCS,下均用简称)是直接实现光信号在光纤端口间切换的交换设备。 其技术原理核心在于直接对光信号本身进行物理路径的重构,从而在任意输入/输出端口之间建立一个专用的、端到端的光路,形成光交换矩阵,整个过程无需进行传统交换机所需的光-电-光的转换。
图表1:OCS和传统电交换机的信号传输路径对比
资料来源:SAMM Teknoloji官网,中金公司研究部
OCS无需光电转换的特性带来了较多性能增益。1)低时延和低功耗: 传统电交换机处理数据包需经过光电转换、解包、缓存、路由查找、再打包、电光转换等一系列耗时且高能耗的环节,OCS则省去了光电转换和相应的数据包处理和分发过程,根据《可重构OCS技术在大模型预训练中的应用》(朱宸等,2024),OCS的时延在数十纳米,较电交换机接近百微米的时延降低了数个数量级,且OCS拥有更小的每端口功耗,如OCS 400G单端口的功耗小于1W(电交换机单端口功耗大于10W)。 2)协议与数据无关的透明性: OCS建立的是物理光纤通道,对传输数据的格式、协议和速率完全透明,因此OCS硬件可跨代际重复利用,实现“一次投入,长期受益”,通过光路重定向即可实现跨代设备的无缝互联,而传统电交换机需要随着服务器速率提升进行底层交换芯片以及端口速率的迭代。 3)可靠性: OCS整机使用的芯片数量远小于电交换机,整机链路级和系统级的故障率低于电交换机,同时OCS可实现软件定义物理层,配置一定冗余端口,当某一链路发生故障可通过软件将相应光学路径切换到冗余端口,而电交换机需人工更换相应端口的光模块。
OCS的技术特点也决定了它在特定场景下存在应用局限性。1)切换时间长: 电交换机可以在纳秒级时间内对单个数据包进行不同转发决策的切换,而基于MEMS(Micro-Electro-Mechanical Systems,微机电系统)技术的OCS需驱动微镜(micro-mirror)进行机械偏转,时延在几十毫秒,无法满足高并发、多对一的通信模式需求。 2)通道灵活性低: OCS缺乏数据包处理能力,只能将某个输入/输出端口连通配对,一旦连通链路后,该链路资源就被独占,无论链路上是否有数据在传输。这一特性对于流量模式呈现高度突发性和随机性的应用场景,会导致带宽资源在空闲时段浪费,整体网络利用率低于按需分配资源的电分组交换网络。 3)前期成本高: OCS的核心器件如高端口数的MEMS芯片的制造成本仍较高,技术成熟度亦有待提高,OCS初期部署成本高仍是一个问题。 4)插入损耗: OCS的架构会引入额外的插入损耗,导致信号强度衰减,且叠加光模块的损耗,可能导致整个链路插损预算不足。
现阶段OCS的技术路径尚未完全收敛,主要有MEMS、数字液晶DLC、压电陶瓷直接光束偏转等。 目前,OCS参与者中采用基于3D MEMS技术的厂商较多。
► MEMS技术:代表厂商谷歌、Lumentum、华为等
MEMS技术是目前技术成熟度最高的全光交换技术路线,已在谷歌TPU集群、Apollo网络中应用。MEMS技术的核心是在硅基芯片上集成一个由成百上千个微米级可动反射镜构成的阵列,通过施加磁电、静电梳齿或热电驱动可精确控制每个微镜在二维(2D)或三维(3D)空间内进行微小角度的机械偏转。在3D MEMS架构中,输入光纤阵列和输出光纤阵列相对排布,任意一束入射光可通过2面特定微镜的协同反射,被精确地导向任意一个目标输出端口。MEMS技术的核心优势在于出色的可扩展性,能够以相对经济的成本构建超大规模的光交换矩阵,但机械偏转导致光路切换时间较长,且机械活动部件对封装能力要求高。
图表2:2D MEMS方案和3D MEMS方案对比
注:(a)2D MEMS方案;(b)3D MEMS方案 资料来源:Researchgate官网,中金公司研究部
► 数字液晶(DLC)技术:代表厂商Coherent等
数字液晶技术(Digital Liquid Crystal, DLC)是一种基于液晶电光效应的光交换方案,其核心原理是利用液晶分子在外部电场作用下的偏转特性,实现对光束传播方向的精确控制。在数字液晶光交换系统中,液晶光模块(LCLM)通过级联可调液晶延迟器与双折射晶体光楔,实现对多端口光信号的灵活调度。该技术对光学装调工艺要求较高,目前最大可支持512端口规模。与MEMS等技术相比,数字液晶光交换在可靠性和使用寿命方面表现较好,所需驱动电压低,但其光路切换时间通常为几百毫秒,长于MEMS方案,主要应用在无需频繁数据切换的场景,如冗余备份。
图表3:数字液晶DLC光交换原理示意图
资料来源:ODCC,中金公司研究部
► 压电陶瓷直接光束偏转技术:代表厂商HUBER+SUHNER(Polatis浩信)等
压电陶瓷直接光束偏转方案是将二维光纤准直器直接固定在压电陶瓷驱动器上,利用压电陶瓷机电耦合效应驱动准直器位移与角度倾斜,从而实现输入、输出两列端口匹配对准。压电驱动的OCS系统光路切换速度较快,时延约几毫秒,优于MEMS技术和数字液晶方案,且理论可扩展的端口数量多,但由于压电驱动的OCS系统的每一输入/输出端口都是一个小型的可进行2D方位调整的光束控制系统,组装复杂性随着端口数的增加而线性增长,导致系统成本较高。
图表4:压电陶瓷DLBS光交换示意图
资料来源:ODCC,中金公司研究部
图表5:光交换技术方案对比
OCS应用场景有哪些?
谷歌较早开始自研OCS,根据论文《Mission Apollo》(SIGCOMM 2022),谷歌从2015年开始就在其Jupiter数据中心网络架构中逐步引入Apollo OCS。随着TPU v4集群的出现,OCS也开始在AI大规模集群中跨cube通信部署。
1)部署于传统网络架构中的核心层或spine层
在Apollo项目中,谷歌凭借其多年对数据中心网络流量特征的深度分析,考虑到传统架构中核心层或spine层的流量模式相对可预测,创新性地用OCS替换核心层(或spine层)电交换机,通过OCS实现了不同代际和带宽(100G/200G/400G/800G)的汇聚交换机模块(Aggregation Blocks,AB)之间低成本且高效率的互联。具体来看,所有的AB向上通过光纤连接到OCS,通过配置可以按需、动态地为数据中心网络创建任意逻辑拓扑;向下则通过光模块+光纤与ToR(Top of Rack,架顶)交换机相连。
谷歌通过引入OCS实现功耗、成本双降。 OCS传统架构中信号在核心层或者spine层涉及到电光转化以及每个数据包的流量处理,带来较大的功耗开销,且增加了数据传输时间。随着网络数据流量激增,核心层或spine层的硬件需持续迭代,升级成本较高。根据SemiAnalysis,谷歌的OCS定制化网络使其整个网络的吞吐量提升了30%,功耗降低了40%,数据流完成时间缩短了10%,网络宕机时间减少了50倍,且资本开支减少了30%。
图表6:汇聚交换机通过光纤连接到OCS
资料来源:Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale (Ryohei Urata,2022),中金公司研究部
图表7:Apollo项目网络拓扑结构
资料来源:Mission Apollo: Landing Optical Circuit Switching at Datacenter Scale (Ryohei Urata,2022),中金公司研究部
2)TPU v4及之后代际的AI跨cube通信
在谷歌的TPU v4集群中,64个TPU芯片形成一个cube(4*4*4), 64个cube聚合在一起,6个面上的TPU(每个面有16条链路)与48个OCS相连。整个集群的通信连接方式可归纳总结为“光电混合”:cube内部的TPU之间通过电缆连接,依靠高度的电交换网络进行低延迟、数据包级别的通信;64个cube之间通过OCS构建起一个物理的3D环面(3D Torus)网络拓扑;最终实现48个OCS与64个cube(共4096个TPU芯片)相连,形成一个大型的超级计算系统,OCS在其中发挥“超级主干”的作用。OCS的主用端口规格为128*128,并在输入、输出口分别配置8个备用端口,用于链路测试和故障修复。
OCS技术能够高效扩展AI集群,提升系统可用性和能效。 相比传统的EPS,显著减少了交换机数量和功耗,根据谷歌在OFC 2025上的报告[1],相比电交换,OCS降低功耗3.5倍,成本仅增加约10%。《TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings》(ISCA,2023)也指出,OCS硬件部分和相关光纤组件成本低于整个超级计算系统成本的5%,且功耗低于系统总功耗的3%,展现出成本与效能优势。同时,OCS允许不同速率的TPU节点在同一网络中互联,而无需替换,这种灵活性支持网络的增量部署和异构硬件的兼容性,能够动态地调整以匹配不同工作负载的需求。此外,OCS能够动态地“绕过”故障单元,立刻重新配置光路,显著提升集群可用性和可靠性。
图表8:64个TPU v4芯片形成一个cube
资料来源:TPU v4: An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings (Jouppi et al., 2023),中金公司研究部
图表9:48个OCS与64个cube(共4096个TPU芯片)相连形成一个大型的超级计算系统
资料来源:ServeTheHome官网,中金公司研究部
谷歌TPU v7(Ironwood)集群继续沿用3D Torus网络拓扑架构,可实现9216个芯片的聚合。 在Ironwood Superpod集群中,依旧是每64个TPU芯片形成一个cube(4*4*4),共计144个cube,cube内部的TPU之间通过电缆连接,144个cube之间通过OCS构建起一个物理的3D Torus网络拓扑。由于每个cube六个面上分别有16个TPU,每个面对应引出16条链路,6个面则对应96条光纤链路,144个cube共需要13824条链路。若OCS的可用端口数从128个进一步升级至288端口规格(MEMS芯片中的小振镜数增加),则需配置的OCS数量为48个。
图表10:谷歌Ironwood(TPU v7)Superpod集群连接
资料来源:Hot Chips 2025,中金公司研究部
OCS产业进展到了什么阶段?
OCS向开放化、标准化发展。 2025年7月,开放计算项目(OCP)宣布成立OCS子项目,成员包括Lumentum、谷歌、微软、英伟达、Coherent、iPronics等,致力于推动开放式光交换技术协作,有助于推动OCS向开放化、标准化发展,从而形成全球范围的行业规范。
我们在前文已论述谷歌在OCS的前瞻布局,谷歌通过Apollo计划,在数据中心广泛使用OCS技术,将其作为Jupiter/AI网络架构的一部分,并应用于TPU集群。据Cignal AI估计,谷歌在过去五年间已在OCS技术上投资5-10亿美元。华为也将全光交换技术引入到数据中心网络,推出基于MEMS微镜技术的全光交换机,依托全光交换实现大规模、弹性可扩展、高可靠、高效率、超低损耗的集群。2025 WAIC(世界人工智能大会)上,曦智科技联合壁仞科技、中兴通讯共同推出的光跃LightSphere X——全球首个分布式光互连光交换GPU超节点解决方案,通过增加机柜数量构建超节点,突破传统电互连方式下超节点的物理限制。
OCS在位厂商营收初现。 Lumentum、Coherent 2Q25业绩会上均提到获得OCS初始收入。Lumentum表示OCS业务已实现向两家超大规模云厂商出货,第三家超大规模客户即将出货。公司将加速扩充OCS生产能力,OCS业务将在26年初、2H26分别出现向上拐点,公司预计OCS业务未来有望带来数亿美元的收入贡献,且该业务利润率高于公司平均水平。Coherent的OCS方案基于非机械的数字液晶技术,已在电信市场经过验证并部署多年,应用于数据中心的新型OCS在2Q25产生初始收入,下游客户需求逐渐起量,公司预期2H25-2026年OCS收入有望持续增长。
图表11:OCS技术的应用(截至1Q25统计)
资料来源:Cignal AI,讯石光通讯,中金公司研究部
OCS产业化逐步开启,潜在市场空间达数十亿美元。 Cignal AI认为2025年之前主要是谷歌采用OCS,未来会有更多厂商投资于OCS领域,OCS在数据中心核心层、人工智能集群等部署量有望持续增长,Cignal AI预计到2029年OCS的市场规模有望超过16亿美元。Coherent也在2Q25公开业绩会上表示OCS交换机存在20亿美元的潜在市场机会。我们认为,一方面,随着AI集群规模向百万卡量级甚至更大规模发展,通信数据量激增,传统链路可能容易发生错包、丢包等问题,引入OCS组网有望减少数据丢包,提升训练性能和效率;另一方面,超节点组网需求增加,这部分的链路互联相对确定、可预测,OCS可部署于多个Rack或POD之间的互联场景。
图表12:LightCounting对云数据中心以太网、InfiniBand及光交换机市场规模预测
资料来源:LightCounting,中金公司研究部
图表13:OCS市场规模预测
资料来源:Cignal AI,中金公司研究部
OCS包含哪些核心部件?
OCS是一个纯光学的物理层设备,由于技术方案多样,基于不同技术原理的OCS产品中包含的核心器件存在一定差异。总结来看,OCS产业链包含MEMS芯片、光环形器、透镜、滤光片、波分复用器、光纤阵列单元(FAU)、光纤光缆、OCS整机代工等环节, 我们建议关注OCS产业发展趋势,以及该产业链中的在位厂商和潜在进入厂商,OCS在数据中心网络的渗透部署或有望为上述产业链环节贡献增量空间。
► MEMS芯片: 一种在硅基上集成的微机电系统,其核心是一个由成百上千个可独立驱动的微米级反射镜构成的阵列。通过对单个微镜阵列施加精确的电压信号,使其进行三维角度偏转,从而将任意一束输入光纤的光束精准反射到任意一个目标输出光纤,实现空间上的物理光路连接。
► 光环形器: 一种无源器件,其核心功能是实现单根光纤的双向通信。通过在链路两端部署光环形器,可将传统需要两根光纤(一收一发)的连接,合并到一根光纤上完成,从而使OCS所需的物理端口和光纤布线数量减半。
► FAU: 用于将大量单根光纤以微米级的精度,规则地排列并固定成一个二维阵列,能够实现大量光纤与MEMS/液晶芯片上微小活动区域的精准、高效、并行的光信号耦合。
► 滤光片: 选择性地让特定波长的光通过,而反射或吸收其他波长的光学元件。在OCS中常使用二向色滤光片,主要用于850nm监控光(用于微镜校准)和工作信号光的合波和分波。
► 波分复用器件(WDM): 将多个波长的光信号合波(MUX)到单根光纤上,并在对端将其分离,减少光纤和OCS用量。
图表14:谷歌OCS内部横截面
风险提示
OCS技术发展不及预期。 OCS目前仍处于产业化初期阶段,技术方案尚未完全收敛,且面临切换速度、成本等问题。未来若技术发展不及预期,无法形成对传统电交换机的清晰优势,下游客户的采纳意愿较低,可能影响OCS从利基市场走向主流,产业渗透不及预期。
CPO等其他交换机技术的替代性竞争。 OCS是创新性的全光方案,与CPO等基于现有电交换架构升级方案不同,若CPO等其他电交换机创新技术发展超预期,良率及成熟度满足下游客户要求,可能挤压OCS的市场空间。
[1]https://cloud.tencent.com/developer/article/2512354
来源:财富智囊