英伟达、英特尔和 AMD, 联手投出一家「芯片独角兽」

360影视 2025-02-06 13:03 2

摘要:两天前,英伟达创始人黄仁勋在 CES 上发布了公司一系列 AI 新产品和解决方案,为人工智能的算力和应用落地提供更多「弹药」。在抓紧生产现有架构的 AI 基建硬件时,这家巨头早已经瞄准了下一代技术。

两天前,英伟达创始人黄仁勋在 CES 上发布了公司一系列 AI 新产品和解决方案,为人工智能的算力和应用落地提供更多「弹药」。在抓紧生产现有架构的 AI 基建硬件时,这家巨头早已经瞄准了下一代技术。

不久前,英伟达联手老对手英特尔,投资了一家初创公司 Ayar Labs。新一轮 1.55 亿美元的融资,也让 Ayar Labs 成为芯片领域的新一家独角兽公司。

这家公司是什么来头?为什么能让芯片三巨头打破障碍联合投资

Ayar Labs 主攻光学互连解决方案,其解决方案能以 AI 运作的速度移动数据,以满足客户对可扩展、经济高效的 AI 基础设施的迫切需求。

对此,Ayar Labs 联合创始人兼 CEO 马克·韦德表示,「领先的 GPU 提供商 AMD 和英伟达以及半导体代工厂格芯、英特尔代工、台积电,再加上 Advent、Light Street 和我们其他投资者的支持,凸显了我们的光学 I/O 技术重新定义 AI 基础设施未来的潜力。」

「光学 I/O」是什么东西?Ayar Labs 又能解决快速发展的 AI 领域的什么问题

01

精英团队

Ayar Labs 在 2015 年成立,总部位于加州圣何塞。

起初公司由四位 MIT 学生在 2015 年共同创立,其中 Mark Wade、Chen Sun 和 Vladimir Stojanovic,当时分别是 MIT 电子工程专业的博士生和访问学者,目前分别担任公司的 CTO、首席科学家和首席架构师。随后,他们邀请了当时正在攻读 MIT MBA 的 Alex Wright Gladstein 加入团队,担任 CEO。

现在,团队由来自英特尔、IBM、美光、Penguin、麻省理工学院、伯克利和斯坦福的许多顶尖技术专家组成。

成立以来,Ayar Labs 一直深耕于光学互联解决方案领域,市场战略重点是解决光电子领域的大批量、高质量制造问题。

公司成立次年获得了 2 百万美元的种子轮融资,而最新一轮顶级芯片制造商的投资正是该公司技术走向成熟的标志。新的资金将用于扩大芯片生产规模,促进生成式 AI、分解数据中心等的发展。

正如,Ayar Labs 首席执行官兼联合创始人马克·韦德,今年 10 月在采访中表示「客户已经在试用 Ayar Labs 的芯片,在过去的 18 个月里,出货超过 15,000 台,这为我们在 2026 年年中至 2028 年年中的两年重点窗口期实现批量生产奠定了基础。」「我们预计月产量将达到数十万到数百万个,到 2028 年及以后,年产量有可能超过 1 亿个。」

目前,Ayar Labs 的芯片由 GlobalFoundries(起初为 AMD 公司的制造部门,后来成为独立公司)制造,并且已经与所有一级 CMOS 制造商建立了合作关系,与 GlobalFoundries、Applied Materials、台积电、英特尔和英伟达等主要厂商建立了战略合作关系,将光 I/O 解决方案整合到其制造产品中。

对此,Ayar Labs 曾官方宣布,「我们正在建立一个强大的生态系统,其中包括重要的战略技术和供应链合作伙伴。我们还积极参与多个行业和标准组织的活动,推动光学 I/O 芯片生态系统的发展。」

02

解决 AI 数据瓶颈

随着生成式 AI 模型的复杂性和规模指数级增长,对大型计算集群的需求日益增加,这些算力设施通常需要连接数百甚至数万个 GPU 及其他加速器,以提供 AI 所需的内存和计算资源。

然而,AI 基础设施的扩展正面临带宽、延迟和功耗的挑战,这些挑战主要是由传统基于铜的互连技术造成的瓶颈。在连接超过 1.5 米距离和 72 个 GPU 的机架时,传统电互连技术尤其会遇到性能瓶颈和限制。

数据传输瓶颈限制了 GPU 的效能,导致投资收益递减。具体来说,单个 GPU 的运行效率可达 80%,但扩展至 64 个 GPU 时可能降至 50%,进一步扩展至 256 个 GPU 时可能只有 30%

这不仅降低了整体系统效率,而且严重阻碍了数据中心性能的全面提升,限制了 AI 技术的进步。

根据高盛最近发布的报告预测,未来十年,AI 基础设施支出预计将超过 1 万亿美元。这凸显了对消除传统互联造成瓶颈的解决方案的迫切需求。

为了应对这一挑战,Ayar Labs 推出了业界首个封装内光 I/O 解决方案。

Ayar Labs 光 I/O 解决方案的创新之处在于其整体封装设计。该设计允许光学模块直接与芯片集成,实现节点的大规模直连,有效克服了 I/O 密度、数据速率扩展和互联功率效率的限制

与传统的可插拔光学器件和电气 SerDes 互连方式相比,Ayar Labs 的光 I/O 解决方案可实现 5~10 倍的更高带宽、4~8 倍的能效,并将延迟降低至 1/10,最大限度地提高 AI 基础设施的计算效率和性能,同时降低成本、延迟和功耗,显著提升 AI 应用的盈利指标。

不仅如此,光 I/O 解决方案遵循 UCIe、CXL、CW-WDM MSA 等开放标准,并针对 AI 训练和推理进行了优化,其强大的生态系统使其能够顺利地大规模集成到 AI 系统中,进而提升生成式 AI 应用的性能和效率。

Ayar Labs 的光 I/O 解决方案特别适用于下一代 AI 扩展架构,这种架构需要超高的带宽和跨数百甚至数万个 GPU 的连接 | 图片来源:Ayar Labs 官网

03

「光 I/O」初探

Ayar Labs 的光 I/O 解决方案结合了两项行业首创技术——TeraPHY 光学 I/O Chiplet 和 SuperNova 多波长光源。

TeraPHY 光学 I/O Chiple 是业界首款封装内单片式光学 I/O 芯片。

它主要负责光电信号之间的转换和收发,是一种用于替代传统的铜背板和可插拔光学通信的小型化、低功耗、高吞吐量的解决方案。

它首次将硅光子技术与标准的 CMOS 制造工艺结合起来,将光学互联与与电子 GPU 或 CPU 集成在同一封装内,可以无缝集成到客户的系统级封装 (SiP) 架构中,使专用集成电路(ASICs)能跨越从毫米到千米的距离进行无缝通信,最大限度地减少信号损失和延迟,这对于分布式 AI 系统和云计算环境格外有用。

这一创新组件包含了约 7000 万个晶体管和 10,000 多个光学器件,主要包含了以下几个模块:

Grating Coupler Fiber Coupling Array:负责光信号的输入输出。

Optical Transceiver:主要负责进行光电信号的调制转换,主要由微环调制器(Micro-ring Modulators)和微环滤波器(Micro-ring Filter)组成,前者负责调制出所需的光信号,后者负责处理接受的光信号。值得一提的是,微环调制器正是 TeraPHY 的核心优势,鉴于它成功解决了成功解决了温度敏感性和信号稳定性问题,实现了在 15-100°C 温度范围内准确输出特定波长的光信号;

AIB:负责和芯片之间的电信号互联;

Glue/Crossbar:是 Optical Transceiver 和 AIB 之间的连接桥梁。

TeraPHY 光学 I/O Chiplet 凭借其模块化多端口设计,能够支持 8 个光通道,等同于一个 x8 PCIe Gen5 链路,满足生成式 AI 模型对大规模并行处理的需求。

其 4Tbps 的总双向带宽和每个端口 256Gbps 的高速传输能力,能够迅速移动数据,加快 AI 模型的训练和推理过程。而且,每隔几年这一芯片带宽或将翻倍。

5ns 的低延迟性能有助于提升数据处理速度,优化 AI 生成式体验。此外,其低功耗特性(每比特不到 5pJ/b)有助于降低能源消耗,减少 AI 运营成本,同时减轻对环境的影响。

Ayar Labs 致力于通过技术创新,帮助客户应对未来的挑战。

举例来说,为了应对移动网络边缘的快速转型需求,以及 AI 驱动服务的指数级增长,Ayar Labs 将 TeraPHY 光学 I/O 芯片和康宁独特的内置光连接的玻璃波导模块结合在一起,开发了新一代 AI 光学解决方案。爱立信也加入了该合作,以开发其电信未来无线电。

这种全新的集成光学解决方案将为 AI 架构、6G、数据中心和其他计算密集型应用提供高密度、高性价比、低延迟、高能效的连接

SuperNova 则是远程光源独立的激光器,负责准确地发出多个波长的光子。

它可以被视为位于 ASIC 封装外部某处的光电源,在实际部署中,SuperNova 与 TeraPHY 协同工作,共同发挥作用。

SuperNova 由 Ayar Labs 和 MACOM(DFB 的顶尖设计商之一)联合设计,交由 UK 知名激光制造商 Sivers Photonics 制造。

它是首款符合 CW-WDM MSA(粗波分复用多源协议)标准的多波长、多端口光源,最多支持将 16 种波长的光传输至 16 根光纤,实现了光 I/O 技术的又一次重大飞跃。

每根光纤最多可传输 16 个波长,因此可驱动 256 个光载波,提供 16 Tbps 的双向带宽,满足 AI 工作负载所需的带宽水平。

16 波长 SuperNova 光源封装紧凑,工作温度范围广,可为 256 个数据通道提供光源,能够处理 AI 应用大规模增长所需的更高吞吐量,为未来可能的扩展提供了充足的空间。

波长数量是 CWDM4 多波长可插拔光学器件的 64 倍,且多个波长在一个单一的阵列中简化了包装,降低了封装成本,这对于大规模部署 AI 系统来说是一个重要的优势。

不仅如此,SuperNova 符合 CW-WDM MSA 规范,满足 GR-468 对于光电设备和可插拔光学的可靠性要求,可广泛应用于 AI 架构、高速 I/O、光计算和高密度协同封装光学器件等领域。

可见,Ayar Labs 的光 I/O 解决方案基于标准、面向未来、可扩展,旨在优化 AI 性能。

随着 AI 基础设施需求的日益增长,集成光 I/O 已成为提升效率和效益的关键。

芯片行业的领军企业已经聚焦于光互连技术,旨在利用其光学特性来打破性能瓶颈,增强 AI 基础设施的性能和计算效率,同时减少成本和能耗。

英伟达首席科学家兼高级研究副总裁比尔·达利曾坦言,「光连接对于扩展加速计算集群以满足 AI 和高性能计算工作负载快速增长的需求非常重要。Ayar Labs 拥有独特的光 I/O 技术,能够满足扩展基于硅光子技术的下一代人 AI 架构的需求。」

事实上,Ayar Labs 在光互连领域还有不少同行。

今年 10 月,瑞士光互连初创公司 Lightmatter 完成了 4 亿美元的 D 轮融资,由新投资者 T. Rowe Price 领投,公司估值达到 44 亿美元,较之前 12 月 GV 领投的 1.55 亿美元融资后的 12 亿美元估值增长了近四倍。

在同一时期,纽约的 Xscape Photonics 也通过光子技术解决了 AI 数据中心在能源、性能和可扩展性方面的挑战,并获得了 4400 万美元的 A 轮融资,由 IAG Capital Partners 领投,思科投资公司和英伟达等也参与了投资。

随着巨头的密切关注、大量资金持续流入这一行业,光互连技术作为取代「线缆」的下一代连接技术,成为又一个迎来变革的行业。

来源:金融界

相关推荐