摘要:对大多数业内人士来说,富士通最近几乎成了超级计算机的代名词——这类计算机跻身 Top500 超级计算机之列,为国家级研究实验室提供动力,并且很少在高性能计算领域之外露面。但现在,富士通正准备回归本源。其下一代处理器 Monaka 不再局限于百亿亿次级基准测试,
对大多数业内人士来说,富士通最近几乎成了超级计算机的代名词——这类计算机跻身 Top500 超级计算机之列,为国家级研究实验室提供动力,并且很少在高性能计算领域之外露面。但现在,富士通正准备回归本源。其下一代处理器 Monaka 不再局限于百亿亿次级基准测试,而是着眼于可扩展的传统数据中心基础设施部署。它的目标是在由超大规模计算、能源限制以及 Arm 在云基础设施领域日益增长的影响力所定义的市场中进行大规模部署。
这标志着一项重大的战略转变。富士通上一代处理器 A64FX 堪称技术里程碑,是首款搭载 Arm 架构 CPU 的处理器,为当时全球最快的超级计算机提供支持。但 Monaka 却有所不同——它基于 2 纳米核心芯片构建,采用 3D 多核芯片布局,专为风冷服务器设计,使用常规内存,并针对机密计算、超低电压运行和大规模可持续性进行了优化。简而言之,Monaka 旨在成为一款专为未来云原生工作负载(而不仅仅是科学模拟)打造的高效、安全的 CPU。
最中核能项目也体现了一项更广泛的国家战略。该项目的开发得到了日本绿色创新基金的支持,并由日本新能源产业技术综合开发机构(NEDO)提供资金和监督。富士通将其目标描述为为绿色数据中心提供下一代处理器,其性能和功耗目标与日本的环境政策相一致。这是朝着自主计算基础设施发展这一更大趋势的一部分——美国、欧盟、中国和印度也做出了类似的努力——但其理念明显是效率至上。
在今年巴塞罗那举行的世界移动通信大会上,富士通提供了迄今为止该项目最实质性的更新。虽然Monaka最早是在2022年宣布的,但我在2023年超级计算大会上第一次看到它,这也是公众第一次看到硅片模型。富士通还汇总了其之前的平台规格。没有舞台演示,没有正式的新闻发布会——只有玻璃后面的安静展示、循环播放的动画和一面内部幻灯片墙。
但对于那些一直关注富士通架构系列(从 SPARC64 到 K-Computer 再到 A64FX)的人来说,这个信息是毋庸置疑的。这款芯片是真的。开发正在进行中。虽然富士通可能并不追求关注度,但它的目标绝对是部署。
Monaka内部
Monaka 的核心是 3D 芯片组设计,将逻辑、内存和输入/输出 (IO) 划分到不同的工艺节点。核心芯片采用 2nm 工艺制造,而 SRAM 和输入/输出 (IO) 芯片组则采用更“成熟”但仍然先进的 5nm 工艺。这些芯片组采用硅通孔 (TSV) 垂直集成,并安装在硅中介层上。在其计划的双插槽配置中,Monaka 将每个插槽提供 144 个 Armv9-A 核心,或每个节点提供 288 个核心,并采用风冷封装,目标平台为标准 2U 数据中心服务器。
这种做法既体现了雄心壮志,也体现了克制。富士通在关键领域采用尖端硅片,同时为更大的 SRAM 和 IO 芯片选择更具成本效益和更高良率的工艺。这是一种实用的设计,也符合日本提出的节能基础设施目标。Monaka 不会通过特殊封装或 HBM 来提升内存带宽,而是依靠 DDR5(每个插槽 12 个通道)和 PCIe Gen6 来实现高吞吐量 IO,并支持 CXL 3.0,从而在现代能力与成熟标准之间取得平衡。
从物理角度来看,该设计密集但不奇特。该芯片的功耗可能低于 500W,散热范围适合标准服务器机架。这与在液冷超级计算环境中运行的 A64FX 有显著不同。其目标并非追求峰值浮点性能——富士通表示,其目标是在实际数据中心部署中实现可扩展性并提供高效的吞吐量。富士通并非试图在原始矢量计算方面超越对手。它正在构建一款通用服务器级 Arm 芯片,重点关注整体平台的平衡。
MWC 上的演示材料包括一张带标签的芯片爆炸图,展示了核心、IO 和内存芯片是如何通过 TSV 分层和键合的,以及一个晶圆模型以供参考。对于任何熟悉超大规模芯片封装趋势的人来说——从AMD 的 3D V-Cache到英特尔的 Foveros——这个方向都很熟悉。富士通声称,Monaka 对可预测功耗、可组合性和工作负载隔离的重视正是其与众不同之处。
效率目标
富士通声称,Monaka 将在应用性能和每瓦性能方面实现逐代提升,预计在 2027 年左右上市。这些并非空洞的目标。MWC 上的几张幻灯片明确阐述了该芯片的设计原则:保持低电压、优化开关功率,并在无需特殊冷却或内存解决方案的情况下高效地跨核心扩展。
Monaka 设计的核心主题之一是超低电压运行。富士通的开发材料强调了其使用内部 EDA 工具来确保在较低电压下实现稳定的性能——该公司声称,这一策略带来的效率提升堪比全工艺节点的推进。再加上核心芯片采用 2nm 环绕栅极工艺,Monaka 将成为高密度、低功耗的计算平台。
富士通的信息传递也强调了可预测性。Monaka 并非追求理论上的 TOPS 或 FLOPS 峰值,而是被定位为一个针对混合工作负载提供一致、可扩展性能的优化平台。富士通还将 Monaka 定位为与 AMD、英特尔和其他正在进军 Arm 领域的厂商推出的新兴高核心数数据中心 CPU 竞争。AMD 的高核心数EPYC Bergamo以极高的密度和每瓦性能瞄准云原生工作负载,而英特尔即将推出的Clearwater Forest则主要依赖 E 核心的可扩展性。在 Arm 方面,NVIDIA 的Grace CPU Superchip和Ampere 的 AmpereOne都体现了相同的趋势:高核心数、高内存带宽和更低功耗。
富士通表示,Monaka 的独特之处在于其注重低压效率、可预测的功率扩展以及无需额外 DRAM 或液冷的传统服务器部署模式。富士通并未竞相追求峰值矢量计算或 AI 加速,而是致力于实现一致的吞吐量和可组合性——这与许多同行更偏向 AI 的方向形成了鲜明对比。
安全性、可靠性和部署
Monaka 的设计也以信任为核心。富士通的演示材料强调了硬件级隔离、工作负载保护和系统弹性——将 Monaka 定位为多租户环境中的机密计算平台。
其核心是全内存加密,每个虚拟机都使用由硬件生成和管理的唯一密钥进行保护。富士通表示,这些保护措施在启动时实现,并在运行时强制执行,不仅确保用户之间的隔离,还确保用户与主机环境本身之间的隔离。这与业界对机密计算的推动相一致,这种推动在AMD SEV-SNP和Intel TDX等平台中有所体现,但富士通将该功能集成到更广泛的 RAS 优先理念中,而不是将其视为可选模块。
除了内存保护之外,富士通还表示,Monaka 还内置了硬件信任根——一种直接嵌入处理器的加密身份,旨在巩固系统级安全性并验证固件的真实性。这些功能与可信启动和运行时完整性验证的支持相结合,使 Monaka 能够满足政府、金融和电信等行业对高可信度工作负载的需求。
可靠性特性也继承了富士通在大型机和关键任务计算领域的经验。该公司提到,Monaka 在平台层面融入了错误检测和纠正机制、热控制、故障控制和可维护性。虽然具体的 RAS 机制尚未公开详细说明,但富士通似乎将 Monaka 定位为一款能够在大规模分布式部署中保持高正常运行时间和隔离性的芯片——这与那些只强调吞吐量的加速器或数据流引擎形成了鲜明对比。
软件和生态系统
富士通已明确表示,Monaka 不仅仅是一个硬件项目。软件环境是其设计的核心部分,注重标准合规性、开发者可访问性和广泛的兼容性。与一些需要定制工具链的定制 CPU 不同,Monaka 定位于运行标准 Linux 堆栈,并支持上游发行版、通用开发工具和行业范围内的互操作性框架。除此之外,富士通还将利用其在编译器优化工具方面的丰富经验,展现其独特的魅力。
根据富士通的公开路线图,Monaka 将支持Arm SystemReady SR ,确保该平台从固件和操作系统的角度能够像传统的 Arm 服务器一样运行。这使得它能够在主权云环境、边缘部署和企业数据中心中使用,而无需操作系统级移植或特定于供应商的挂钩。
该开发堆栈支持LLVM 、GCC 、Python和标准性能跟踪工具,与 A64FX 和 Fugaku 超级计算机使用的工具链一致。富士通还提到了对 glibc、binutils 以及与电源和缓存管理相关的内核组件等开源项目的持续贡献,体现了其对上游协作的长期承诺。这使得 Monaka 成为一个现有软件生态系统可以在此基础上构建而非适应的服务器平台。
富士通重申了对AMD ROCm GPU 堆栈(于2024 年底首次发布)的支持,表明 Monaka 将与 AMD 加速器一起在异构基础设施中发挥作用。虽然具体细节尚未披露,但它与 LLVM 和 Python 的持续存在反映了一个更广泛的意图:实现 GPU-CPU 配对,而无需专有锁定。
在运行时层面,富士通表示,Monaka 将支持CXL 3.0 ,从而实现可组合基础设施和超越本地 DRAM 的内存扩展。此外,它还支持PCIe Gen6 ,从而与下一代存储、加速器和网络设备兼容。这些功能反映了该芯片在高度可扩展基础设施中的预期用途,从云原生平台到边缘托管的 AI 推理。
总体而言,Monaka 传递的信息是延续性的。Monaka 并非被置于一个冷冰冰的环境中——它进入的是富士通已经支持的生态系统,而且 Arm 服务器领域的大部分厂商也已经在使用这个生态系统。
行业比较
富士通将 Monaka 描述为“大型机级”处理器,这在 Arm 服务器领域并不常见。在世界移动通信大会上,该术语与虚拟机级加密、硬件信任根和全系统故障管理等术语同时出现——这种说法让人想起 IBM zSeries 等企业平台,而非通常的无状态云计算。
IBM 的大型机架构专为正常运行时间受合同约束的环境而设计,例如银行业务、国家身份识别基础设施、交易型电信系统。富士通并未声称 Monaka 符合这些规范,但它显然在朝着这种理念努力。重点在于可预测的行为、生命周期控制和安全的租赁,而不仅仅是聚合吞吐量。这意味着 Monaka 的可靠性态势更加广泛:它旨在支持多租户系统、机密计算和受监管环境——这些部署方式历来都偏爱 IBM zSeries 等平台。
Monaka 的目标似乎并非直接取代 IBM。其设计不包含专有互连或封闭的固件层,也不假设垂直集成的中间件。富士通提出的是一个基于标准的开放平台,该平台提供类似的可靠性,但具有 Arm 兼容性、Linux 优先工具和更易组合性——尤其是在获得 SystemReady 认证的情况下。
这使得 Monaka 瞄准了某些通常位于超大规模市场和企业市场之间的市场:
寻求控制平台完整性的国家的主权云部署
电信网络在严格的 SLA 下管理区域基础设施
国防和航空航天领域,硬件生命周期透明度比绝对性能更重要
富士通似乎正在开辟一条中间路线:不追逐超大规模数据平面,不匹配 IBM 的垂直堆栈,而是构建一个符合标准的平台,以可靠性为产品,而不是宣传。
富士通的架构业绩
富士通携Monaka进军主流数据中心芯片领域并非空穴来风。该公司拥有数十年自主设计处理器的经验——并非为了面子工程,而是将其作为国家级计算的核心支柱。其SPARC64系列产品为日本乃至全球的企业服务器和关键任务系统提供支持,SPARC64 X和XII等变体产品则运行着从银行基础设施到政府计算的方方面面。富士通不仅是SPARC ISA的用户,更是其主要的架构师,并且在大多数其他公司纷纷转向SPARC ISA之后很长一段时间内,依然坚持着自己的实现。
向 Arm 的转型始于为Fugaku 超级计算机开发的A64FX芯片。该芯片每个插槽配备 48 个 Armv8-A 核心,通过 SVE 进行矢量扩展,并采用紧密集成的内存架构。更重要的是,它证明了 Arm 的可扩展性——不仅体现在核心数量上,还体现在系统级性能、工具和实际可靠性上。Fugaku 曾多次在TOP500和Green500榜单中位居榜首,至今仍位居全球最强大、最高效的计算机之列。
富士通凭借 Monaka 再次转型——并非追求尖端的每瓦性能,而是着眼于可部署性。核心数量大幅提升,但 A64FX 的矢量加 HBM 核心已被可组合性、隔离性和现代数据中心功能集所取代。这种演变反映了一种更广泛的理念:富士通打造芯片的目的并非在 Flops 或闪存上竞争,而是服务于具有长寿命和明确需求的特定工作负载。该公司的路线图清晰地展现了从 SPARC 的企业级 DNA,到 A64FX 基于 Arm 的 HPC 里程碑,再到 Monaka 的通用开放标准架构的轨迹。
Monaka 在云 CPU 领域或许看起来是新事物,但富士通并非如此。更准确地说,Monaka 是 30 年设计传承的全新篇章,其始终优先考虑控制、集成和国家计算能力,而非单纯的速度。
2纳米赌注
Monaka 预计于 2027 财年上市。这是一个漫长的周期,因此,富士通能否坚持这个时间表,以及届时该芯片将如何与竞争对手竞争,都值得关注。此外,考虑到目标市场,富士通必须定期为更广泛的垂直市场提供硬件和软件支持。
至于世界移动通信大会的展位部分,富士通没有带来开发套件,也没有进行公开演示。相反,它带来了幻灯片、芯片模型以及一个并非以峰值性能为竞争重点,而是以一致性、功耗控制和部署信任为核心的架构。这是一次低调的更新,但却是一次深思熟虑的更新——所有指标都表明,这款芯片并非为某个客户设计,而是为一场政策转变而设计。
该平台借鉴了 SPARC 和 A64FX 的经验,但又有所突破。它采用 Armv9 架构,适用于风冷机架,并明确定位于主权云、电信网络以及系统验证和可靠性比核心数量更重要的工作负载。富士通表示,与某款未透露名称的 2027 年竞争对手相比,Monaka 将提供两倍的应用程序性能和每瓦性能。至于这是否属实,与其说是真的,不如说是该芯片真正代表的意义:推动可组合、安全且基于标准的基础设施发展——以及由此带来的所有硬件控制。
它不是一款为引人注目而打造的芯片,但它符合富士通长期以来将先进硅片应用到可靠性比可见性更重要的地方的模式。
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4022期内容,欢迎关注。
『半导体第一垂直媒体』
来源:半导体行业观察一点号