摘要:AMD 打算在在2026年下半年推出下一代Instinct MI400系列加速器,有两个型号,分别是针对人工智能(AI)的MI450X和高性能计算(HPC)的MI430X。
据外媒报道,AMD 打算在在2026年下半年推出下一代Instinct MI400系列加速器,有两个型号,分别是针对人工智能(AI)的MI450X和高性能计算(HPC)的MI430X。
MI400系列基于AMD最新的CDNA Next架构。
与当前的MI300系列不同,MI300系列同时支持AI和HPC任务,但因通用性设计导致两种负载的峰值性能受限。MI400系列通过差异化定位解决这一问题。MI450X专为AI任务优化,支持低精度计算格式如FP4、FP8和BF16,移除FP32和FP64逻辑以最大化AI计算单元的芯片空间。MI430X则针对HPC任务,支持高精度FP32和FP64计算,移除低精度AI逻辑以提升HPC性能。这种定制化设计使MI450X和MI430X能够分别在AI训练、推理和科学计算等场景中实现更高的效率和性能。
在技术规格方面,MI400系列预计延续AMD在内存容量和带宽上的优势。
参考MI300系列,MI300X配备192GB HBM3内存,带宽达5.3TB/s,而即将推出的MI325X将升级至256GB HBM3E,带宽提升至6TB/s。MI400系列可能进一步采用HBM3E或HBM4,提供高达288GB的内存容量和更高的带宽,以满足大规模AI模型和HPC应用的需求。MI300X在FP8精度下可实现2614.9 TFLOPS的理论峰值性能,而MI400系列通过架构优化和工艺升级(如3nm或更先进的制程)有望大幅提升这一数字。
MI400系列的另一亮点是支持UALink互连技术。
UALink由AMD、Intel、微软等公司联合开发,用来提供高性能、可扩展的GPU互连方案,直接挑战Nvidia的NVLink。UALink支持高带宽、低延迟的数据传输,适合构建大规模AI和HPC集群。但是目前来看UALink的商用化面临一定挑战。由于外部供应商(如Astera Labs、Enfabrica)在2026年之前难以提供成熟的交换芯片,MI400系列对UALink的支持可能会受限,仅能用于小型网状或环状拓扑配置。AMD不生产自有UALink交换机,需依赖合作伙伴,这增加了部署的不确定性。相比之下,Ultra Ethernet Consortium的网络解决方案进展更快,已有商用硬件支持,可能为MI400系列提供替代的规模化方案。
除了UALink,MI400系列将继续支持AMD的Infinity Fabric技术,提供高吞吐量、低延迟的芯片间通信。
AMD计划推出基于Infinity Fabric的系统级解决方案,如MI450X IF64和MI450X IF128,分别支持64和128个GPU的集群配置。这些系统通过以太网连接,对标的是Nvidia的机架级平台(如VR200 NVL144)。Infinity Fabric在MI300系列中已展现出优势,例如MI300A APU通过统一的CPU-GPU内存架构实现高达5.3TB/s的带宽,MI400系列有望进一步优化这一技术。
MI400系列的芯片设计也体现出AMD在模块化架构上的持续创新。
根据最新信息,MI400将采用chiplet设计,包含两个Active Interposer Dies(AID),每个AID集成四个Accelerated Compute Dies(XCD),总计八个XCD,相比MI300系列的每个AID两个XCD规模更大。此外,MI400引入了Multimedia IO Die(MID),用于提升数据吞吐量和处理效率。这种设计不仅提升性能,还通过模块化降低制造成本,增强产品灵活性。
在市场定位上,MI400系列将直接与Nvidia的Hopper和Blackwell架构竞争。
Nvidia的H100 GPU在FP8精度下提供1978.9 TFLOPS的峰值性能,而AMD的MI325X已超越这一水平。MI400系列通过低精度AI优化和高精度HPC支持,有望在特定场景下进一步拉开差距。此外,AMD的ROCm软件平台将为MI400系列提供支持。最新ROCm 6.2版本在推理和训练性能上分别提升了2.4倍和1.8倍,支持FP8、Flash Attention 3等关键AI功能,确保MI400系列在软件生态上保持竞争力。
当然也要看到MI400系列的不足。除了UALink的限制,AMD在AI市场的品牌影响力仍远落后于Nvidia。
Nvidia凭借CUDA生态和早期市场布局占据主导地位,AMD需通过开放的ROCm平台和更高的性价比吸引客户。此外,AI和HPC市场的快速发展要求AMD保持快速迭代。据悉,MI350系列(基于CDNA 4架构)预计于2025年中推出,将支持FP4和FP6格式,可以提供高达2.3 PFLOPS的FP16性能。
从行业趋势看,AI和HPC市场的需求持续增长。生成式AI模型(如Llama 3.1 70B)对内存容量和计算性能提出更高要求,而HPC应用(如气候模拟、药物发现)则需要高精度计算和大规模集群支持。AMD通过MI400系列的差异化策略,精准响应这些需求。同时,开放互连标准(如UALink和Ultra Ethernet)的发展将推动行业向更灵活、可扩展的架构演进,AMD作为主要参与者有望从中受益。
AMD Instinct MI400系列通过定制化设计、先进的互连技术和模块化架构,展现了在AI和HPC领域的竞争力。MI450X和MI430X的推出将为用户提供针对性更强的解决方案,而Infinity Fabric和UALink的支持将增强其在集群部署中的潜力。尽管面临互连技术和市场竞争的挑战,MI400系列的创新设计和AMD的快速迭代策略,使其有望在2026年成为数据中心GPU市场的重要力量。
来源:新数迷一点号