摘要:新华三的智算网络,基本完成了兵力部署:“三员大将”坐镇中军帐指挥千军万马,他们可以判断不同的应用场景,看谁来出战最为合适。除此之外,新华三还已通过战略同盟,在服务器里建立了“前沿阵地”,这既可使其匹配多元算力,也能让“端”与“网”互为掎角之势,形成“端网协同”
新华三的智算网络,基本完成了兵力部署:“三员大将”坐镇中军帐指挥千军万马,他们可以判断不同的应用场景,看谁来出战最为合适。除此之外,新华三还已通过战略同盟,在服务器里建立了“前沿阵地”,这既可使其匹配多元算力,也能让“端”与“网”互为掎角之势,形成“端网协同”。
算力是“甲方”,网络是“乙方”
新华三基本完成智算网络的兵力部署,这并不是将“算力”与“网络”对立起来。其实,“算力”与“网络”更像“甲方”和“乙方”之间的关系。“算力”是负责生产和销售的“甲方”,网络是负责运输和交付的“乙方”。
但问题就在这。
“算力×联接”是个技术活,“乙方”与“乙方”相比,能力差距可不是一般的大。此前,新华三就进行过一次调研:未经调优的网络与经调优的网络相比,模型训练的性能差异为30%,模型训练的用时相差25%以上。而对于那些租用算力的企业,因为网络故障或拥塞,每天可能造成的成本损失超过30万元(以1000卡H100为例)。
不仅如此。网络设备虽只占智算中心整体投资的10%,但它可以撬动30%的算力性能投资。换句话说,如果选对了“乙方”,发一份工资,它就能给你带来三倍的效益回报——哪找这么好的合作伙伴呀。
当然,这活肯定也不好干,因为人工智能时代的算力,发展的实在太快,“甲方”的要求实在有点多。尤其是单集群规模快速跃升,复杂流量的敏捷调度,以及异构算力的兼容等三方面,给网络联接带来了巨大的挑战。
韩信点兵多多益善
首先是用于模型训练的单集群规模,还在快速跃升,而且头部科技企业依然信奉,“大数据+大算力+大模型”,才是通向通用人工智能(AGI)的唯一路径。由此带来的变化就是,算力集群规模正在从千卡向万卡、十万卡,甚至百万卡快速演进。
相关数据显示:2025年上半年,国内至少涌现出了393个智算中心相关项目。其中,亿元以上的投资项目数量达到了43个。其中还有10个项目的投资金额超过了10亿元。
解决此方面的挑战,唯有“韩信点兵多多益善”,以更强的交换吞吐能力,支持更大规模的算力集群。在此方面,新华三一直是家敢为天下先的企业。2025年,其率先发布H3C S9828-128EP交换机。
H3C S9828-128EP就是坐镇智算网络的“第一员大将”,其交换容量将惊人地增长到102.4Tbps,端口密度也从上一代产品的64个800G端口,增长到128个800G端口,为当前业内单机容量之最。
而且如此规模的“运力航母”,已经不仅是通信技术范畴的创新,它还触及了工业级创新,触及了通信硬件设计的无人区。其中,H3C S9828-128EP就率先使用了通常只在卫星通信中才能用到的M9级PCB板材,这可大幅减少信号传输损耗,并支持设备在极端温度环境下的稳定运行。
而且,H3C S9828-128EP采用双22层高密PCB混压加工技术,并引入深微孔加工工艺。传统方式会将过孔直接打穿所有层,导致未使用层上形成残桩,不仅占用走线空间,还可能引发信号干扰。而深微孔技术则可精准控制过孔深度,只连接所需层次,避免残桩产生。由此在多层高密PCB设计中大幅释放走线空间,减少绕行,显著提升信号完整性与传输效率。”
当然,并不是所有的应用场景,都要选用H3C S9828-128EP。因为新华三智算网络帐下还有一员大将——800G CPO硅光数据中心交换机(H3C S9827系列)。这又是一款新华三全球首发的产品。
800G CPO硅光数据中心交换机最早发布于2023年。两年之后,其技术路线开始受到众多科技企业的追捧。原因就在于,它将负责数据交换的NPU与TRX光电转换模块进行统一封装,以此减少了交换机内部的电路复杂度,并降低了线路延迟和传输损耗。
铁路警察不再各管一段
除此之外。
随着超大规模智算中心的快速发展,“复杂流量的敏捷调度”也是网络方案面临的挑战。对此,新华三集团高级副总裁、网络产品线总裁乔剡表示:“端网协同正在成为释放算力潜能、提升集群效率的关键路径。”
乔剡所说的“端”就是算力服务器,或者特指服务器里的网卡。在此之前,“算力”与“网络”之间,属于是“铁路警察各管一段”。他们势力范围的边界就是“网卡”。网卡之外是“网络”,服务器内部的网卡则属于“算力”的管辖范围。
但问题就在这。“网卡”属于算力范畴,可它却没装道路导航,不知道外面的世界,哪条路畅通,哪条路拥堵;也不知道如何选择最优的网络路径;更不知道集群里的其他网卡,此时此刻是否也在卖力地转发着数据。
如何解决?
一方面,通过生态合作,新华三已将服务器里的网卡,视为“前沿阵地”。如此一来,“端”与“网”互为掎角之势,“道路”信息得以共享,数据生产与数据传输得以匹配,形成了端网协同。
另一方面,新华三的端网协同方案,通过有序分配熵值和增强的CBRC算法,实现了更智能的网络调度。
与此同时,作为新华三智算网络的“后勤部长”,AD-DC智算版也在发挥价值。它可为集群提供全生命周期保障,可将万卡集群上线周期,从数周压缩至数天,并支持自动化性能验证与故障实时监控。
目前,该方案已在50余款新华三交换机,以及多家GPU、网卡厂商的联合验证中成功运行 Llama3 模型,网络性能平均提升16%,防拥塞效果提升 20%。
百花齐放、殊途同归
而与此相关,还有另一问题需要解决。人工智能时代,网络面临的第三个挑战是“多元异构算力协同”。对此,乔剡表示,“新华三希望以技术创新,弥合算力、网卡企业不同技术特点间的差异。”
在此之前,新华三又在业内率先推出DDC(Diversified Dynamic-Connectivity,多元动态联接)架构,其可为行业提供全新一代的算力解耦与高效调度能力。这就是新华三智算网络帐下的“第三员大将”。
在此稍作比较。
不管是单芯片102.4T的H3C S9828-128EP,还是800G CPO硅光数据中心交换机,都是基于RoCE协议。也就是说,如果用户更熟悉以太网,就选择这两款产品,而若是追求堪比InfiniBand的交换效率,就选DDC架构的交换机。
而且DDC架构交换机对“多元算力”特别友好。其实,不管你喜不喜欢,“多元算力”就是现实,它们一直讲着不同的“方言”,发出的粗细不同的数据报文。而运输这样的报文“车队”跑在网络中,很可能是一条车道装不下,两条车道装不满,极容易造成网络拥塞。
DDC架构交换机完美解决了此问题,其最大的特点是“信元转发”,通过端到端的受控调度,实现了算力与网络的彻底解耦,依托信元转发技术,它可将数据按512字节切片均匀喷洒,以此消除了HASH极化,实现了100%负载均衡。经Tolly 机构权威验证,DDC架构交换机在有效带宽方面,相比ECMP最高提升107%;在All-to-All场景下,传输性能较InfiniBand 方案平均提升2.5%,展现出显著优势。
当然,这还不是全部。乔剡最后强调了“标准”和“方法论”:“实践是检验真理的唯一标准,新华三希望通过实践,推动行业标准的建立,更希望通过实践,打磨出适配多元异构体系的‘方法论’。任何品牌的芯片、网卡,只要遵从“方法论”,就能找到‘算力×联接’的最大值。”
来源:张戈BP