摘要:8月14日,第21届CCF全国高性能计算学术大会(简称“CCF HPC China 2025”)在内蒙古鄂尔多斯开幕。大会以“绿动算力超智融合”为主题,由中国计算机学会主办,中国计算机学会高性能计算专业委员会、鄂尔多斯应用技术学院、鄂尔多斯市高新技术产业投
8月14日,第21届CCF全国高性能计算学术大会(简称“CCF HPC China 2025”)在内蒙古鄂尔多斯开幕。大会以“绿动算力超智融合”为主题,由中国计算机学会主办,中国计算机学会高性能计算专业委员会、鄂尔多斯应用技术学院、鄂尔多斯市高新技术产业投资有限责任公司共同承办。
开幕式上,高通量以太网(ETH +)联盟协议、芯片及解决方案发布会同期举行。发布会涵盖Scale-Up和Scale-Out网络场景,分别发布了高通量以太网(ETH+)协议(1.1)联盟标准白皮书;全量支持高通量以太网(ETH+)特性的首款国产400G智能网卡芯片;支持高通量以太网(ETH+)关键特性的首款国产25.6T交换芯片;支持高通量以太网(ETH+)ERack+、ORack+的国产硅光芯片;首款高通量以太网(ETH+)64 超节点高超柜(ERack+);基于高通量以太网(ETH+)光互联的超节点解决方案UPN 512。
随着AI计算集群规模的不断扩大,如何保持算力的线性扩展,成为一个世界性的难题。在这场AI变革中,大规模GPU相互连接,计算与网络紧密交织,性能不再是一个单一的概念。谁能率先构建出具备长期演进能力的高性能网络互联方案,谁就有可能在未来的算力竞争中占据决定性优势。
2022年7月,阿里云和中国科学院计算技术研究所联合开启高通量以太网(ETH+)协议的制定;2023年7月,由阿里云和中国科学院计算技术研究所发起的“高通量以太网联盟”应运而生。目前,高通量以太网联盟会员单位已经超过50家,涵盖云厂商、芯片厂商、系统集成商、科研院所等相关单位。
在Scale out阶段,高通量以太网联盟最先提出构建面向AI智算领域的以太网生态,最先实现Scale-Out网络协议的收敛、协议标准发布及芯片化落地。比如,网卡芯片(2*200G 自研网卡芯片)、交换芯片(25.6T 自研交换芯片)、硅光芯片(1*400G 硅光芯片)等成果;同时,基于阿里云HPN(High-Performance Networking)架构体系,实现全国产的落地方案。
在Scale-Up场景,高通量以太网联盟促进产业共识,推动协议制定和原型验证,首先提出并始终坚持Scale-Out和Scale-Up网络融合发展的理念,并基于以太网大芯片容量和光互连构建全解耦的UPN(超性能网络)架构解决方案。
此次发布会的举行,也标志着高通量以太网联盟在Scale-Up和Scale-Out网络场景的芯片化落地及国产解决方案已经完成关键性突破。
以高超柜为例,在设计之初就定位了高密高带宽高速率,相比其他Scale up技术方案,以太网交换芯片具有大带宽,大Radix,高速率的优势,成为高通量以太网联盟针对百卡规模超节点的超高密度开放超节点系统方案。
据悉,高通量以太网(ETH+)协议(1.1)联盟标准白皮书等成果的发布只是第一阶段,下一步,高通量以太网联盟将推动UPN新型系统架构完成设计和标准制定,构建基于以太网光互联技术的分布式可扩展系统。(记者肖春芳)
来源:光明网