摘要:在数字经济浪潮汹涌澎湃的今天,人工智能技术已跃升为推动各行业数字化转型、激发经济新活力的核心驱动力,大量人工智能应用正在被开发和投入应用。与此同时,数据中心也面临新一轮的升级和重构需求,算力网络正是推动这一变革的主要动力之一。
在数字经济浪潮汹涌澎湃的今天,人工智能技术已跃升为推动各行业数字化转型、激发经济新活力的核心驱动力,大量人工智能应用正在被开发和投入应用。与此同时,数据中心也面临新一轮的升级和重构需求,算力网络正是推动这一变革的主要动力之一。
由于大语言模型对算力需求的不断增长带来了GPU集群规模的不断扩大,从而对网络性能、可靠性及成本效益提出了更为严苛的要求。面对新的挑战,如何构建面向AI应用的新一代智算网络成为不少企业需要面对的问题。
在日前举行的以“算网融合 筑梦智算未来——加速释放AI时代的算力新潜能”为主题的线上活动中,联想产品技术专家们就面向AI时代的数据网络和服务器技术创新、算网深度融合的一体化解决方案等热点话题进行了深度分享。
在AI网络市场,联想能提供端到端智算网络解决方案,从千兆、万兆、25G、100G接入交换机,到100G核心交换机,再到400G核心交换机,可以满足数据中心主流的智算网络建设需求。比如,通过spine-leaf架构可以支持2000台-4000台的组网规模,也能适配小规模HPC&AI网络的组网。
以联想问天NE8570-4C交换机为例,这是一款4U 128端口的板卡式100G交换机,交换容量达到25.6Tbps,转发性能达到8000Mpps。联想问天NE8570-4C交换机采用英特尔至强处理器,可以提供运营商级别的可靠性。同时,由联想问天NE8570-4C交换机和联想问天NE2580E/NE1080E交换机构建的“去二层网络”有以下优势:
1、能屏蔽广播风暴以及不稳定问题
2、能支持RoCE,提供更低转发延时
3、接入Leaf去堆叠,升级不断网,符合主流的技术发展路线
“而且联想问天NE8570-4C交换机还是一款高性价比的交换机,在硬件成本上可节约47%,用电成本上节约71%。另外,因为去框式,还可以带来24%的空间节省。”
联想还推出了多款国产芯片交换机,以满足客户对自主可控的需求。
联想问天NE6730G交换机就是其中之一,一款48端口万兆交换机,使用了盛科的网络芯片,性能上达到了博通Trident 3的水平,交换容量4.8T(双向),包转发2000Mpps,能够满足数据中心的各种主流网络需求,如支持去堆叠的MLAG、VxLAN、MPS VPN等,能实现自动化部署、弹性扩展,支持RoCE以及运维智能化等功能。
在智算数据中心的建设上,联想不只是关注网络产品本身,还在算力侧同步发力,通过算网融合为智算应用赋能。针对当前火爆的AI市场,联想有三款主力AI服务器,分别是面向大模型训练的联想问天WA7780 G3、训推一体的联想问天WA5480 G3、面向推理的联想问天WA5220 G3。这几款AI服务器分别针对主要面对的应用场景进行了针对性的优化。
以联想问天WA5480 G3为例,宽幅配置,单台支持24块2.5寸硬盘,最多支持10张双宽GPU,而且兼容国产GPU。比如,可以搭配国产沐曦C500和天垓150 GPU以及英伟达L20等满足训推一体的需求,也可以搭配国产沐曦C500或者AMD MI308用于HPC传统场景,还可以搭配摩尔S3000进行图形渲染。
要充分释放AI服务器的算力潜能,需要配置合适的网络架构。针对联想问天WA5480 G3,联想推荐采用“283架构”,即2颗CPU、8张GPU卡、3张网卡的配置。其中,2张400G的IB或者RoCE网卡负责东西向的数据交换,一张400G或者200G的IB或者RoCE网卡负责南北向的数据传输。
当前,人工智能以及大语言模型等技术仍处于飞速发展,对于算力的需求还将持续增长,作为支撑技术的算力网络也需要齐头并进。显然,在智算网络演进过程中,能提供更高带宽、更低延时、更高可靠性和可扩展性,同时具有更高性价比的智算网络方案才能在这一AI浪潮中立于潮头。
联想“与时俱进”发布全新的网络产品线并打造场景化和定制化的解决方案,以全新的创新力和产品力,打造高品质智算网络,助力构筑坚实网络底座。
来源:我看着像熊猫吗