构筑AI算力基石,微众银行推进智算网络自主创新

360影视 欧美动漫 2025-05-07 12:08 2

摘要:AI大模型时代的快速发展,使得算力需求呈现指数级增长,如何有效解决网络拥塞、优化算力资源利用率,成为AI分布式训练的核心挑战。近日,微众银行正式发布金融行业首款自研AI智算交换机,并披露高性能AI智算网络解决方案,实现从底层硬件交换机,到软件层网络操作系统,再

AI大模型时代的快速发展,使得算力需求呈现指数级增长,如何有效解决网络拥塞、优化算力资源利用率,成为AI分布式训练的核心挑战。近日,微众银行正式发布金融行业首款自研AI智算交换机,并披露高性能AI智算网络解决方案,实现从底层硬件交换机,到软件层网络操作系统,再到智能网络管控的全链路自主可控。这一创新突破,不仅夯实了自身AI算力基础设施,也为金融行业的AI智算发展提供了全新技术范式。

AI分布式训练是目前深度学习和大规模模型发展的核心组成部分,但随着模型规模的扩大,网络的带宽、延时、稳定性等问题也愈加显现。尤其在高并发训练任务中,传统的网络架构无法高效应对数据流量的复杂性,网络拥塞问题时常导致算力浪费、训练时间延长,甚至无法保证数据一致性。微众银行从自身业务需求出发,深度优化AI智算网络架构,在硬件、软件及智能管控层面实现突破,为大规模AI训练提供稳定、高效的底层支撑。

硬件层面,面向未来AI智算需求的高性能交换机

微众银行基于国产12.8T交换芯片和国产高性能CPU,打造了一款高吞吐、低时延的AI智算专属交换机,能够适配国内外主流AI算力卡,包括GPU、NPU等计算资源,支持高达1.6T的RDMA(Remote Direct Memory Access,远程直接内存访问)接入能力,为无损以太网的AI训练集群构建高效数据通路。相比于传统网络方案,该交换机具备更灵活的拓扑适配能力,能够根据实际业务需求进行可定制化组网并提升整体训练效率。

软件层面,自研网络操作系统打造更智能的AI智算网络

在软件架构上,微众银行基于开源SONiC(Software for Open Networking in The Cloud,云中开放网络软件)自研网络操作系统,并针对AI智算场景优化了网络协议栈。特别是自研链路级智能调度组件,使得大规模无损以太网部署更加顺滑,确保高带宽、低时延的网络需求能够得到满足。该组件能够根据实时网络状态动态调整流量分配策略,若链路发生故障,还能在毫秒级时间内完成流量切换,有效降低网络波动对AI训练的影响。

智能管控层面,AI驱动的网络优化能力

与传统网络架构不同,微众银行的创新方案不仅依靠硬件和软件的升级,更在网络管控方面进行了革命性的设计。通过智能化的调度系统,微众银行的AI智算交换机能够根据实时的网络状态,自动调整流量分配与路径选择,确保无论在负载高峰期还是出现故障时,数据流都能无缝切换、平稳传输。智能调度系统还能够动态监控网络状态,预判并主动应对可能出现的瓶颈,避免了传统方法依赖人工干预的低效性和滞后性。

目前,微众银行的自研交换机已在生产环境中正式投入使用,最高可满足400G GPU/NPU算力卡的组网需求,同时实现建网成本降低约70%,极大提升了AI智算网络的性价比,为迈向AI原生奠定了坚实基础。未来,微众银行将在AI智算网络领域持续深耕,不断优化架构设计,并计划推出标准化公共组件,推动AI智算网络向更高效、更智能的方向演进,为金融行业的智能化发展提供稳固支撑,同时通过开源共享助力全球AI智算网络的高质量发展。

来源:小林论科技

相关推荐