摘要:年初DeepSeek-R1模型一经推出,便迅速成为全世界的焦点。AI应用的蓬勃发展对算力网络提出了前所未有的高要求。以深度学习模型训练为例,一个大型模型可能需要处理海量的数据,历经数十亿甚至数万亿次的计算操作。为满足如此庞大的算力需求,迪普科技推出了LSW66
年初DeepSeek-R1模型一经推出,便迅速成为全世界的焦点。AI应用的蓬勃发展对算力网络提出了前所未有的高要求。以深度学习模型训练为例,一个大型模型可能需要处理海量的数据,历经数十亿甚至数万亿次的计算操作。为满足如此庞大的算力需求,迪普科技推出了LSW6600系列的32*400G、64*400G盒式设备和DPX29000-G系列等全面支持RoCE无损网络特性的国产化交换机以及低延时高性能应用交付平台。
迪普科技AI算力交换机
随着AI大模型参数规模突破万亿级,智算中心正从“单点建设”转向“全局协同”,但网络层的关键瓶颈日益凸显:
算力效率之困:传统TCP/IP协议栈的丢包率高达0.1%即可能导致30%算力浪费,GPU集群协同训练效率难以突破70%。
性能天花板待破:面对1000p集群互联需求,带宽与时延仍需数量级提升。
国产化替代阵痛:国产高性能交换芯片正在崛起,但供应链安全与自主可控仍面对挑战。
能耗失控风险:智算中心电力成本占比超40%,智能调优等技术尚未规模化落地。
智算网络已从“可用”走向“好用”阶段,解决这些问题需要从架构设计到协议栈的全栈重构。
迪普科技推出智算网络解决方案 ,针对智算网络困境结合自身优势技术迅速革新。
一套架构:正交CLOS“零背板”设计
硬件层:DPX29000-G系列采用零背板正交CLOS架构,消除信号衰减,实现100%无阻塞交换,并且LSW6600系列支持64*400G高密端口。
协议层:RoCEv2协议,结合PFC流控与AI ECN智能拥塞通知,端到端时延压至5μs,较传统方案时延降低80%。
实测数据:已在某超算中心部署中,极大地扩展了服务器容量。
三大革新,国产化全栈突围
芯片级自主:搭载盛科系列交换芯片,转发性能达5300Mpps,支持无损网络技术。
软件定义能力:ConPlat操作系统实现网络配置“一键下发”,兼容整体网络生态。
全系列国产化:框式DPX29000-G与盒式LSW6600全系列关键元器件国产化对标国家信创大趋势。
迪普科技ADX应用交付平台
AI训练动辄耗费数千万美元硬件投入构建算力集群,当算力需求呈指数级增长,传统IT架构却面临两大挑战:
1、资源分配不均:面对海量任务无法进行合理分配,算力“贫富差距”导致部分算力节点过载,部分算力节点闲置,整体利用率下降。
2、后端节点状态不明朗:无法及时感知后方故障的算力节点,影响整体训练效果,降低AI训练效率。
迪普科技推出的ADX3000应用交付平台,作为AI算力网络的智能中枢,就像交通警察指挥交通一样,让每一笔算力资源精准匹配需求,解锁AI算力新境界!
01
智能调度
DPtech ADX3000应用交付平台可根据任务的优先级和资源需求,通过多种算法智能调度海量的图像生成、语音识别及大模型推理任务,避免出现任务分配两极化的情况,让您的AI模型告别“繁忙”。
02
高可靠性
在庞大的 AI 算力网络中,节点众多且分布广泛,任何一个节点的故障都可能引发连锁反应,影响整个网络的稳定性。DPtech ADX3000应用交付平台支持自定义策略来实时监测、感知算力节点状态,拒绝节点状态未知;当某个节点出现故障时,DPtech ADX3000可以迅速将原本分配给该节点的任务转移到其他正常节点上,确保网络的持续稳定运行,增强整个系统的容错能力,为AI 应用的7X24h不间断服务提供坚实保障。
03
超高性能
DPtech ADX3000应用交付平台最高可实现上亿超高并发下微秒级超低延迟,在超高吞吐场景下,迪普科技也推出了业界首款T级高性能应用交付平台,助力AI算力网络建设发展。
在海外巨头主导的智算赛道,迪普科技的价值不仅在于技术突破,更在于迪普科技探索出了一条“自主可控”的差异化路径。随着AI 2.0时代的到来,此次迪普科技推出的LSW6600系列的32*400G、64*400G盒式设备和DPX29000-G系列等全面支持RoCE无损网络特性的国产化交换机以及T级高性能应用交付平台,也象征着迪普科技能为客户打造更坚实的网络基座。
来源:动态宝