为AI数据中心“插上翅膀”:是德科技发布全新KAI系列解决方案和三款新品

360影视 日韩动漫 2025-05-10 15:08 1

摘要:有这样一家公司,它“古老”到可以追溯到80多年前,却又“年轻”得刚满上市10周年,这家公司便是专注于电子测试测量领域的是德科技。据是德科技大中华区市场总经理郑纪峰介绍,该公司的历史可以追溯到1939年惠普在车库里创立的那一年。1999年,惠普分拆成惠普和安捷伦

有这样一家公司,它“古老”到可以追溯到80多年前,却又“年轻”得刚满上市10周年,这家公司便是专注于电子测试测量领域的是德科技。据是德科技大中华区市场总经理郑纪峰介绍,该公司的历史可以追溯到1939年惠普在车库里创立的那一年。1999年,惠普分拆成惠普和安捷伦,是德科技则隶属于安捷伦。2014年,安捷伦和是德科技再次分拆,目前是德科技聚焦于电子通讯、半导体、计算机等细分领域。“按我们财年来算,今年恰巧是是德科技从安捷伦分拆独立上市的十周年。是德科技从分拆后独立上市以来推进了诸多工作,深耕电子、通讯、半导体、计算机等领域。”郑纪峰表示。

图 | 是德科技大中华区市场总经理郑纪峰

就在最近,是德科技发布了一系列端到端解决方案Keysight AI(KAI),旨在帮助用户通过仿真真实世界的AI工作负载来验证AI集群组件,从而能够拓展数据中心的AI处理能力。

(来源:资料图)

对于AI数据中心的“运行之痛”,是德科技大中华区高速数字市场部经理李坚表示:“AI数据中心可能需要2-3个月来训练一个模型。它的典型工作状态是,每工作几个小时就得停下来保存一次中间结果,查看网络是否正常,否则之后的工作很可能没有意义。这是因为在今天的超大型算力中心中,很多器件在已经接近物理极限性能的状态下运行,整个网络中可能存在很多潜在的故障,网络的韧性需要提高。”

图 | 是德科技大中华区高速数字市场部经理李坚

对于大规模AI数据中心来说,人们通常需要在其设计过程和构建过程中开展全面测试,所有芯片、电缆、互连、交换机、服务器和图形处理单元(GPU,Graphics Processing Unit)都需要在组件级和系统级上分别进行验证。通过使用全栈工作负载来仿真补充物理层测试,可以识别那些在单独测试组件时无法发现的漏洞,从而让用户更快地提取峰值AI性能,进而更快地增加容量,最终实现AI集群投资回报的最大化。

对于AI提供商、半导体制造商和网络设备制造商来说,KAI系列解决方案能带来以下功能:

其一,能够实现加速设计。通过集成的先进的高速数字设计仿真验证工具,对最新的高速外围组件互连PCIe、高速存储(DDR、HBM)和池化链接(CXL,Compute Express Link)等标准的设备进行可靠的仿真验证。

其二,能够加速开发。这是因为该方案能够验证组件级的合规性,包括验证高速互连、电缆和芯片组等,并能在系统级层面验证工作负载性能。

其三,能够加速部署和运营。即在整个数据中心验证和优化系统级性能,通过使用端到端仿真来在大规模部署前找出系统中的性能问题,从而降低工作负载失败的风险。

与此同时,该公司还推出了三款新产品:KAI数据中心构建器、互连与网络性能测试仪(INPT-1600GE)、DCA-M采样示波器。这些产品能够加速AI网络设计和部署,并能针对1.6T组件进行表征和测试,从而确保AI数据中心网络实现可靠的良好运行,助力用户更好地应对AI行业的挑战。

(来源:资料图)

KAI数据中心构建器,主要瞄准交换机厂商和云服务商。众所周知,AI服务提供商需要使用各种并行处理策略来加速AI模型训练,而将模型并行与AI集群拓扑和配置协同则可以提高训练性能。KAI数据中心构建器具备工作负载模拟的功能,可以将大模型和其他AI模型训练所需的工作负载,集成到网络、主机和加速器等AI基础设施组件的设计和验证之中,从而能让硬件设计、协议、架构和AI训练算法实现更加紧密的协同。基于KAI数据中心构建器的工作负载仿真解决方案,能够再现真实AI训练任务的网络通信模式,从而加速模型训练优化所需的学习曲线,进而能够更加深入地洞察性能下降的原因,最终为AI训练任务过程提供此前难以获得的能力。

INPT-1600GE,主要瞄准光电模块厂商以及网络芯片与设备厂商。多年来,在验证网络互连性能的时候,往往需要手动操作,因此会耗费大量时间。原因之一在于场景众多,自动化程度有限,并且,通常还需要具备高级编程技能的工程师来编写脚本。对于验证网络互连性能这一过程来说,此前并没有一个集中的系统来针对互连数据和报告进行整理和存储,所以很难针对测试和配置进行跟踪和复制。随着AI和数据中心互连的多样性以及规模的不断增加,针对现今愈加复杂的AI网络,使用传统测试方法很难准确地预测和衡量其可靠性。而此次发布的INPT-1600GE搭配了是德科技的互连测试系统(ITS,Interconnect Test System)软件,这让该产品可被作为一个整体系统,从而能够智能地组织、存储和使用数据,进而实现高速以太网网络和AI数据中心的互连自动化验证。

DCA-M采样示波器,主要瞄准光芯片厂商和光模块厂商。在AI数据中心网络的快速部署中,1.6T光互连会带来较为明显的测量挑战。一方面是因为数据速率极高,另一方面是因为这类环境对于信号完整性的要求极其严格,工程师必须在较为广泛的操作条件之下针对收发器的性能进行表征和验证,这时就需要精确的测试设备,即必须使用具备卓越带宽、低噪声和高灵敏度的设备。在相关制造过程之中,自动化测试必须实现高效、可扩展、高精确等性能,只有这样才能实现大量关键参数的验证,以便能够确保高吞吐量和产量,以及确保在满足数据中心要求的同时还能符合行业标准。而此次推出的DCA-M采样示波器,专为满足1.6T收发器光学测试的严格要求而设计,能够提供240 Gbps/通道的高速光信号分析,具有高光学测量灵敏度和集成时钟恢复功能,支持高达120 GBaud的数据速率,可以满足数据中心AI集群的下一代光互连的研发需求和制造需求。同时,该产品在测试时使用“采测分离”,即使用一边采一边测的并行方式,从而能够提高测试效率,进而加速客户的产品推出时间。

谈及这一系列产品发布之前的验证,“我们与业界领导者紧密合作,开展了大量工作,还和一些大型云厂商、交换机厂商合作,他们也都使用了我们这套软件在其实验室里开展环境仿真。”李坚补充称:“在未来五到十年里,AI市场将拥有快速增长的机会,这种增长机会不仅仅来自于算力基础设施,可能更多来自于应用和服务。AI的标准还在不断地演进,是德科技始终与行业中的合作伙伴携手合作,在全球范围内共参加了数十个标准组织,包括以太网联盟、PCI-SIG等。我们希望通过合作的方式更好地推进产业发展。”

来源:DeepTech深科技

相关推荐