是德科技KAI,面向AI基础设施的仿真优化利器

360影视 欧美动漫 2025-05-12 17:05 1

摘要:调研机构数据显示,2022年全球AI市场规模约为869亿美元,预计到2030年将增至1.3万亿美元,2024至2030年间年均增长率超过30%。根据IDC预测,到2030年,人工智能将为全球经济贡献19.9万亿美元,占全球GDP的3.5%。

现在几乎没有哪个场合不在谈AI,即便是在前几天的传统射频微波会议EDICON 2025,讨论最热烈的话题依然是AI。

2022年底在生成式AI来临后,AI真正在遍地开花。

调研机构数据显示,2022年全球AI市场规模约为869亿美元,预计到2030年将增至1.3万亿美元,2024至2030年间年均增长率超过30%。根据IDC预测,到2030年,人工智能将为全球经济贡献19.9万亿美元,占全球GDP的3.5%。

在这股浪潮中,是德科技认为,AI市场不仅将在未来一两年保持高速增长,甚至在五到十年内都将延续强劲发展势头,且增长动力将逐步从算力基础设施转向更多应用与服务场景。

是德科技围绕AI发展趋势,携手众多领先技术企业,深入洞察人工智能网络建设中的挑战与痛点,基于丰富实践经验与客户需求,推出Keysight AI(KAI)系列解决方案,为行业提供覆盖测试、验证、优化与应用的全流程支持。

测试测量走进AI领域

自2014年11月1日正式成为独立运营的电子测试测量公司,并于11月3日在纽约证券交易所上市以来,是德科技持续深耕电子、通信、半导体、计算机等核心技术领域,通过不断投入、并购与业务拓展,持续丰富解决方案与服务体系。

是德科技大中华区市场总经理郑纪峰谈到,在过去十年间,是德科技通过持续推进并购与重组,丰富并完善自身解决方案,并不断拓展新兴领域。

是德科技大中华区市场总经理郑纪峰

是德科技完成的并购案已超过20宗,比如以16亿美元收购的Ixia,从专注物理层、链路层,拓展至覆盖通信七层协议的全方位测试方案;并购Scienlab,将业务延伸至新能源汽车电池管理与充放电系统领域;收购Cliosoft,进一步补强了在软件解决方案方面的产品矩阵。

目前,还有数宗并购项目在稳步推进。与思博伦通信(Spirent Communication)的并购案已进入尾声阶段,以及正在洽谈中的新思科技(Synopsys)光学软件解决方案收购案。

是德科技通过一系列并购持续优化解决方案能力,为客户提供更加全面、一站式的技术服务与产品支持。

同样在过去十年间,是德科技也经历了诸多里程碑式事件。2018年,Keysight World在包括上海在内的城市中首次举办,探讨6G、AI、云计算、汽车等前沿技术与解决方案。此后,Keysight World逐渐成为是德科技年度技术交流盛会。

同年,是德科技推出业界首款具备110G实时带宽和256G实时采样率的示波器,应用于AI、高速数字电路和高速数字接口等领域,采用自主研发的磷化铟半导体技术。

目前,是德科技在全球已设立4个汽车实验室(汽车客户中心),分别位于上海、德国斯图加特、美国底特律诺维和日本东京。上海国际汽车城的汽车电子与新能源方案中心投入超过千万设备,用户可注册样品和测试需求,免费预约新能源汽车及汽车电子测试方案,工程师现场协助测试与方案探讨。

2023年,是德科技与16家企业机构联合创建6G-SANDBOX平台,聚焦6G与5G-Advance前沿研究,6G-SANDBOX得到了欧洲地平线计划的资助,获得多家运营商与行业头部企业支持,包括西班牙电信等全球电信公司积极参与。

2024年,是德科技开启与NVIDIA 6G研究云平台的合作。是德科技网络仿真解决方案通过与该平台的结合,使得研究人员能够利用是德科技的全套端到端网络仿真功能来开发和验证优化无线通信接入的新方法。

今年,是德科技正式发布全新Keysight AI系列解决方案(KAI),帮助客户通过仿真真实世界的AI工作负载来验证AI集群组件,从而扩展数据中心的AI处理能力,洞察系统的性能和效率。

大模型时代,基础设施压力倍增

如今的大模型、大算力时代对基础设施提出了更高要求,尤其在大带宽、大规模数据交换方面。当前数据中心主要依赖以太网、存储和PCIe等底层基础设施构建算力中心。

以太网标准普遍处于400G/800G阶段,但在全球范围内,800G部署仍不算普及。预计在未来3-5年内,以太网带宽将逐步提升至1.6T/3.2T,实现4至8倍增长以支撑更大型模型、更多算力节点和更密集的数据交换需求。

数据中心存储广泛采用的DDR内存,速率约为8.4GT/s,预计未来将升级至DDR6或DDR7,同时高带宽内存(HBM)如HBM3、HBM3E、HBM4也将逐渐成为主流,带宽能力相比DDR提升约一个数量级。

PCIe标准也在加速演进,从现有的PCIe 5.0迅速推进到PCIe 6.0,并计划向PCIe 7.0升级。以往标准升级节奏,通常需要5-6年时间,但未来5-6年内,相关带宽标准预计将实现翻倍级提升,甚至完成多次迭代。

随着带宽不断提升,技术系统也随之面临一系列新的挑战。首先,器件将接近物理极限性能运行,稳定性成为问题。许多器件在高带宽下功耗上升,温度波动加剧,而部分器件,尤其是光学器件,对温度极为敏感,性能极易受影响。同时,高速环境下的信号干扰、噪声问题也会更加突出。

其次,传统PCB板传输方式面临瓶颈。以往电信号依靠PCB传输,但在超高带宽速率下,PCB损耗和干扰过大。以NVIDIA发布的NVL72机柜为例,内部已全面转向无源铜缆。未来甚至可能看到有源电缆的引入,以满足高速信号传输需求。

在这样一个超大规模的算力网络中,最昂贵的资源依然是GPU。但问题在于,这些GPU是否始终在高效运行?

数据显示,在AI算力中心中,GPU真正执行计算任务的时间仅占20%,再加上16%的Overlap时间,总体算下来,GPU有效工作的时间不到40%。剩余的大部分时间,GPU都在等待其他节点将数据传递过来,处于“待命”状态。

这种情况源于大模型训练过程中,节点间需要不断交换权重、梯度等数据。每当一个GPU完成局部计算,就需要将结果同步至其他节点,再获取新数据继续计算。这种频繁的数据交互导致GPU大量时间被占用在通信等待上,而非计算本身。

所以GPU的使用效率直接受限于网络架构设计。在一个万卡、十万卡级别的数据中心里,GPU使用率每提升1个百分点,就可能带来数亿元级别的成本优化。例如,200亿元的投资,如果GPU效率提高1%,就能节省2亿元。

“这意味着产业实施方式、系统设计理念都将发生根本性变化。”是德科技大中华区高速数字市场部经理李坚说道。深入数据中心便能发现,背后存在各种复杂问题亟待解决,许多设备和系统实际上处于“带病上岗”状态,难以全面支撑“高可靠、长周期”的训练任务。

是德科技大中华区高速数字市场部经理李坚

KAI做好AI工作负载的仿真

是德科技自1939年以来,深耕电子测试测量领域已有80余年历史,在射频微波类产品上有着深厚的积累,像信号源、频谱仪,以及高端示波器等数字类产品。

近年来,随着人工智能产业链和生态体系的快速发展,是德科技发现这些产品也逐渐被应用到AI相关的研发和部署场景中。李坚指出,起初许多用户自发性地将这些产品用于AI应用,比如在做电路板设计时使用ADS设计软件、在电路板信号分析或数字信号调试时用高端示波器,或是在光模块、电模块测试中使用误码仪等专业仪器。

伴随需求的不断积累,是德科技和NVIDIA、CISCO、Arista、Google、Microsoft等企业展开合作,根据使用经验和客户反馈,逐渐扩展了自身的AI测试测量产品矩阵。

Keysight AI(KAI)是一系列端到端的解决方案,旨在帮助客户通过仿真真实世界的AI工作负载来验证AI集群组件,从而扩展数据中心的AI处理能力。Keysight AI解决方案覆盖高速计算、互连、网络和能效四个产品组件,提供从硅前模拟到部署后系统测试和故障排除的AI数据中心设计的所有方面。

最近是德科技推出了三款新品:AI数据中心构建器、互连与网络性能测试仪、DCA-M采样示波器。

KAI数据中心构建器

AI服务提供商使用各种并行处理策略来加速AI模型训练,将模型并行与AI集群拓扑和配置协同可以提高训练性能。

KAI数据中心构建器的工作负载模拟功能将大型语言模型(LLM)和其他人工智能模型训练所需要的工作负载集成到AI基础设施组件的设计和验证中——包括网络、主机和加速器。实现了硬件设计、协议、架构和AI训练算法之间的更紧密协同,提升系统性能。

KAI数据中心构建器的工作负载仿真解决方案再现了真实AI训练任务的网络通信模式,加速模型训练优化所需的学习曲线,并更深入洞察性能下降的原因。

互连与网络性能测试仪

几十年来,验证网络互连性能需要手动操作,耗费大量时间,自动化程度有限或根本无法实现,并且需要高级编程技能来编写脚本。该过程还缺乏一个集中系统来整理和存储互连数据及报告,因此很难跟踪和复制测试和配置。随着AI和数据中心互连的多样性和规模不断增加,这些传统测试方法无法准确预测和衡量当今复杂AI网络的可靠性。

新的互连和网络性能测试系统通过INPT-1600GE搭配ITS软件,可以作为一个整体系统,智能地组织、存储和使用数据,实现高速以太网网络和AI数据中心中的互连自动化验证。

DCA-M采样示波器

1.6T光互连在AI数据中心网络的快速部署带来了显著的测量挑战,因为数据速率极高且信号完整性要求严格,工程师需要在广泛的操作条件下对收发器的性能进行表征和验证,这需要具有卓越带宽、低噪声和高灵敏度的精确测试设备。在制造过程中,自动化测试必须高效、可扩展且精确,以验证大量关键参数,确保高吞吐量和产量,同时满足数据中心要求并符合行业标准。

DCA-M采样示波器提供高达240 Gbps/通道的高速光信号分析,并且专为满足1.6T收发器光学测试的严格要求而设计,具有高光学测量灵敏度和集成时钟恢复功能,支持高达120 GBaud的数据速率,专门针对数据中心AI集群的下一代光互连的研发和制造需求。

产品在研发和部署到实际网络的过程中,首要任务是解决物理层的问题,就像修路时,路基必须先铺扎实,建房时,地基的石头必须稳固。

第二是网络层的复杂性。不同大模型的配置参数差异巨大,涉及不同的并行模式,无论是数据并行、模型并行,还是专家系统,每种配置对网络的要求都不相同。在李坚看来,产品架构中大约80%的框架是固定的,而20%的部分需要与云服务厂商、交换机厂商进行定制化合作。

未来,Keysight AI(KAI)解决方案将在网路仿真,组件性能验证以及节能降耗等关键环节,继续深化与产业链上下游的协同,助力AI基础设施持续优化,确保在算力密度攀升、模型复杂度提升的背景下,依然高效、可靠、可持续地支撑未来智能算力时代的不断演进。

来源:至顶网一点号

相关推荐