摘要:E-Series GPU IP为未来的边缘应用提供了一种通用且可编程的解决方案,涵盖图形渲染、桌面应用、智能手机上的自然语言处理、工业计算机视觉以及自动驾驶等领域。
点击参与:新思科技硬件加速验证技术日即将登陆成都、南京、杭州
5 月 8 日Imagination Technologies推出Imagination E-Series GPU IP,重新定义了边缘人工智能和图形系统设计。
E-Series GPU IP为未来的边缘应用提供了一种通用且可编程的解决方案,涵盖图形渲染、桌面应用、智能手机上的自然语言处理、工业计算机视觉以及自动驾驶等领域。
GPU性能大幅提升
E-Series优势明显,首先,边缘侧的功耗效率方面表现出色,每瓦性能提升了35%。其次, E-Series 神经核,其性能可扩展至200 TOPSINT8 ,AI 性能较前代D系列( D-Series )提升高达 400%。此外,E系列还延续了我们产品为开发者和系统集成提供灵活性的传统,我们提供了便捷的工具和解决方案。
E系列在前代产品的多任务处理能力基础上实现了增强,将Imagination GPU支持的、具备硬件加速且零开销的虚拟机数量从8个翻倍至16个,并提供了先进的QoS支持。E-SeriesGPU的多核版本可以利用额外的核心来提升性能或增强灵活性。这些GPU能够同时处理多种图形工作负载、多种AI工作负载,或图形与AI工作负载的组合。
Imagination产品管理副总裁Kristof解释,爆发处理器可调度特定指令,不会增加延迟,还能实现最佳功效。NPU与E系列GPU的关键区别在于,NPU专为特定AI应用设计,若出现未针对的新AI应用,NPU无法处理,任务需回传CPU,产生大延迟,严重影响性能。而E系列GPU将AI计算整合到管线中,配备可编程处理引擎,从原则上讲,不会出现AI任务处理不了需交其他单元处理的情况。更重要的是,无论是现有还是未来的AI网络,都可通过可编程GPU引擎在管线内进行AI计算处理。这是NPU解决方案面临的最大挑战。
在AI时代,算力芯片市场主要分为云端、边缘端和终端三个应用场景。GPU作为主流的AI算力芯片,占据了较大的市场份额。magination的E-Series GPU IP在市场上的表现受到广泛关注。其产品在功耗、性能和灵活性方面的优势使其在边缘AI市场具有较强的竞争力
AI算力架构的演进与权衡Imagination技术支持总监艾克表示,GPU凭借其通用并行计算能力,成为AI算力架构的重要补充。
艾克分析,随着AI模型对大规模并行计算与高密度算力的需求激增,CPU的架构瓶颈逐渐显现:其串行处理机制难以高效支撑矩阵运算、张量计算等AI核心任务,导致在单位算力密度与AI性能表现上显著落后于专用计算架构。
艾克称,为弥补CPU在AI场景下的性能短板,NPU应运而生。作为专为AI算法优化的加速器,NPU通过硬件电路固化深度学习模型的关键算子,实现了对特定AI任务的高效执行。其设计优势体现在两方面:其一,算力密度显著提升,单位功耗下的算力输出较CPU提升数个数量级;其二,AI性能评分可达5分(以CPU为基准1分),在推理阶段展现卓越能效。然而,NPU的专用化设计也带来了,灵活性不足、扩展性受限、资源利用率低等局限性。
在此背景下,GPU凭借其通用并行计算能力,成为AI算力架构的重要补充。GPU最初为图形渲染设计,其架构天然适配数据并行任务:数千个计算单元可同步处理海量线程,通过SIMD(单指令多数据)模式高效执行矩阵乘法等AI基础运算。在AI专用性能上,GPU核心优势在于:
高灵活性:支持CUDA、OpenCL等编程框架,可动态适配新算子与模型结构,例如轻松支持Transformer的自注意力机制。
高资源利用率:通过动态调度与算子融合技术,可充分挖掘硬件并行潜力,避免资源浪费。
强扩展性:支持多卡互联与分布式训练,算力可随节点数量线性增长,满足超大规模模型训练需求。
如今,边缘侧的AI技术正在蓬勃发展,为各种应用场景提供了高效且灵活的解决方案。随着边缘侧AI需求的不断增长,越来越多的设备开始集成AI功能。Imagination Technologies最新推出的E-Series GPU IP,凭借其卓越的性能、能效优化以及高度的灵活性,正在为边缘侧计算带来革命性的变革。
来源:芯榜一点号