深度解析:Arm Lumex CSS平台如何重塑智能终端AI新生态

360影视 动漫周边 2025-09-13 10:23 1

摘要:2025年9月10日,Arm Unlocked技术峰会在上海召开。Arm高级副总裁兼终端事业部总经理Chris Bergey发布了全新的Arm Lumex计算子系统(CSS)平台。

Arm正携手其庞大的生态系统,共同奔赴那个由AI定义的智能终端新时代。

这是Arm在AI时代下的一次关键战略转向。

2025年9月10日,Arm Unlocked技术峰会在上海召开。Arm高级副总裁兼终端事业部总经理Chris Bergey发布了全新的Arm Lumex计算子系统(CSS)平台。

从提供IP核到交付一个完整的、经过优化的“平台”,Arm正试图从根本上改变芯片的设计范式,以应对端侧AI带来的指数级算力需求和开发复杂性。

Lumex平台的发布,尤其是其核心技术SME2的引入,预示着智能终端的AI体验将迎来一次质的飞跃。

在探讨Lumex平台的具体技术之前,理解其背后的战略意图至关重要。

Chris Bergey在主题演讲中明确指出,AI正从六大维度重新定义计算:模型规模的爆发、应用需求的激增、端侧智能体的兴起、设计复杂性与成本的攀升、功耗与散热的瓶颈,以及前所未有的创新速度。

同时,AI 也正持续推动全球产业形态迎来深度的变革:

传统数据中心正向“AI 数据中心”转型,以优化适配基础模型训练与大规模推理;

汽车从“软件定义”迈向“AI 定义”,在感知、自动化与个性化体验方面全面升级;

智能手机与 PC 升级为“AI 伴侣”或“AI 工作站”,融入用户思考、工作与创作;

物联网成为“AI 赋能边缘端”,为传感器、摄像头等设备赋智。

这些场景都对性能、延迟、功耗及灵活性有着极高的要求。

为了助力合作伙伴在快速演进的 AI 计算需求提前做好准备,Arm 持续进化产品体系:从 IP 到计算子系统 (CSS),再到“AI 优先”的计算平台。

这项着眼“平台优先”的产品战略,整合了高性能 CPU/GPU 硬件、KleidiAI 软件工具及集成库,构建起“芯片 - 软件 - 工具”的端到端平台。

凭借卓越的性能、能效和可扩展性,该计算平台能助力合作伙伴实现快速集成,降低研发复杂度与规模化风险,满足 AI 时代的多样化需求。

平台优先的战略优势不仅在于,合作伙伴可以直接采用经过Arm优化的物理实现方案,大幅缩短SoC的设计、验证和流片周期;而且,Arm不再仅仅提供理论性能,而是通过平台级的协同设计,确保合作伙伴能够快速兑现领先的实际性能。

更重要的是,将底层计算平台的整合工作交给Arm,芯片厂商可以将宝贵的研发资源集中在真正能体现其核心竞争力的领域,如ISP影像处理、专用AI加速器或独特的软件生态。

甲子光年认为,Arm的“平台优先”战略,是对近年来“造芯热”趋势的直接回应。

当小米、vivo等终端厂商,乃至汽车和数据中心巨头都纷纷投身自研芯片时,它们的核心诉求并非从零开始设计一个CPU,而是在一个可靠的计算基础上构建自己的差异化优势。

Arm的CSS平台恰好满足了这一需求,它在“赋能生态”和“提升自身价值”之间找到了一个新的平衡点。

这是一种更聪明的商业模式,既降低了伙伴的造芯门槛,也让Arm从IP供应商向平台解决方案提供商转型,从而在产业链中占据了更有利的位置。

本次峰会上,Arm 重磅发布了其面向智能终端 AI 的新 Arm Lumex CSS 平台。

这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能Arm C1 CPU 集群、具备第二代光线追踪 (RTUv2) 技术的GPU,以及系统 IP,不仅能助力生态伙伴更快将 AI 设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

作为 Lumex CSS 平台最亮眼的技术之一,SME2 不仅能显著提升设备的响应速度和运行效率,还能释放出传统 CPU 无法企及的 AI 驱动功能。目前,SME2 已经受到包括阿里巴巴、支付宝、三星 System LSI、腾讯及 vivo 在内的业界领先生态伙伴的广泛采用与认可。

据Arm终端事业部产品管理副总裁James McNiven介绍,SME2相比SME主要有两大优势:一是新增了更多指令集,进一步提升性能和能效;二是支持更小的数据类型,特别是INT4和INT2。

这一点至关重要,因为在移动端,为了降低模型大小和内存占用,低比特量化已成为主流趋势,SME2的硬件支持将极大加速这类模型的推理速度。

SME2的价值在于,它让CPU本身具备了高效处理矩阵运算的能力,这在传统上是NPU(神经网络处理单元)的专属领域。

此外,对于需要快速响应的任务,如实时语音识别、人脸安全验证等,数据无需在CPU和NPU之间来回搬运,直接在CPU核心内完成计算,延迟大幅降低。Arm的数据显示,SME2可将语音类工作负载延迟降低4.7倍。

更重要的是,由于SME2是CPU的内建功能,它可以随着C1系列CPU覆盖从旗舰到主流的各个价位段设备。这意味着,即便是中端手机也能享受到以往只有高端旗舰才有的高效端侧AI能力,极大地推动了AI的普及。

一项技术平台的成功,离不开生态伙伴的早期参与和共同创新。

在本次发布会上,来自vivo和支付宝的分享,为我们揭示了Lumex平台,特别是SME2技术,如何在真实场景中创造价值。

作为业界首家与 Arm 成立联合实验室的终端品牌,vivo 也出席大会分享双方在 AI 赋能的密切合作。

vivo 高级副总裁、首席技术官施玉坚表示:“目前,vivo 计算加速平台 VCAP,已全面支持 SME2 指令集,可对使用视觉、语音、文本 AI 算法进行处理的多项高负载任务,实现显著的性能加速。以典型的端侧任务为例,开启 SME2 硬件,在全局的离线翻译等真实场景中,我们突破过往最优方案上限,实现额外20%的性能收益。”此外,vivo还表示,Arm 最新一代的高性能计算技术以及 SME2 等先进特性,将被引入 vivo 即将发布的全新旗舰产品,推动 AI 移动体验更上一层楼。

底层技术的迭代与更新重在用户体验的提升,支付宝作为一款在中国最频繁使用的超级应用程序,也在会中分享他们探索端侧模型推理性能的成果。

支付宝终端技术负责人翁欣旦表示:“在 Arm、支付宝与 vivo 的三方密切协作下,支付宝已在 vivo 新一代旗舰智能手机上完成了基于 Arm SME2 技术的大语言模型推理验证。结果显示,在预填充 (prefill) 与解码 (decode) 阶段的性能分别超过 40% 和 25% 的提升。这一成果标志着 CPU 后端能力的重大突破,也让我们对迄今为止所取得的成果备受鼓舞。我们相信,随着 xNN 的持续演进,以及与 SME2 的深度融合,支付宝有望在更多场景释放 AI 潜能,构建更智能、更安全、更个性化的服务生态。”

Arm Lumex CSS平台的发布,是Arm从IP供应商向平台解决方案提供商转型的里程碑。

它通过“平台优先”战略降低了AI芯片的设计门槛,而其核心技术SME2则通过赋予CPU强大的原生AI能力,重塑了端侧异构计算的格局。

这不仅将加速AI在从旗舰到主流各层级设备的普及,更将为开发者提供一个更灵活、更高效的创新平台,最终推动一个更智能、更个性化、更注重隐私的端侧AI新生态的到来。

Chris Bergey对未来的展望充满了信心。他认为,尽管手机市场整体出货量趋于平缓,但消费者对旗舰和高端设备的需求与支出仍在增长,这背后是对更强AI能力和更佳体验的渴求。AI对算力、内存和功耗的极致要求,恰恰是驱动技术创新和价值增长的最大动力。

Arm Lumex平台,正是为这样一个“AI无处不在”的未来而打造的起点。它不仅是Arm迄今最先进的终端计算平台,更是Arm试图为未来十年AI计算奠定基石的雄心宣言。

通过提供一个强大、高效且易于开发的计算底座,Arm正携手其庞大的生态系统,共同奔赴那个由AI定义的智能终端新时代。

来源:甲子光年一点号

相关推荐