从智能终端到边缘计算:Arm如何构建AI平台的未来?

摘要:引言作为当前技术变革的核心驱动力,AI正全面改变我们生活的方方面面。无论是从科学研究到日常生活,还是从医疗创新到智能交通,AI的潜力正在不断释放。构建高效、创新的AI计算平台需要在硬件创新、软件优化和生态协同等多个维度进行综合整合,以应对不断增加的算力需求和系

引言作为当前技术变革的核心驱动力,AI正全面改变我们生活的方方面面。无论是从科学研究到日常生活,还是从医疗创新到智能交通,AI的潜力正在不断释放。构建高效、创新的AI计算平台需要在硬件创新、软件优化和生态协同等多个维度进行综合整合,以应对不断增加的算力需求和系统复杂性挑战。 在AI技术蓬勃发展的背景下,Arm正在重新定义计算的未来,为全球数十亿用户带来颠覆性的技术与体验。2024年11月,Arm公司在深圳举办了年度技术大会,吸引了全球科技专家和行业领袖参与。在大会上,Arm终端事业部产品管理副总裁James McNiven围绕“构建人工智能计算平台的未来”发表了主题演讲,深入探讨了AI如何推动计算平台的变革,并在会后接受了与非网的采访,分享了Arm如何通过其创新技术等,打造更高效、更具扩展性的AI计算解决方案。

Arm终端事业部产品管理副总裁James McNiven

AI如何赋能千行百业?

James McNiven表示,到2025年底,预计全球将有超过1000亿台具备AI能力的设备基于Arm架构运行。Arm的成功离不开其明确的使命:打造全球领先的计算平台,以卓越的能源效率和性能推动技术进步。自成立以来,Arm通过与生态系统的紧密合作,持续推动移动设备、数据中心、物联网以及AI领域的发展。尤其在智能手机领域,Arm凭借其高能效架构和强大性能,使计算设备从传统桌面走向移动端,为移动计算奠定了基础,并成为行业标准。AI在汽车行业的应用AI在汽车行业的核心应用体现在自动驾驶和智能交通系统。自动驾驶技术已从概念验证阶段逐步迈向商业化落地。据市场调研机构预测,到2026年,中国的道路上将有超过100万辆搭载L3级别自动驾驶系统(高级驾驶辅助系统,ADAS)的汽车。L3级别自动驾驶依靠AI技术处理复杂的路况数据,包括行人、交通信号和其他车辆的实时信息,从而实现更加安全和高效的自动驾驶决策。通过识别潜在风险、调整车速以及必要时的自动刹车,这种系统显著提升了驾驶的安全性。 与此同时,智能交通系统也是AI应用的重要方向之一。通过对交通流量的实时监测和数据分析,AI优化了交通信号灯的控制,大幅提高了道路的通行效率。此外,车联网技术的兴起使车辆之间能够实现数据共享,从而进一步推动了交通系统的智能化。例如,AI可以动态调整导航路径,为驾驶者提供更高效的出行方案,并有效减少交通拥堵。这种基于AI的综合解决方案,不仅改善了个人出行体验,也为城市交通治理提供了有力支持。AI 在智能终端领域的突破截至2024年底,中国市场将有超过1.7亿台支持AI的智能手机,以及55%的个人电脑具备AI功能。智能手机是AI应用的主要平台之一。从语音助手到影像处理,AI 技术使智能手机变得更加高效和智能。例如,AI算法可以优化照片质量,增强图像识别和语音识别功能,甚至实现实时翻译。随着生成式AI的兴起,智能手机还在逐步成为更强大的生产力工具。用户可以通过手机快速生成文本、图像或其他内容,以满足日益多样化的需求。 AI PC作为PC市场的重大创新,其核心是为用户提供更智能化的功能和更高效的计算能力。通过AI技术赋能,PC已从传统办公工具转型为支持AI推理、自然语言处理和图像优化等先进功能的平台。实时语音翻译、文档生成和推荐算法等新功能正在显著改变用户的日常交互方式。这种智能化的提升,使得AI PC逐渐成为市场新宠,满足了用户对更高性能、更高能效和更个性化设备的需求。企业级AI应用的创新在企业级应用领域,AI技术的引入为生成式AI、大语言模型(LLM)和多模态AI等新兴应用提供了强大的底层支持。Arm与AWS等合作伙伴的协作,使其硬件能够高效支持不同的数据类型和操作模式,推动云计算与边缘计算的协同发展。通过提供更高性能和更强扩展性的计算平台,Arm为产业应对新型数据处理需求奠定了坚实基础。AI 在医疗健康领域的突破医疗健康是 AI技术应用的另一重要领域,它正在从根本上改变疾病诊断和治疗的方式。例如,DeepMind利用AI成功预测蛋白质结构,荣获诺贝尔化学奖。此项突破不仅加速了药物研发进程,还帮助科学家更深入地理解疾病机制,为精准医疗奠定了基础。 在医学影像分析中,AI也展现出卓越的能力。通过训练深度学习模型,AI 可以快速、准确地检测出X光片或MRI图像中的病变区域,为医生提供辅助诊断。这种能力显著提升了早期疾病筛查的效率与准确性,特别是在癌症等重大疾病的诊断中。此外,AI在手术机器人和远程医疗中的应用,也为医疗行业带来了前所未有的效率和精准性。例如,AI驱动的手术机器人能够辅助外科医生完成高难度操作,而远程医疗技术则打破了地域限制,使更多患者能够获得优质医疗服务。AI 在边缘计算与物联网中的应用随着物联网(IoT)的快速发展,AI在边缘计算领域的重要性日益凸显。在边缘设备上进行 AI 推理和决策,不仅能够减少数据传输的延迟,还能保护隐私并降低能耗。例如,AI 驱动的智能安防摄像头可以在本地识别潜在威胁,并作出快速反应,无需依赖云计算。这种本地化处理方式不仅提升了用户体验,还显著降低了系统的运行成本。针对边缘AI应用,Arm提供了覆盖不同性能需求和功耗场景的解决方案,包括Cortex-M、Cortex-A和Ethos NPU。这些产品被广泛应用于物联网、智能家居以及工业自动化场景,为边缘设备提供了高效的AI能力。 在工业物联网中,AI边缘计算设备通过实时监控和预测性维护,减少了生产设备的停机时间,从而提高了生产效率和设备寿命。同时,AI 技术还能够满足从Cortex-M到Cortex-A等多种边缘设备的多样化需求,使其能够适配不同的性能和功耗要求。这种灵活性为AI在物联网领域的广泛应用奠定了坚实的技术基础。AI 对金融行业的影响金融行业是 AI 技术应用的重要领域之一,其变革主要体现在算法交易、智能投顾和风险管理等方面。AI 算法能够实时处理和分析海量的市场数据,为投资者提供更精准的决策支持。例如,在高频交易中,AI可通过快速响应市场变化,提升交易效率和准确性。 在风险管理方面,AI利用机器学习模型分析借贷人的信用数据和行为模式,帮助金融机构精准评估风险,从而降低违约率。同时,AI 在反欺诈领域的异常检测能力,也大幅减少了欺诈行为的发生,进一步增强了金融系统的安全性。AI对教育和生产力工具的推动AI技术正在推动教育领域的个性化变革和资源优化。例如,智能教育系统能够根据学生的学习特点,动态调整教学内容与方式,从而提供更具针对性的学习体验。此外,AI 驱动的在线教育平台和虚拟课堂,也帮助学生更加高效地掌握知识,同时减轻了教师的工作负担。 在生产力工具方面,AI 应用的范围也在不断扩大。智能客服系统通过自然语言处理技术快速响应用户需求,提高了企业服务效率。而自动化办公软件在数据分析、报告生成和项目管理等方面的广泛应用,大幅提升了办公效率。 在生成式AI领域,Arm通过将 KleidiAI 直接集成到主流的框架中,优化大模型性能。例如,通过集成KleidiAI,腾讯的混元大模型的操作效率显著提升,降低了计算资源的消耗并缩短了开发周期。

Arm如何通过芯片技术助力AI创新?随着人工智能(AI)技术从云端向边缘侧的发展,智能手机再次成为其重要载体。Arm的技术创新,例如可伸缩向量扩展(SVE2)和可伸缩矩阵扩展(SME),赋予智能手机实时图像优化、语音识别和生成式AI能力,为用户带来焕然一新的智能体验。通过性能提升与能效优化,Arm进一步推动了智能手机在AI领域的广泛应用。

基于Armv9.2架构的Cortex-X925 CPU在性能与能效方面实现了全新突破。在Geekbench 6.2测试中,该CPU以15%的每时钟周期指令数(IPC)提升,创下了单线程性能新高。作为CPU性能的关键指标,IPC反映了设备处理复杂计算任务的能力。简单而言,IPC的提升意味着智能设备能够更高效地完成任务,从而带来更流畅的用户体验。在AI性能方面,Cortex-X925实现了41%的性能提升,为设备端生成式AI如大语言模型(LLM)的响应能力提供了强大支持。这一创新显著加快了AI应用的响应速度,使用户在使用聊天机器人、图像处理及多模态交互时能获得更直观、更流畅的体验。 “我们推出了Arm终端计算子系统(CSS),为客户提供优化的解决方案、强大的软件生态系统,以及更快的上市时间。” James McNiven对与非网记者表示。Cortex-X925通过升级私有L2缓存至3MB,并优化矢量管线,使其能够更快速预取数据和处理复杂指令。同时,利用三纳米工艺的优势,该CPU在游戏等持续高负载应用中表现尤为出色。在实际使用中,用户不仅能感受到更快的应用启动速度和网页加载速度,还能在游戏中体验更高画质和更流畅的操作。此外,得益于能效优化,智能设备的续航能力进一步提升。 在图形性能方面,与上一代产品相比,全新Immortalis-G925 GPU性能提升37%,AI和机器学习(ML)网络性能提升34%。这一GPU针对旗舰设备市场设计,而包括Mali-G725和Mali-G625 GPU在内的系列产品则面向智能手表、可穿戴设备等广泛的消费电子设备市场。 在硬件设计方面,最新的Armv9架构通过SVE2和SME指令集提升了AI计算性能,同时确保设备在不同场景下的高效运转。与晶圆代工厂的合作使得Arm在先进制造工艺上持续保持领先地位。通过优化设计流程,Arm实现了性能和能效之间的最佳平衡。特别是在边缘AI设备中,其低功耗设计有效支持高效推理,使设备能够以更低的能耗完成复杂计算任务。 除终端CSS外,目前,Arm已推出Neoverse CSS面向数据中心等基础设施应用,并且将于2025年推出汽车 CSS。根据市场预测,到2026年底,中国将有超过100万辆搭载L3级别ADAS功能的汽车投入使用,而CSS技术无疑将为这一目标的实现提供重要保障。

随着人工智能(AI)技术的迅猛发展,计算需求的复杂性和多样性不断提高,传统单片芯片设计模式逐渐显现出其局限性,难以满足现代AI计算平台对高性能、灵活性以及成本效益的多重要求。在这样的背景下,芯粒(Chiplet)技术作为一项突破性创新,正受到业界广泛关注。通过模块化设计理念,芯粒技术为AI计算提供了性能与扩展性的大幅提升,同时优化了硬件开发流程与多样化应用场景的适配能力。 芯粒技术的独特优势芯粒技术是一种模块化的芯片设计模式,将传统单片芯片分解为多个独立的物理单元(芯粒),再利用先进封装技术集成为一个整体。这种模式相比传统设计带来了多重优势:降低开发难度与成本:开发者可根据具体需求,选择不同工艺节点的芯粒组合,从而减少芯片设计和制造的技术门槛和成本。缩短开发周期:模块化设计显著提升了产品迭代速度,使硬件开发者能够更快地响应市场需求。适配多样化工作负载:芯粒技术能够灵活满足AI计算在推理、训练以及数据分析等多场景下的要求,从数据中心到边缘设备均能发挥其价值。 例如,在数据中心,芯粒架构通过优化计算资源分配,提升性能效率和能耗比;在边缘计算领域,芯粒技术支持小型化设计,降低功耗,确保设备在受限环境中高效运行。高性能与灵活性的兼顾芯粒架构的核心价值在于实现性能和灵活性的高度平衡。开发者可以根据AI计算的不同需求,自由组合芯粒以满足特定目标。例如,在处理复杂的AI工作负载时,可将CPU、GPU与专用加速器(如NPU)芯粒组合,实现优化计算性能的同时控制成本。此外,芯粒架构还具备出色的扩展性,允许开发者在无需重新设计整个芯片的前提下,替换或添加特定芯粒,从而快速适应新兴市场需求。 Arm终端事业部产品管理副总裁James McNiven指出:“芯粒是一种非常有前景的技术,可以根据需求灵活组合,就像搭建乐高一样搭建物理芯片的IP模块。” 这一观点形象地阐释了芯粒技术的灵活性和模块化设计理念,同时为AI计算平台的未来发展指明了方向。 作为全球领先的计算平台公司,Arm在芯粒技术领域进行了深远布局,通过与行业领导者的合作,加速了芯粒技术的标准化与生态系统建设。Arm目前联合全球约50家企业共同制定了芯粒系统架构(Chiplet System Architecture, CSA)标准,为芯粒设计和封装提供了统一框架。这种标准化的推动,既降低了开发难度,也促进了行业内的协同创新。 在芯粒技术的发展中,Arm通过与行业领导者的深度合作,推动其在实际应用中的落地。例如:云端AI计算:与AWS合作开发高效的芯粒架构,优化云计算平台的AI性能。高性能模型优化:在与Meta的合作中,Arm结合CSS平台和芯粒架构,对Llama 3模型进行优化,使其运行速度提升2.5倍,首次响应时间显著缩短。 这些合作不仅展示了芯粒技术在高性能计算中的潜力,还为未来AI计算平台的优化积累了宝贵经验。

Arm如何助力AI生态系统成熟?AI技术的快速推进不仅需要技术创新,更依赖产业链的深度协作。除了通过技术助力AI创新,Arm还通过全面的软硬件整合和协作助力AI生态建设。硬件:异构计算与芯粒架构Arm的终端计算子系统(CSS)是其生态创新的核心。CSS通过将CPU、GPU和NPU等计算单元深度整合,优化了多样化AI工作负载的分配,实现了高性能与低功耗的平衡。例如,通过系统级的整体设计和异构计算策略,CSS不仅提升了设备能效,还缩短了产品开发周期,为合作伙伴快速进入市场提供支持。 此外,Arm积极推动芯粒架构CSA的普及。这种模块化设计允许开发者根据需求自由组合硬件模块,降低了芯片开发成本。芯粒架构就像“乐高”一样灵活,使得中小型企业也能快速进入AI市场并推出创新产品。这种技术创新大幅降低了AI硬件开发的门槛,为更多企业参与生态建设创造了条件。软件:KleidiAI的加速作用硬件的进步必须通过软件释放其潜力。为此,Arm推出了KleidiAI软件库,为开发者提供了即插即用的优化工具。KleidiAI通过抽象硬件复杂性,确保主流AI框架(如PyTorch、TensorFlow、MediaPipe)能够在Arm平台上无缝运行。通过深度整合这些框架,KleidiAI帮助开发者快速优化AI应用,从而加速其部署和性能提升。 例如,在与腾讯的合作中,通过集成KleidiAI,混元大模型的预填充速度提升了100%,解码速度提高了10%,显著优化了开发效率和用户体验。同样,与Meta合作优化的Llama 3模型,KleidiAI在不到24小时内完成集成,使模型运行速度提升了2.5倍,首次响应时间大幅减少。通过这些实际案例,KleidiAI展现了其在推动AI技术性能提升和应用落地方面的关键作用。Arm Total Design生态项目:整合产业链资源

Arm Total Design生态项目通过整合硬件制造商、软件开发者、晶圆代工厂和研究机构,构建了一个开放协作的生态网络。该计划通过资源共享和技术协同,帮助合作伙伴高效完成产品设计和优化。例如,在硬件层面,Arm与晶圆代工厂合作推进芯片生产技术,支持最新的3纳米工艺;在软件层面,通过开源工具和技术支持降低开发者的技术门槛。 生态建设推动终端快速发展

当前 AI PC 的快速发展已成为智能终端领域的一大热点,而Windows on Arm平台在AI PC的发展中起到了关键作用。Arm通过与微软等合作伙伴的深度协作,优化了基于Arm架构的Windows 11系统,为开发者提供了高效的硬件架构支持和广泛的原生应用开发能力。这些努力有效解决了生态兼容性问题。例如,爱奇艺、哔哩哔哩和搜狗输入法等大量原生应用已成功在该平台上运行,充分利用了AI PC的算力优势,为用户提供了流畅的体验。据微软统计,Windows 用户平均90%的时间集中在原生应用的使用上,反映了Windows on Arm生态系统的快速成熟。随着更多硬件设备、开发工具和原生应用的推出,AI PC的生态将更加完善,为消费者和开发者带来更大的价值。 James McNiven 表示:“从Arm的角度来看,我们需要思考如何打造一个软件库,通过将其集成到合作伙伴的软件中,让这些应用能够在包括移动终端在内的端侧领域,充分发挥 Arm CPU 的性能优势。”这种战略不仅降低了开发者的技术门槛,也加速了AI在智能终端中的普及。此外,智能家居设备同样受益于AI的进步。AI驱动的控制系统可以根据用户习惯自动调整温度、光线和音响效果,为用户创造更舒适便捷的生活体验。 在推动AI智能手机市场发展方面,Arm通过与终端厂商的合作进一步优化技术应用。例如,Arm与vivo成立联合实验室,通过基于真实使用场景的研究,将硬件性能优化与用户需求紧密结合。vivo在市场洞察和用户体验上的深厚积累,使得这次合作成果显著。正如James McNiven所说:“通过OEM厂商深入理解用户需求,我们能够更好地优化产品,带来更优异的移动体验。”这种合作模式不仅加速了产品创新,还为行业提供了生态协作的范例。 构建全球最大的开发者社区

开发者是AI生态系统的核心资源。Arm通过多年的生态建设,吸引了超过2000万名开发者,形成了全球最大的计算生态社区。通过提供统一的技术栈和友好的开发环境,Arm帮助开发者快速实现创意落地。例如,与龙蜥社区、欧拉社区等开源社区的合作,为AI开发者提供了高效的工具链,显著降低了开发门槛。 这种开放协作模式使得AI应用开发变得更加便捷。例如,在新的硬件架构发布后,开发者无需对代码进行大规模调整,即可通过KleidiAI技术实现性能优化。这种开箱即用的特性不仅提高了开发效率,还帮助开发者快速响应市场需求。 Arm还通过跨行业合作,推动AI技术的多样化应用。例如,与Unity合作开发的端侧AI推理引擎Sentis,不仅降低了模型内存占用,还提升了游戏开发的性能;与OpenCV的合作则显著加速了计算机视觉任务,为图像处理提供了高效支持,具体来说,基于 KleidiCV 集成,OpenCV 发现各种图像处理任务的典型性能提升高达 75%。这些合作案例表明,Arm不仅致力于技术创新,还积极推动生态系统内的资源整合和协作。

总结AI不仅是一项技术变革,更是推动社会转型的重要动力。面对不断增长的AI计算需求,无论是在边缘设备、消费终端还是数据中心,Arm正在通过持续的架构创新和技术优化,为行业提供高效解决方案。 作为全球计算平台的引领者,Arm致力于与开发者、企业及行业伙伴携手推动统一技术栈和开放生态建设,降低AI技术应用门槛,让更多企业与开发者融入AI创新浪潮。通过开放、协作与创新,AI的潜力将被充分释放,为社会创造深远的价值与变革,为构建更加智能、互联、高效的未来世界贡献力量。

来源:与非网

相关推荐