面向智能加速的异构算力云|CNCC Tutorial

360影视 欧美动漫 2025-09-10 09:24 2

摘要:CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思

CNCC2025 Tutorial是由领域内专家主讲,面向全体参会者开放的专题讲座或教学环节,旨在介绍研究领域的最新进展或基础知识,内容涵盖原理、挑战、方法等。可以帮助刚进入该方向的博士生、青年学者快速补齐知识短板,以便更好地参会后续的前沿报告理解与未来方向思辨。

今年Tutorial共设置9大主题板块:AI基础模型、机器学习理论与机理、强化学习与推理、视觉与多模态、AI安全与治理、面向AI的数据管理和治理、Agent与具身智能、新型计算与网络架构、AI4Science。

Tutorial名称:

面向智能加速的异构算力云

所属主题:

新型计算与网络架构

日程安排:

2025年10月22日下午

举办地点:

哈尔滨市·华旗饭店

注:如有变动,请以官网(https://ccf.org.cn/cncc2025)最终信息为准

1

Tutorial简介

伴随人工智能的热潮,异构算力的重要性愈发显著。作为支撑人工智能及新型计算应用快速发展的基础设施环境,异构算力云平台通过汇聚调度不同类型的计算单元(如CPU、GPU、FPGA、NPU等),以云服务形式向开发者开放这些异构算力,不仅提升了计算效能比和资源利用率,也便于开发者在云上开展新型计算系统及处理器与领域专用加速器的创新探索。

在本次Tutorial中,由科研、教学及产业界专家组成的授课团队将通过理论讲解、动态演示与实践操作等教学方法,体系性地讲授异构算力云平台的发展背景、原理架构、软硬件关键技术、应用场景,并以一套异构算力云平台原型系统“思沃(SERVE)云平台”为例,带领参会者进行实操练习,亲身感受异构算力云在开源处理器敏捷设计仿真加速与AI加速器开发部署等典型场景中的应用效果。

2

Tutorial目标

参会者将能够:

目标1:了解异构算力云平台的背景、架构、关键技术及典型应用场景目标2:掌握异构计算编译基础并厘清深度学习编译的异构适配逻辑目标3:了解RISC-V体系架构并熟悉异构算力云平台上开源处理器敏捷开发方法及工具目标4:了解Transformer模型架构并熟悉异构算力云平台上AI加速器使用方法目标5:掌握基于RISC-V算力的大模型应用系统的全流程开发

1

Tutorial 第一部分:异构算力云平台概述

摘要:当前,AI与新型计算领域面临严峻的“算力墙”挑战:摩尔定律放缓制约单一计算架构性能提升,而大模型训/推等场景亟需异构资源动态组合。传统云平台受限于孤立计算单元供给模式,难以满足需求。为此,异构算力云平台应运而生,其通过深度整合CPU/FPGA/GPU/NPU等算力,以云服务形式向开发者提供易获得且高成本效益的异构算力环境。本报告将以一套自研的异构算力云平台原型系统——思沃(SERVE)为例,介绍异构算力云平台的发展背景、架构原理、关键软硬件技术及其典型应用场景。目前该原型系统已应用于中国科学院大学本科生及研究生课程教学中,为系统架构创新提供了高效实验平台。

2

Tutorial 第二部分:异构计算编译技术基础与智能加速实现

摘要:本报告聚焦异构计算编译核心,解析其如何适配GPU、NPU、FPGA及自定义硬件实现程序加速,厘清传统编译与深度学习编译的异构适配逻辑。首先介绍传统编译的异构能力:通过CUDA、ROCm等既有编译工具链,以指令集定制、硬件逻辑转换完成高级语言到单一异构硬件代码的映射。接着讲解深度学习编译的异构优化:依托传统编译工具,新增模型层级优化(子图划分、算子选择、数据排布)与多层级中间表示(如TVM的Relay IR、MLIR)以统一计算逻辑,并利用TVM等工具为异构硬件设计专属运行时,实现“模型-多硬件”协同。最后简述核心流程:通过计算图优化与中间表示规整逻辑,结合传统编译完成指令转换,借运行时分发任务,为异构算力云协同加速奠定基础。

3

Tutorial 第三部分:异构算力云平台上的开源处理器敏捷开发实践

摘要:以RISC-V为代表的开源处理器已受到广泛关注,异构算力云平台中的FPGA资源为开源芯片敏捷开发提供了有力支撑。然而,云上FPGA的调试与观测能力受限,亟需新的调试手段与工具。在此部分,我们将介绍基于FPGA的开源加速仿真框架REMU。REMU通过硬件检查点与确定性回放技术,实现对目标处理器的全比特精确与周期精确的仿真与观测,从而提供一种高效、低成本的系统级仿真调试工具。结合“香山”高性能开源处理器,引导参会者从系统级视角体验REMU工具,利用定制的FPGA云服务实现“香山”CPU的软硬协同调试。

4

Tutorial 第四部分:异构算力云平台上的AI加速器敏捷开发实践

摘要:GPU凭借其强大的算力,在模型训练领域占据主导地位,然而在模型推理领域,却面临高成本、高能耗和低利用率的挑战。相比之下,FPGA算力在AI推理领域展现出显著优势,但其开发复杂度却成为一大制约因素。在此部分,我们利用异构算力云平台讲授从PyTorch Transformer模型生成FPGA加速器IP的全流程自动化开发体系。该体系相对传统流程自动化程度高、开发迭代快,大幅度降低了使用门槛。通过实际案例,参会者将亲历从模型定义到硬件加速推理的端到端流程,感受异构算力在AI加速器敏捷开发的潜力。

5

Tutorial 第五部分:基于RISC-V算力的大模型应用开发实践及总结

摘要:本部分基于实际业务场景(如政策兑现),融合知识图谱与RAG技术,构建基于RISC-V AI加速卡的智能政务解决方案。采用“知识图谱+RAG”双引擎架构,旨在帮助参会者掌握基于异构算力的大模型应用系统开发全流程,具体内容包括数据源管理、知识图谱构建、服务部署与运维和实际应用。通过本部分的学习与实践,参会者不仅能掌握当前主流AI应用技术,更能获得在国产化AI平台上的实战经验。最后,对本次Tutorial进行总结和展望。

讲者介绍

张科

中国科学院计算技术研究所正高级工程师,中国科学院大学岗位教授

张科,博士,中国科学院计算技术研究所正高级工程师,中国科学院大学岗位教授。中国计算机学会高级会员、计算机工程与工艺专委会常务委员、集成电路设计专委会执行委员。主要研究领域为计算机系统结构,重点关注开源芯片敏捷开发、异构加速计算与FPGA云化服务。主持和参与多项国家自然基金委项目、国家重点研发计划及中国科学院战略性先导科技专项等项目。研制开源处理器芯片敏捷开发云平台“思沃”,利用云计算与异构算力等数字化信息技术探索并实践计算机组成原理的敏捷实验教学模式,在国际计算机科学教育教学领域旗舰会议上发表多篇教研论文。获发明专利授权21项,发表计算机系统方向科研与教学论文20余篇。主讲的国科大本科生《计算机组成原理》2020年入选首批国家级一流本科课程(线下)、北京高等学校优质本科课程,2021年获评北京高等学校优质本科教材课件,2022年入选北京市课程思政示范课程。牵头建设教育部全国性“计算机系统与处理器芯片课程虚拟教研室”,2023年获评“典型虚拟教研室”称号,2025年入选“产教融合科教融汇”教研成果展。带领教学团队获中国科学院大学2025年教育教学成果一等奖。

吴艳霞

哈尔滨工程大学计算机科学与技术学院 国家特色化示范性软件学院 副院长

吴艳霞,哈尔滨工程大学计算机科学与技术学院国家特色化示范性软件学院副院长,黑龙江省计算机学会教育工委副主任委员、嵌入式计算专委副主任委员。在计算机系统结构与编译、物联网与数据处理等领域负责参与“核高基”重大专项、国家重点研发计划等40余项课题,已授权发明专利20余项,发表学术论文100余篇。获黑龙江省教学成果一等奖1项,黑龙江省科技进步奖3项。主持教育部产学合作协同育人项目、省级校级教学改革项目等10余项,出版教材4部。

杨碧波

中国科学院计算技术研究所工程师

杨碧波,中国科学院计算技术研究所工程师,曾任微软亚洲工程院Brainwave NPU团队开发经理。作为拥有20年开发经验的FPGA工程师,在异构计算、网络和存储协议加速领域取得了多项创新成果和发明专利。擅长设计和优化高性能、深度流水线的FPGA并行算法,对软硬件联合开发有丰富的实际经验,并在工作中积极将敏捷方法融入FPGA开发流程中。

陈炜

希姆计算执行副总裁

陈炜,博士,毕业于密歇根理工大学,现任希姆计算执行副总裁,负责RISC-V AI技术标准、国际业务和生态。担任RISC-V国际基金会TSC成员,软件应用与工具委员会副主席,AI/ML SIG副主席,以及上海市电子学会RISC-V专委会主任等职务。曾就职于阿里巴巴达摩院,Arm等公司,负责玄铁CPU技术RISC-V国际标准化,Arm教育生态等业务,并由于推动Google Android加入RISC-V生态系统等贡献荣获RISC-V国际基金会Software Leadership Award,阿里巴巴开源先锋等荣誉。

助教团队

王亚洲,中国科学院计算技术研究所工程师,主要从事计算机体系结构研究和计算机组成原理课程教学等工作,研究兴趣为计算机系统外设及芯片原型验证与加速仿真环境。

张思,中国科学院计算技术研究所工程师,主要从事计算机体系结构研究和计算机组成原理课程教学等工作,研究兴趣为云原生异构计算与协同调度及AI工作负载无服务器化解决方案等。

刘士祺,中国科学院计算技术研究所助理工程师,主要从事计算机体系结构研究、计算机组成原理教学等工作,研究兴趣为可信执行环境及通用处理器芯片设计与验证。

CNCC2025将于10月22-25日在哈尔滨举办。专题论坛将在往年多样化主题的基础上,首次通过“基础-前沿-未来”的一体化设计,满足不同背景参会者的需求,构建从知识获取到创新激发的完整路径,打造系统化、进阶式的参会体验。重点设置9大主题板块,每个主题板块的专题论坛由三大核心模块组成:面向前沿领域的体系性Tutorial、聚焦前沿突破的专题论坛以及探讨未来发展路径的思辨论坛。Tutorial作为这一设计的起点,为参会者构建坚实的共同知识基础,能够深度参与后续的前沿报告理解与未来方向思辨。同时面向青年学者、行业新锐等人群,通过系统性教学,助力赋能青年人才发展。

来源:CCFvoice

相关推荐