MindSpeed Meetup·杭州站圆满落幕，昇腾AI生态共建再加速

摘要：2025年8月31日，MindSpeed Meetup·杭州站在滨江pagoda君亭设计酒店成功举办。本次技术沙龙聚焦大语言、多模态模型训练，和前沿强化学习实践，吸引了来自华为、科大讯飞、上海人工智能实验室、北京大学等多家单位的技术专家与开发者参与，现场与会者

引言：

2025年8月31日，MindSpeed Meetup·杭州站在滨江pagoda君亭设计酒店成功举办。本次技术沙龙聚焦大语言、多模态模型训练，和前沿强化学习实践，吸引了来自华为、科大讯飞、上海人工智能实验室、北京大学等多家单位的技术专家与开发者参与，现场与会者60余人，线上直播更吸引了超1.1万人次观看。围绕MindSpeed和大模型实践展开深度分享与交流。

MindSpeed架构师韩俊作开场致辞，他表示MindSpeed作为昇腾AI的关键组成部分，已在众多伙伴支持下发展成为涵盖LLM、MM、RL、Core四大核心模块的训练加速库，他希望通过本次活动促进业界深入交流与合作，推动MindSpeed创新发展。

MindSpeed架构师韩俊

MindSpeed全流程技术体系优化，

涵盖大语言、多模态预训练，微调，强化学习

本次Meetup中，MindSpeed专家团队系统性地展示了MindSpeed在全流程AI训练的技术布局与突破。华为多模态算法高级工程师朱彦儒介绍了多模态模型套件MindSpeed MM，该套件统一支持业界主流训练后端，在实现高易用性的同时，于昇腾硬件上达到顶尖性能，为大规模多模态模型训练奠定坚实基础。华为AI工程师丁子霖与高级工程师杜扬恺深入分享了基于MindSpeed LLM的DeepSeekV3-671B系统级优化实践，涵盖算子、通信、调度与显存等关键环节，其创新的DualPipeV+Overlap+Swap-Optimizer方案显著提升MoE模型训练效率。华为AI工程师郭鑫杰展示了基于MindSpeed RL强化学习套件复现DeepSeek-R1 671B的全流程，通过全共卡训练、训推切换Resharding和TransferDock数据中枢等核心技术，构建了端到端的高效强化学习训练体系。

华为多模态算法高级工程师朱彦儒、华为AI工程师丁子霖、华为高级工程师杜扬恺、华为AI工程师郭鑫杰

产学研多方协同创新，推动AI技术前沿探索

活动汇聚了来自产业界与学术界的多项创新成果，各方专家分别就大模型训练、多模态架构、视频生成及强化学习工具等前沿方向进行了深度分享。

科大讯飞高级AI算法工程师许瑞阳系统介绍了基于昇腾平台的讯飞星火大模型训练实践。他围绕模型版本迭代效果、昇腾集群训练现状、优化方法体系以及超大规划训练中的典型难题与应对经验展开阐述，体现出产业界在大规模训练工程中的扎实积累。

科大讯飞高级AI算法工程师许瑞阳

上海人工智能实验室多模态算法工程师秦萁展示了全新统一多模态架构Lumina-DiMOO。该模型创新融合自回归与扩散模型优势，既能够执行复杂推理任务，又可实现高质量、高速度的跨模态生成，其推理速度达到传统自回归模型的10倍，在高分辨率生成任务中媲美主流扩散模型。

上海人工智能实验室多模态算法工程师秦萁

北京大学硕士葛云阳则详细分享了基于昇腾训练的Open-Sora Plan v1.5开源视频生成模型。该模型采用高压缩WFVAE编码器和稀疏去噪器SUV结构，以8B参数量、40M数据规模在VBench评测中获得83分的高分，性能达到当前开源视频生成领域的先进水平。

北京大学硕士葛云阳

Verl开源项目的开发者陈海泉介绍了该专为大模型强化训练而设计的学习库。Verl在处理复杂任务时表现出极高的灵活性与可扩展性。其框架集成了多项核心特性，包括混合控制器架构、3D并行策略、解耦推理引擎和训练后端等。目前，MindSpeed训练后端已实现接入，多位开发者正在基于昇腾积极推动更多特性以支持Verl的发展。