摘要:2020年3月,华为宣布将刚诞生不久的全场景AI框架昇思MindSpore开源。就在同一年,曾子瑄考入重庆大学计算机学院,攻读计算机科学与技术专业。这两件看似没有交集的事情,日后却在昇思开源社区中擦出了亮丽的火花,成就了一段佳话。
【文/观察者网 吕栋】
2020年3月,华为宣布将刚诞生不久的全场景AI框架昇思MindSpore开源。就在同一年,曾子瑄考入重庆大学计算机学院,攻读计算机科学与技术专业。这两件看似没有交集的事情,日后却在昇思开源社区中擦出了亮丽的火花,成就了一段佳话。
在人工智能发展的洪流中,AI框架一直起着不可或缺的作用,它向下消弥了多样性算力的复杂性,向上为开发者提供了丰富的接口、套件和工具,让开发者可以聚焦在算法和数学本身,大幅降低了开发门槛,加速了人工智能和科学计算的演进。
4年多来,尽管PyTorch和TensorFlow等国外框架拥有先发优势,但以昇思MindSpore为代表的中国自主AI框架也持续突破,已经迎头赶上。根据中国科学院科技战略咨询研究院预测,中国AI框架2024年新增市场中,昇思MindSpore份额将达30%,标志着昇思已跻身全球主流框架第一梯队,成为行业新选择。
作为框架新势力,昇思MindSpore能在国外巨头深厚的护城河中快速崛起,离不开开源社区中众多开发者的同心聚力,曾子瑄就是其中的优秀代表。从技术小白到成长为昇思杰出开发者,曾子瑄再度验证了从学习昇思、实践昇思再到贡献昇思的高效成长路径。
像曾子瑄一样的年轻开发者还有很多。仅用4年,昇思开源社区就汇聚了超过3.7万名开发者,他们看重的不仅是高效、易用和全场景的技术能力,更重要的是,在充满挑战和机遇的AI时代,昇思社区的目标一直是与开发者共成长,携手托起中国AI发展的未来。
初识昇思,开启AI技术新征程
曾子瑄目前在中国科学院软件研究所就读硕士一年级,4年前他才刚刚步入大学校园。
回想起当初与昇思MindSpore的邂逅,曾子瑄似乎还历历在目:“我接触MindSpore最早是在2021年读大一的时候,重庆大学举办了DevRun智能基座鲲鹏昇腾高校行,当时我第一次对以鲲鹏昇腾为代表的中国技术生态有所了解,也第一次了解到MindSpore框架,但当时人工智能专业知识和技能比较匮乏,所以对MindSpore的印象也仅限于听说过。”
在那个时候,大模型行业正在为今天的爆发积蓄力量,基于昇思MindSpore开发的盘古大模型和中科院自动化所的“紫东太初”大模型已相继亮相。但在当时,中国AI产业界最缺乏的并不是以昇腾软硬件代表的算力基础设施,而是以开发者为基础的人才生态。
为了加速中国AI人才培养,华为当时做了相当多的规划和行动,例如出版相关教材、在高效开设相关课程,并联合教育部建设“智能基座”产教融合协同育人基地。2020年10月,重庆大学和华为签订了《“智能基座”产教融合协同育人基地合作协议》,双方宣布在鲲鹏、昇腾、华为云等技术领域开展联合课程开发与教学、课外实践活动、实习就业等合作。
这为曾子瑄和昇思MindSpore的再次相遇创造了契机。
“大二、大三时在学校的一些课程中,如机器学习基础、深度学习与大数据技术、自然语言处理等智能基座合作课程上,再次与MindSpore相遇,并在课程作业、课程实验中,参考昇思社区提供的技术文档使用MindSpore进行了初步实践,发现MindSpore上手很容易,功能强大,能方便地进行AI应用开发。比如在框架的易用性上,MindSpore与主流框架的编程习惯类似,开发体验、写作方式也基本一致。如果开发者想自己做一些事情,还可以自定义API接口,MindSpore也会提供底层技术工具等支持。”他说道。
在学习昇思MindSpore相关课程的同时,曾子瑄还参加了学校智能基座社团的活动,进一步激发了对开源社区的兴趣。在加入社团后,他多次组织与MindSpore相关的活动,发现昇思开源社区十分活跃,有许多门槛不同的开源活动可以参与,比如MSG(MindSpore Study Group)、开源实习、众智、开源之夏、社区比赛等等,这些活动既可以提升个人专业能力、积累项目开发经验,还能获得一定报酬,“就跟玩游戏一样,开始前有教程、做任务有导师带、完成后有相应奖励”。
这些经历,为曾子瑄后续融入社区、贡献社区、在社区中成长打下了坚实基础。
融入昇思,从学习实践到成长贡献
在曾子瑄融入昇思开源社区的过程中,学长的带领起着关键作用。当时,正是学长介绍的华为昇腾众智计划经验,让曾子瑄第一次了解到了MindSpore。后来,学长毕业后去了华为2012实验室,在MindSpore部门负责相关工作,并且成为MindSpore的一名布道师。
时间来到2023年,学长负责的MindSpore NLP套件正处在项目初期的高速开发演进过程中,需要大量社区开发者投入其中。曾子瑄忙于学校大创项目结题和准备推免材料没有参加,但他在校内组织的MindSpore开源实习宣传吸引大量开发者加入。
随着研究生推免的结束,曾子瑄可支配的灵活时间明显比以前更多了,这时候恰好学长正在推广昇思开源社区中“关于在MindSpore NLP套件中迁移模型、单卡微调模型和多卡微调模型”的任务,并且完成任务还能获得报酬和奖励,于是曾子瑄很快便接下了这个任务。
在这个过程中,曾子瑄作为MindSpore NLP SIG的核心成员,先后完成四个大模型的迁移工作,包括一个Falcon大模型微调案例开发。在富有挑战性的算子开发领域,他申请了开源实习,完成了GPU后端的Flash Attention算子在MindSpore NLP的接入与调优,实现了两倍以上的推理速度提升。在当时,MindSpore NLP套件几乎不支持任何量化方法,而在比开源实习更高阶的开源之夏项目中,曾子瑄完成了基于MindSpore的BitsAndBytes量化库实现,降低了模型推理对显存的需求,提升了计算性能,增强了模型部署在端侧的可行性。
这其中既有他自身的努力,也离不开昇思开源社区的助力。
“在开发中,MindSpore提供的函数式和对象式融合编程范式,使构建神经网络和训练流程变得简单,提供的API映射文档也比较全面,大大降低了模型迁移的工作量。在自定义算子方面,MindSpore提供了Custom接口用于接入不同后端的算子,Custom接口会找到动态链接库中相应的函数,只要按照接口规范定义算子,就能够实现高效的运行时算子加载与运算。”曾子瑄对开发过程中MindSpore的技术优势印象颇深。
昇思将围绕开发者真实诉求,持续升级框架架构,使能AI模型未来创新
除了框架本身的技术特性外,加入开源社区还有一个明显的好处,就是当遇到难题时,有诸多技术大牛可以一起讨论解决问题,曾子瑄对此也深有体会。
“在开源之夏的项目开发过程中,因为需要迁移的BitsAndBytes库本身软件耦合程度高,关于算子接入的问题刚开始一直没找到合适的解决方案,后来摸清楚了项目本身的构建和执行逻辑,再跟MindSpore布道师和负责MindSpore自定义算子接口的工程师一起讨论,得出了基本解决方案,随后顺利地完成了程序中由上至下一条核心执行线路的移植,奠定了项目完成的基础。”他说道。
不难发现,正是在社区提供的诸多昇思MindSpore技术公开课、开源实习和活动比赛中,以曾子瑄为代表的年轻开发者获得了学习、实践和以练促学的机会,逐步成为AI领域中的新星。截至目前,昇思开源社区已提供30多个系列的AI主题课程,开展过600多场线上和线下的专题学习活动,并且已发布1100+开源实习任务,以及300+模型和算子任务,还举办过30多场大赛。
与昇思共成长,携手托起中国AI的未来
回想起在昇思开源社区中成长的点点滴滴,曾子瑄坦言自己收获颇多。
“我把开源实习的工作融合进了本科毕业设计里面,综合成了一个模型迁移,模型应用,再到优化的过程,毕业设计成绩优秀,在开源之夏完成的量化库迁移的工作也与我现在的研究方向有关,总体上说开源社区的经验与我日常的学习工作是相互促进的关系,我能从实践中锻炼工程能力,捕捉到产业需求风向,从而影响到我对研究方向的把握,我在昇思社区的开源活动中学习到的技能,对于以后工作或者科研来说也是十分有帮助的。”他说道。
从什么都不懂的技术小白,到成为MindSpore的杰出开发者,曾子瑄不仅提升了个人能力,开拓了视野,获得了稀缺资源、机会和荣誉,也验证了昇思开源社区高效的人才培养路径。
未来无论曾子瑄继续攻读博士,还是到企业界和科研院所,昇思开源社区依然会继续支持他的创新,比如借助专项学术论文基金、社区项目支持等方式,为开发者提供创新资源和成果激励,包括CAAI-昇思学术基金、鲲鹏昇腾科研创新使能计划等等;社区中的技术委员会和各种兴趣小组,也会支持开发者解决各种各样的难题,并且基于昇思原生发表的论文和原生模型也都会获得算力等方面的激励,鼓励技术创新持续落地;对于成长起来的开发者,社区还通过开发者/布道师认证、邀请加入SIG组和技术委员会等方式,帮助开发者提升影响力。
昇思赋能开发者,激发学术创新,共建开源框架繁荣生态
反过来我们可以再从另一方面看,正是像曾子瑄这样的开发者迅速成长、不断贡献,昇思开源社区才愈发活跃,昇思开源框架的能力才愈发强大,二者是一个共同成长的过程。最近一年多来,昇思MindSpore在技术上持续突破,随着2.0、2.3和2.4等版本相继发布,MindSpore已跃升成为服务中国AI大模型开发最灵活、训练最好用、推理最高效的框架。
2020年刚开源时,昇思的下载量还只有10万次,2021年超过100万次,到了大模型逐步落地的2024年,下载量快速增长到1100万次,呈现出一条陡峭的指数级增长曲线。
开源四年,昇思从打通科研创新,到使能使能百模千态、千行万业,开创了AI产业聚集的新模式。截至目前,昇思已孵化、支持50多个国内外主流大模型,成为使能大模型的最佳框架选择。在AI for Science领域,昇思也硕果累累,连续获得了WAIC的最高奖SAIL奖。
在人工智能赋能产业发展的关键时刻,昇思MindSpore开源社区打通了与开发者共同成长、相互成就的正向循环。我们不难想象,在以科技创新引领新质生产力发展的指引下,AI框架在人工智能产业中的作用会愈发凸显,而当越来越多像曾子瑄一样的优秀开发者汇聚在昇思开源社区中时,他们凝心聚力,必将实现开源与创新的持续反哺,托起中国AI的未来。
来源:观察者网