对话 | 谢作如-王龚-章津楠:青少年AI教育的算力难题如何破局

360影视 2024-12-10 10:30 4

摘要:“数据是燃料、模型是引擎、算力是加速器”,这个类比几乎已经成为AI领域的共识。但是在各地的人工智能教育经验介绍中,涉及算力设备建设和管理的寥寥无几。为什么青少年AI教育中很少有人提到“算力”?本期对话邀请了温州科技高中的特级教师谢作如、上海师范大学王龚教授和上

“数据是燃料、模型是引擎、算力是加速器”,这个类比几乎已经成为AI领域的共识。但是在各地的人工智能教育经验介绍中,涉及算力设备建设和管理的寥寥无几。为什么青少年AI教育中很少有人提到“算力”?本期对话邀请了温州科技高中的特级教师谢作如、上海师范大学王龚教授和上海开源信息技术协会的章津楠先生,他们将围绕“算力”这一话题展开讨论。

●青少年AI教育为什么需要“算力”

谢作如:两位嘉宾好,很高兴就“算力”这一话题展开本期的对话。我是一名中小学信息技术教师,这几年的研究重点就是青少年AI教育。在今年9月5日的2024Inclusion·外滩大会上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋针对“未来人工智能、大模型如何才能深入产业”问题,再次强调了“算力、算法、数据”,并表示“讲卡伤感情,没卡没感情”。可见,“算力”一词在AI领域绝对不能忽视,更无法回避。但有趣的是,虽然“算力”一词处处可见,实际上很多人并不理解。那么,AI为什么需要“算力”?二者是什么关系?能不能先请两位科普一下?

章津楠:根据计算机处理能力,算力一般可划分为基础算力、智能算力和超算算力。我们用于办公的基本上属于基础算力,由中央处理器(CPU)组成。今天讨论的算力,显然指的是智能算力。智能算力主要由图形处理器(GPU)、专用集成电路等异构计算芯片组成,常用于处理大规模数据和复杂算法模型,如图像识别、语音识别、自然语言处理等。现在AI的主流技术是神经网络,数据经过每一个神经元节点都要进行浮点运算,对处理器的要求非常高。

近年来,以Open AI为代表的生成式人工智能(GenAI)席卷全球,引发了各大互联网巨头在“算力”领域的竞争。同时,国内“智算中心”的建设正如火如荼地进行,在全球AI竞争日益激烈的当下,算力已经成为AI时代的“战略储备”——宛如当年电气时代的“石油”。据权威报告统计,基础算力、智能算力、超算算力分别呈现稳定增长、迅速增长、持续增长的态势,2016—2024年的年平均增速分别达18.99%、78.97%、23.45%,预计到2026年,我国智能算力规模将达到561EFlops,我国所有数据中心所需年耗电量至少达到6000亿千瓦时,数据中心耗电量占我国用电量比重预计将从2016年的1.86%增长至2026年的6.06%。未来,算力就是推动AI新时代的能源。

王龚:我补充一点。AI的技术路线非常多,其中比较知名的技术方式就是神经网络。神经网络是通过模拟人类的神经元系统对输入的数据进行学习,实现对数据模式的识别与数据结果的预测。在实际运行过程中,输入的数据量甚至会达到万亿字节级别。如此大量的数据,带来的是庞大的运算压力,在AI发展的初期,一次数据学习(模型训练)可能需要几天甚至几个月的时间。今年获得诺贝尔物理学奖的杰弗里·辛顿,在他对AI的研究过程中也长期受到了运算压力的掣肘,直到GPU算力的出现。起初辛顿也不相信GPU能够赋能AI的发展,多次拒绝了学生使用GPU的建议。但在2008年首次使用了GPU后,辛顿改变了他的观点,开始主动使用GPU进行研究,并在2012年引起了AI革命。

谢作如:感谢两位的科普,的确,没有算力的发展就没有AI的发展。虽然在基础教育阶段,AI教育还不是一门独立的课程,但是一些先行一步的地区已经开始做积极的探索,力度较大的地区如深圳、广州、武汉、青岛、温州等。2023年7月,深圳市发布《深圳市推进中小学人工智能教育工作方案》,提出要大力促进AI与教育教学深度融合,着力培育具有AI创新潜质的青少年群体。2024年9月,上海市发布了《上海市推进实施人工智能赋能基础教育高质量发展的行动方案(2024—2026年)》,在四年级和七年级开设AI地方课程。我相信接下来国内各个省份都会有所动作,纷纷出台政策。

但是,我们也要清楚地认识到一点,那就是当前基础教育中AI教育似乎并不“关心”算力。据不完全调查,即使在北上广深之类的一线大城市中,学校中购置算力服务器的也寥寥无几,建设带GPU的机房就更少了。王龚教授对基础教育非常熟悉,曾有过上海教委信息化处的工作经历。请您来分析一下,青少年AI教育不“关心”算力的背后,可能是哪些原因引起的?

王龚:当前青少年AI教育不“关心”算力的现象背后有着诸多原因,我简要总结为“一个认识”与“两个困难”。

AI领域在这几年中蓬勃发展,带动了青少年AI教育从最开始注重编程和过程控制,过渡到符号主义,又进步到深度学习,现在逐渐形成以大模型为核心的教育体系,AI教育的发展相当快速。但是,部分教育工作者对AI教育的认识还停留在原地,如部分教师仍认为AI教育就是编程教育或者是机器人教育。与过去的AI教育相比,当前AI教育更为复杂,如2022年发布的《义务教育信息科技课程标准(2022年版)》就将“算力+数据+算法”称为AI的三大技术基础。但倘若教师对AI的认识不足,那自然会产生对“算力”不关心的现象。

从实际困难来看,基础教育人才与经费的短缺也造成了青少年AI教育主动地不“关心”算力。首先,算力作为新型基础设施,需要管理人员具备一定的专业知识,而基础教育机构内不一定具备相应的人才,这对算力的运维产生了阻碍。其次,算力本身的购置成本比较高,机构的经费或难以负担算力的支出,这对算力的获取产生了阻碍。目前,很多地方的政府在教育投入项目中并没有算力方面的预算。因此,就算部分基础教育工作者认识到了算力对青少年AI教育的重要性,但仍然会迫于现实困难主动地忽略算力。

谢作如:王教授的分析非常到位。在上一次对话(本刊2024年第16期《走向国际共识的中小学AI教育》)中,我强调了AI实验在AI教育中的重要地位。这里的AI实验包括模型训练和推理。我一直认为AI教育需要解决两大问题,一是“AI如何工作”,二是“智能如何产生”。前者关注的是模型推理,后者强调的是模型训练。但遗憾的是,目前包括高校在内,很多AI通识课往往仅满足于理论的讲解,而没有实际操作。很多人甚至以为会写提示词和大模型对话就是AI教育的核心内容。如果不去考虑“智能如何产生”,算力自然就不重要了。相对来说,训练模型对算力的需求比较高。

章津楠先生还有一个身份——知名的私有云企业创始人,并且长期负责智算业务。有很多高校购买过他们的服务。我想请章先生介绍一下,在您的客户中有没有来自基础教育的,也就是说有没有为中小学的客户做过算力业务?从您了解到的信息判断,中小学如果购买并维护一台算力服务器,可能会遇到哪些困难?

章津楠:坦白而言,现在教育领域的算力主要集中应用于顶级学府,基础教育的算力资源相当匮乏,几乎没有像样的GPU资源。几乎没有在中小学中看到有GPU设备,就连教育管理部门也不多见。而且即使有GPU资源,也不是用于AI教育的。

对于一所高校来说,购买GPU服务器仅仅是万里长征的第一步。从GPU服务器到实际应用于AI研究,教师和学校需投入大量精力在AI环境搭建和准备上。因为僧多粥少,各个项目组还需要排队抢占资源。这种场景让人不禁想起当年IBM大型机排队使用的日子。从目前我走访的中小学来看,中小学的AI水平处于“完全无知”的状态,无基础算力资源,无教师来维护,更别提需要在算力的基础上有一套专业的工具支撑AI教学。中小学即使有经费购买了算力服务器,根据目前的师资能力,也无法有效利用GPU算力来开展对应的AI教学。建议先开展师资培训,在让教师对算力、算法和模型有一定的了解之后,再开启AI教育的征途。

●青少年AI教育如何破解算力难题

谢作如:章先生的确是算力行业内的专家,一下子就切中了要点。我在温州中学工作过很多年,去年才转岗到温州科技高中。我分别在2021年和2023年,为这两所学校购买了算力服务器,用的是NVIDIA tesal T4 显卡。我购买算力服务器的理由很简单,因为学校开展人工智能课程,学生一旦掌握了深度学习模型算力的流程,就会有一种“冲动”,希望通过收集数据集训练各种模型,去解决一些生活中的真实问题。如果没有算力服务器,很多模型训练的工作没法正常进行。要注意,这不仅仅是训练速度“慢”的问题,而是很多模型的训练框架就没有考虑非GPU的环境,如AI翻唱方向的VITS模型,计算机视觉中的分割、超分、关键点等模型。

记得有一次和信息科技课标组的一位专家讨论“算力”的问题,他提出可以用租商业算力的方式来解决。的确,为了训练VITS模型,我曾经购买过商业公司的算力,还写了一篇题为《借助商业服务破解AI科创活动的算力难题》的文章,发表在《中国信息技术教育》杂志上。但即使有过这样的经历,我还是坚持认为中小学实施AI教育,需要配备算力服务器。我想考一下章先生,请您猜测一下,可能是什么原因导致我坚持这样的观点?

章津楠:从这段时间接触智算业务的情况来看,首先从预算的角度来看,高校、科研院所对按月付费的方式还是有一定自由度的,有条件按照租赁的方式支出对应的科研经费。而从基础教育来看,则没有类似的经费来支撑算力的租赁服务,也就是没有专项的经费。其次,基础教育的大部分学习任务要在40分钟的课堂上完成,如果算力在云端,大量的训练数据要从本地上传到服务器,这对于基础教育的课堂来说几乎是灾难——一堂课大部分时间都在解决网络的传输问题。最后,从数据安全和可控的角度来看,算力放置到学校内或者教育网内相对来说内容更加可控。

王龚:我补充两点我的想法。第一,云端算力的使用有赖于网络环境的支撑,当前基础教育学校在教育数字化转型过程中面临着“网络限制”,也正是因为此,《教育部等六部门关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》中才将信息网络新型基础设施作为核心任务之一,如果区域的教育部门在该区域内为基础教育学校保障了良好的网络环境,能够保障师生在40分钟课堂教学的过程中高效便捷地获取算力支撑,那么云端算力授课倒不失为一个好选择。

第二,由运营商通过“云、网、边、端”的模式对学校提供算力保障服务。上海在“十四五”期间构建的教育虚拟专网方案就能较好地解决网络算力保障问题,通过专网在部分关键节点部署边缘计算的算力服务器,减少延迟和传输压力。当然,我也认为,有条件的学校还是可以购买本地的算力服务器用以支撑校内的AI教学。通过网络与终端的灵活配置,由专业的人做专业的事情,实现更灵活、稳定的AI教育支持。

谢作如:章先生的分析和我的真实想法基本一致。在大班教学的环境中,稳定的教学环境是基本条件,何况购买了云端算力还需要搭建环境。王教授的补充,实际上已经给出了解决“算力”难题的一种方案。我们可以梳理一下,没有算力,无法深入实施AI教育,除非我们满足于浅尝辄止,但为什么在基础教育中“算力”成为难题?其一,购买算力服务器需要经费,规模小的学校承担不起这笔费用;其二,即使购买了算力服务器,也需要好的管理产品。王教授的方案,实际上是为规模较小的学校提供了算力解决方案。

我是在2019年底开始自学神经网络和深度学习的。至今还清晰地记得,第一次对“算力”产生需求是用循环神经网络(RNN)训练自动作诗机的案例。那时候是2020年初,很感谢浙大的“智海-Mo”平台不仅帮我解决环境搭建的难题,还提供了免费的GPU算力,让我从10小时训练时间降低为1小时。从那之后,我就特别关心AI教育中如何解决算力的问题。

王教授是上海师范大学的分析测试与超算中心主任。顾名思义,“超算中心”显然是管理学校算力设备的。王教授您来介绍一下上海师范大学的算力建设,如何为不同院系提供算力?提供的是哪些AI环境(系统软件)?

王龚:上海师范大学是上海市重点建设高校,是一所以文科见长并具教师教育特色的文、理、工、艺等学科协调发展的综合性大学,学校现拥有90余所附属学校,为上海各类各级教育机构输送了大量教师与管理者,今年正值学校70周年校庆。因为关注到AI对教育未来会产生的深远影响,学校成立了分析测试与超算中心,我也是刚刚调任中心不久。前期,受益于中心的算力支持,学校发布了全国第一个教师教育大模型MetaClass,获得了社会的广泛关注。超算中心拥有独立的机房,提供的AI环境很多,除了常见的Pytorch、Tensorflow、Paddle和MXNet等,还有一些科研领域常用的环境(AI for Science),如AIphafold2。

谢作如:听说王教授正在做一个非常重大的政府项目,这个项目有助于破解上海基础教育的算力难题,能具体介绍一下吗?

王龚:目前我所任职的超算中心正在积极联络和整合社会资源,构建上海教育算力平台以应对上海基础教育面临的“算力从哪里来,算力到哪里去(怎么送到使用者手上去),算力该怎么用”三大难题,也分别对应了硬件设施、传输网络、使用平台三大部分。

算力是应用与学习人工智能的必要基础设施,基础教育的首要难题是如何获取可靠稳定的算力支撑。中心一方面积极联络算力厂商打造教育领域的专用算力基础设施,另一方面积极对接算力云企业以算力共享的方式将现有的算力设施直接引入教育领域,双管齐下稳步打造教育领域算力基础设施,从而规避高昂的投资成本、过长的建设周期等现实问题对当前人工智能教育实施造成的影响。可以预见的是,在教育领域专用算力规模达到一定标准前,采购云端算力、算力共享等方案仍然是当下最主要的解决方案。

在打造教育领域算力基础设施的过程中,中心同步对接了基础电信运营商,筹备建设算力使用者以及实际算力之间的数据传输网络,推进前面提到的教育虚拟专网方案落地。除去部分有条件建设本地算力的教育机构,所有采用算力共享、购买云端算力方案的机构都需要评估自身网络环境是否能够支撑中小学课堂教学的需求,如在实际课堂教学过程中师生能否稳定地获取算力完成任务。教育网络环境的建设需要大量的投资,短时间内恐怕难以满足所有学校的算力访问需求。借助5G等新技术的使用,中心联合基础电信运营商,尝试组建教育领域的5G移动专网,快速部署满足支持算力使用的灵活网络环境。

最后,当算力送到了师生手中时,师生应该如何使用算力?教师在教学过程中又如何对学生的算力使用进行管理?目前,中心接洽了OpenHydra项目组,引入了开源AI教学平台OpenHydra,帮助师生在课堂中使用算力。

章津楠:我很高兴地听到OpenHydra将成为上海师大算力设施中核心环境的好消息。我和谢老师都是OpenHydra项目的发起人之一,见证了其发布和迭代的所有过程。OpenHydra是一个开源项目,旨在为AI教育提供一个开箱即用的学习与实践平台。OpenHydra的使命是“用开源的方式助力AI教育”,愿景是“让每个孩子学习真正的AI,让教师家长了解真正的AI,让每个学校都能开出AI课程”。

谢作如:章先生的介绍让我回忆起当时讨论OpenHydra项目的一些细节。我一开始仅仅希望中小学有一个能切分算力的工具,能把一张卡分给多个学生同时使用。后来终于意识到自己的想法过于简单,对中小学教师来说需要的是一个完整的解决方案,而不是一个小程序,毕竟他们不是专业的服务器维护人员或者开发工程师,最好能做到一键启动,开箱即用。因此,将OpenHydra定位成一个AI教学环境是准确的。实际上OpenHydra不仅仅是为中小学的AI教育设计,同时也适合中高职甚至大学。据我了解,在国内大学中也就浙江大学有“智海平台”、华东师大有“水杉在线”,很多高校的算力服务器并不考虑AI通识课的教学。

作为国内的开源文化爱好者和践行者,我主编了浙江教育出版社出版的高中信息技术国家课程教材《开源硬件项目设计》,和几位教育创客共同发起了开源硬件“掌控板”项目,但我还是很好奇,您为什么会想到将这个项目开源?对于大部分IT企业来说,OpenHydra这个项目几乎是填补空白的一个软件,怎么舍得开源?

章津楠:首先我跟谢老师一样,是一个开源文化爱好者,也是受益者。开源本身也是自己长期投入的一个方向和爱好。其次,开源本身是一种很好的分发和推广的方式,通过开源的方式可以快速推广和普及。在不同领域都有知名的开源项目,如操作系统领域的Linux,手机操作系统领域的Android等,都是借助开源的方式,快速形成以此开源软件为生态圈的周边软硬件发展,从而进一步降低了使用门槛和可获得性。最后,AI的快速发展也是依赖于开源,如开源的算法、开放的模型。算力相关软件也需要保持更加开源、开放的方式,从而让更多的人以更低成本、更好地接触AI、了解AI、创造AI。

●青少年AI教育需要国产算力设备的支持

谢作如:对于大部分人来说,算力是一个全新的名词。以我为例,居然是在2021年才知道“GPU”指的是英伟达的显卡。也就是说,并非所有的显卡都能叫做“GPU”。因此,我在谈起“算力”问题的时候,常常要回答是不是只能买英伟达显卡设备的问题。

我在上海人工智能实验室主持开发XEdu项目的时候,就一直在思考XEdu如何与国产算力设备结合的问题。两位都是算力设备方面的专家,能不能分析一下国产算力如何应用于中小学的AI教育?

章津楠:国产算力目前还处于初级阶段,目前更需要市场去应用和实践,从而打磨好软硬件的生态。目前OpenHydra和XEdu已经着手在适配沐曦、曙光DCU、华为昇腾等厂商。虽然在适配过程中也有不少问题,但可以明显感受到国产算力企业在积极配合,他们也在努力构建自己的开源生态。在当下,通过AI教育来促进国产算力企业的生态建设,应该是一个很好的契机。中小学(包括中高职在内的初学者)的AI教育对算力要求没那么高,一般会选择成熟的模型或者开发框架,因此在投入不大的情况下,也能快速打磨和适配整个国产化软硬件开源生态圈。在此,我也呼吁国产算力的企业能更加关心AI通识教育的算力切分、AI教学场景的开源生态建设,提高AI基础教育中问题的优先级,为中国的AI人才培养提供更好的算力支持土壤。

王龚:沐曦、曙光DCU、华为昇腾等国产算力企业经过这几年的努力发展,产品逐步成熟稳定。不论从产品供给、技术支撑或是成本考量的角度来看,采用国产算力构建我国教育领域专用算力基础设施是非常可取的方向。当前,上海师范大学的超算中心也与国产算力企业开展了密切的合作,企业愿意在建设初期先行进行算力投入,加快教育专用算力基础设施的建设。我们团队也在与国家(上海)互联网交换中心共同推进《教育行业跨主体、多元异构算力交互技术要求》,并在申报国家标准,以期实现异构算力的无缝调用。

谢作如:俗话说,隔行如隔山。一开始我并不了解国产算力设备的使用还存在软件生态的问题。在设计XEdu的时候,我们并没有想到环境搭建是如此复杂。但“无心插柳柳成荫”,居然为国产算力企业的普及应用提供了新的解决方案,这一点很振奋人心。从AI通识教育入手,国产算力企业也许可以走出一条不一样的路来。

感谢王龚教授,也感谢章津楠先生。我们今天的对话焦点虽然围绕着中小学,实际上具有普适价值。从基础教育到职业教育,乃至普通高等教育,相信本期的对话对AI通识教育的实施都会有一定的参考价值。

本文作者:

文章刊登于《中国信息技术教育》2024年第22期

引用请注明参考文献:

谢作如,王龚,章津楠. 青少年AI教育的算力难题如何破局[J].中国信息技术教育,2024(22):4-10.

来源:中国信息技术教育

相关推荐