罗智泉院士深圳开讲:落地AI大模型太烧钱,应聚焦垂直领域中小模型

摘要:11月26日,中国工程院外籍院士、香港中文大学(深圳)副校长(学术)、深圳市大数据研究院院长罗智泉受邀做客深圳创新发展研究院科技创新院士报告厅,围绕数字化时代的产业变革密码——“AI发展现状及应用前景”做了精彩演讲,并与线上线下近30万听众进行了交流互动。

海报新闻记者 张玉升 通讯员 郑阳 深圳报道

GPT-3训练一次,要消耗多少电量?要花费多少费用?

答案是:1287兆瓦时,450万美元。

11月26日,中国工程院外籍院士、香港中文大学(深圳)副校长(学术)、深圳市大数据研究院院长罗智泉受邀做客深圳创新发展研究院科技创新院士报告厅,围绕数字化时代的产业变革密码——“AI发展现状及应用前景”做了精彩演讲,并与线上线下近30万听众进行了交流互动。

“在人工智能时代,大学的整个版图会重新洗牌,就像计算机、半导体出现以后,斯坦福大学在硅谷崛起,在AI时代会有新的大学重新崛起,抓住这个机遇重新构建学科,重新跟产业界紧密合作,孵化出一些好的技术,这样可以冲到高等教育的前沿……” 演讲中,罗智泉院士从教育领域出发,展现了AI跨领域的应用能力,分析了人工智能的全球发展态势、前沿研究成果及其为产业变革带来的机遇和挑战。

我国大模型整体上呈追随态势

AI发展的每个阶段都代表着AI能力和应用的某种进展。2023年是生成式人工智能的突破之年,以ChatGPT为代表的人工智能大模型,内容生成能力表现惊艳,一时间拉开了国内“百模大战”的序幕。罗院士简要梳理了AI的发展历程,及全球发展态势,并指出我国大语言模型发展迅速,不乏华为—盘古大模型、阿里云—通义千问、腾讯—混元大模型这样的优秀成果,但在技术封锁的大环境下整体上呈追随态势。

落地实现大模型,需要考虑部署成本

罗智泉院士表示,有研究估测,训练1750亿参数大模型GPT-3,能耗相当于开车往返于地球和月球,一次运算就要花费450万美元。罗院士将AI能耗与人脑能耗对比,人脑相当于低功耗灯泡,能耗量平均约25瓦;而GPT-3训练一次消耗约1287兆瓦时,GPT-4能耗预计更高,ChatGPT日均消耗超过50万度电,从而指出大模型的发展模式是不可持续的,落地实现大模型的价值,需要考虑部署成本,垂直领域中小模型是一个新方向。

商业闭环很重要,现在大部分在烧钱

特朗普二次当选美国总统,台积电断供7纳米芯片……一系列国际政策环境的变化对我国科技发展的影响尚待观察。作为科研工作者,罗院士感受到受国际地缘政治的影响,国际合作变得越来越难。但罗院士对中国的科技及产业发展持乐观态度,并以AI技术赋能5G网络性能的亲身体验展现了AI在突破技术封锁、引领产业升级中的巨大作用。

对于AI的未来发展趋势,罗院士表示更重要的是广泛应用前景,商业的闭环很重要,现在因为能耗、能力、人才等方面的问题,AI产业大部分是在烧钱的。

原深圳市委常委、副市长张思平致辞。

中关村产业转型升级研究院院长马国川主持。

本次报告厅活动由原深圳市委常委、副市长张思平致辞,中关村产业转型升级研究院院长马国川主持,来自企业、投资、高校、科研等领域的精英人士参与了现场交流,近30万人通过腾讯网、网易、大众报业集团、深圳创新发展研究院视频号、深圳市企业联合会视频号等直播平台参与了活动。

罗智泉院士(右)在回答听众提问。

本期活动由深圳创新发展研究院、中关村产业转型升级研究院、深圳企联等机构共同主办,是科技创新院士报告厅的第14期开讲,活动还邀请深圳市电子学会共同举办,并由深圳市人工智能产业协会、新联会科技联盟分会、深圳市大数据产业协会、深圳市微波通信技术应用行业协会等机构协办。

本文来自【海报新闻】,仅代表作者观点。全国党媒信息公共平台提供信息发布及传播服务。

来源:人民日报党媒平台

相关推荐