YEF2025 | 抽丝剥茧:求索大模型后训练时代的深度推理

360影视 日韩动漫 2025-05-16 09:52 1

摘要:今年,随着DeepSeek为代表的技术突破、管理规则的逐步落地以及行业竞争格局的演变,“百模大战”阶段已告一段落,标志着人工智能正式迈入“大模型后训练时代”。大模型的发展不再单纯追求规模和性能,而是更加注重技术的实用性、可持续性以及与社会需求的深度融合。这一转

今年,随着DeepSeek为代表的技术突破、管理规则的逐步落地以及行业竞争格局的演变,“百模大战”阶段已告一段落,标志着人工智能正式迈入“大模型后训练时代”。大模型的发展不再单纯追求规模和性能,而是更加注重技术的实用性、可持续性以及与社会需求的深度融合。这一转变既带来了前所未有的机遇,也提出了新的挑战。本次技术论坛将围绕后大模型时代高效推理技术创新、大小模型协同知识推理、大模型推理的因果性与泛化性、大模型的工具协同推理能力构建与潜能激发和软硬协同推理的国产算力生态进行深度分享,重点探讨大模型后训练时代深度推理的突破点、深度推理来源于算法本身还是高质量数据标注和深度推理重在深度思考还是内容输出等议题,旨在汇聚学术界和产业界的智慧,共同探讨大模型时代智能技术的发展路径,为推动应用普惠且可持续的人工智能发展指明方向。

论坛安排

顺序主题主讲嘉宾单位主持
YOCSEF介绍&背景介绍1后大模型时代高效推理的技术创新与产业实践赵生捷同济大学陈科海任文琦2大小模型协同知识推理刘新旺国防科技大学3大模型推理的因果性与泛化性张岳西湖大学4大模型的工具协同推理能力构建与潜能激发曾幸山华为诺亚方舟实验室5软硬协同推理——筑基国产算力生态杜夏威中科曙光
6思辨主题1:大模型后训练时代深度推理的突破点是什么?周逊哈尔滨工业大学(深圳)陈科海任文琦思辨主题2:深度推理源自于算法本身还是高质量数据标注?雷文强四川大学思辨主题3:深度推理重在深度思考还是内容输出?王毅深圳大学

执行主席

陈科海

哈尔滨工业大学(深圳)教授

哈尔滨工业大学(深圳)计算机学院教授,博士生导师,国家级青年人才。获2020年中国中文信息学会优博奖和2024年“钱伟长中文信息处理科学技术奖”科技进步一等奖,获2022年北京市科技进步二等奖。致力于大模型与自然语言处理、智能体、多模态、可信推理等跨领域研究,在ACL、EMNLP、AAAI、TASLP等国际会议和期刊发表论文60余篇。曾担任自然语言处理国际会议ACL、EMNLP、NAACL等领域主席、人工智能国际会议AAAI、IJCAI资深程序委员和IJCNLP-AACL-2023研讨会主席。

共同主席

任文琦

中山大学教授

中山大学教授,主持国家自然科学优秀青年基金,从事计算机视觉与多媒体内容安全领域的研究。在CCF-A类期刊和会议长文发表学术论文80余篇,Google学术引用18000余次,近三年连续入选爱思唯尔中国高被引学者,全球前0.05%顶尖科学家榜单。主持国家自然科学优秀青年基金、联合重点项目等企业合作项目20余项。获2019 CCF优博论文奖、2024中国电子学会自然科学一等奖、2023中国图象图形学学会自然科学一等奖。

论坛讲者

赵生捷

中国发明协会会士,国际欧亚科学院院士,同济大学教授

同济大学计算机学院教授,国际欧亚科学院院士、中国发明协会会士,获科学中国人2014年度人物奖。主持国家自然科学基金委重点项目、国家“十二五”重大专项新一代宽带无线移动通信网项目、国家“十三五”重点研发计划物联网与智慧城市关键技术与应用专项项目、国家“十四五”重点研发计划城镇可持续发展关键技术与装备”专项项目等国家级项目。以第一完成人获2020年上海科技进步奖一等奖和2022年度教育部技术发明一等奖。

报告题目:后大模型时代高效推理的技术创新与产业实践

摘要:后大模型时代,高效推理需在延迟、资源消耗与输出质量三维度平衡。当前推理成本高昂、响应时延影响体验,且常生成冗余步骤、陷入虚假或次优推理路径,并在简单/复杂任务上出现资源错配。为此,报告聚焦三大突破点:一是构建精炼且高效的推理训练数据;二是基于Test-time computing、SFT与RL等算法创新,实现合理的计算资源分配;三是从系统架构层面优化算力与吞吐协同。最后,展望高效推理在智慧城市、韧性城市,以及制造工艺等领域的广泛应用。

刘新旺

国防科技大学教授

国防科技大学计算机学院教授、博导,国自然优青、杰青获得者,主要研究方向为机器学习、数据挖掘等。共发表CCF A类期刊/会议论文150余篇, 其中包括16篇IEEE T-PAMI(含3篇独立作者),谷歌学术引用2万余次, 连续3年入选全球2%顶尖科学奖榜单。获2024年吴文俊人工智能自然科学一等奖、2024年北京市科技进步一等奖、2021和2024年湖南省自然科学一等奖等。担任IEEE T-NNLS, IEEE T-CYB等国际顶刊副主编、ICML、NeurIPS等国际会议领域主席。

报告题目:大小模型协同知识推理

摘要:随着大语言模型的兴起,利用大模型的推理能力来分析已有背景信息,进而精准预测新的知识成为近期研究的热点。然而,由于大模型海量的参数,使得其在资源受限的环境下难以使用与推广。为了解决上述问题,围绕大小模型协同策略的知识推理系列算法进行分享,包括自适应思考的轻量化语言模型推理、跳跃思考的高效语言模型推理以及思维链引导的结构化知识推理和大小模型协同的推荐算法。

张岳

西湖大学终身教授、工学院副院长

西湖大学教授,工学院副院长。主要研究领域为自然语言处理、语言模型、可信赖的人工智能等。著有剑桥大学出版社《自然语言处理—机器学习视角》,编写牛津参考文献自然语言处理。担任国内外顶级会议CCL 2020、EMNLP 2022程序委员会主席,以及TACL、TASLP等期刊编委。获ACL 2018 (提名)、COLING 2018、IALP 2017、SemEval 2020、ACL 2023(提名)等国际会议的最佳论文奖。多次入选斯坦福全球2%科学家、爱思唯尔高被引学者等榜单。

报告题目:大模型推理的因果性与泛化性

摘要:大模型推理受到越来越多关注。在本次报告中,我将汇报传统大模型和推理增强模型在一系列逻辑推理任务上的表现,并在此基础之上讨论推理过程的统计性与因果性差别。我将汇报因果性与分布外泛化能力的内在关联,以及一些增强大模型推理过程泛化能力的做法。

曾幸山

华为诺亚方舟实验室研究员

华为诺亚方舟实验室语音语义研究员,于香港中文大学获得博士学位。主要从事大模型对齐、复杂推理、智能体等方向的研究,在AI领域的知名国际会议上发表论文30余篇,荣获ACL 2024杰出论文奖。研究工作被广泛用在公司终端和云服务商业产品中。

报告题目:大模型的工具协同推理能力构建与潜能激发

摘要:在生成式人工智能进入规模化应用阶段的背景下,自主智能体(AI Agent)技术的突破正加速推进大模型应用生态的发展,其中工具调用作为Agent的核心能力之一,在复杂任务场景中仍然面临泛化能力不足、多轮交互端到端执行正确率低等问题。本报告将重点分享大模型的工具调用能力的系统性构建与潜能激发的系列工作,同时探讨当前主流慢思考模型在工具调用场景面临的挑战。

杜夏威

中科曙光总裁助理兼智能计算产品事业部总经理

高级工程师,毕业于中国科学院大学,在高端计算与人工智能领域有丰富经验,先后主导及参与了多个国家级计算中心、先进计算中心、智能计算中心设计、实施、运维工作,并参与多项相关领域国家课题。现主要致力于依托国产加速器构建人工智能计算生态,推动国产芯片与软件技术的持续迭代。

报告题目:软硬协同推理-筑基国产算力生态

摘要:在以大模型为代表的AI技术快速发展的背景下,曙光发布DeepAI深算智能引擎,围绕全栈国产算力及生态,构建面向大模型应用的高效算力支撑,助力行业依托大模型技术实现产业模式升级。

思辨嘉宾

周逊

哈尔滨工业大学(深圳)教授

哈尔滨工业大学(深圳)计算机学院教授、博士生导师,国家级青年人才。原美国爱荷华大学终身副教授,商业分析系博士生项目主任,兼任信息科学系和应用与计算数学系双聘博导。主要研究方向为时空数据挖掘与智能、机器学习、城市计算。发表重要领域会议期刊论文100余篇,并获得ICDM’21最佳论文奖、SDM’19最佳应用数据科学论文奖等5次重要会议最佳论文奖。曾获美国国家科学基金NSF CRII青年科学奖。担任期刊GeoInformatica执行编辑、时空计算领域顶级会议ACM SIGSPATIAL 2024 Vice PC Co-Chair、数据挖掘顶级会议KDD领域主席等学术职务。现为IEEE高级会员,中国计算机学会大数据专委会、智慧交通分会执行委员,ACM SIGSPATIAL中国分会执行委员。

四川大学教授

四川大学教授、博士生导师、四川大学计算机学院(软件学院、智能科学与技术学院)院长助理,国家级青年人才。主要从事自然语言处理,信息检索,大语言模型相关研究。获得国际多媒体最高级会议ACM 2020最佳论文奖。担任自然语言处理各大顶会如ACL、EMNLP、COLING领域主席,担任新加坡全国自然语言处理会议SSNLP2021的程序委员会主席和IEEE 旗下国际会议DSS 2022 的Workshop 主席。担任重要期刊ACM Trans. on Web的客座编委。主持国家自然科学基金面上及以上项目多项,担任多项国家重要项目的评审。积极推进前沿科学研究的实际落地,其研发的技术在政府机构、大型央国企、头部互联网企业等有广泛应用。

王毅

深圳大学教授

深圳大学计算机与软件学院教授、博士生导师。国家优秀青年基金、广东省杰出青年基金、深圳市杰出青年基金获得者。CCF杰出会员,CCF体系结构专委会秘书长(2024-2027)。广东省普及型高性能计算机重点实验室常务副主任。主要研究领域包括计算机存储系统、智能芯片与智能计算系统。

会议介绍

由CCF主办的YEF2025将于2025年5月22-24日在珠海&横琴召开。此次大会由CCF会士、副理事长,华中科技大学教授金海担任大会主席,以“智辟新径”为主题,汇聚了中国计算机领域的青年精英及知名专家,共同探讨科技前沿,开启智慧新篇章。在三天的时间里,预计将组织7场特邀报告、2场大会论坛、1场思想秀、1场优秀大学生学术秀及22场专题论坛。

来源:CCFvoice

相关推荐