ADL 165《大模型深度推理》开始报名

360影视 国产动漫 2025-09-10 09:19 1

摘要:本期ADL系统介绍大模型推理的前沿进展,聚焦推理机制与策略设计、强化学习驱动的方法及智能体、多智能体优化等关键技术,通过专题讲座解读基本概念、主要挑战与核心方法,并结合专题讲座与案例展示大模型推理的技术路径与应用前景。

本期ADL系统介绍大模型推理的前沿进展,聚焦推理机制与策略设计、强化学习驱动的方法及智能体、多智能体优化等关键技术,通过专题讲座解读基本概念、主要挑战与核心方法,并结合专题讲座与案例展示大模型推理的技术路径与应用前景。

CCF学科前沿讲习班

CCF Advanced Disciplines Lectures

CCFADL第165期

主题 大模型深度推理

2025年10月17日-19日 北京

本期CCF学科前沿讲习班《大模型深度推理》,对大模型推理的前沿进展进行系统性介绍,聚焦推理机制与策略设计、强化学习驱动的方法及智能体、多智能体优化等关键技术,帮助学员理解大模型推理的基本概念、主要挑战和解决方法,并通过专题讲座与案例展示大模型推理的技术路径与应用前景,开阔科研视野,增强实践能力。

本期ADL讲习班邀请到了本领域12位来自于著名高校与企业科研机构的重量级专家学者做主题报告。他们将对大模型推理与强化学习、智能体构建及长思维链扩展等前沿方向进行深入浅出的讲解,为听众展示大模型推理的典型实践案例,并分享解决推理机制设计与应用落地等挑战的宝贵经验。

学术主任:赵鑫/王希廷 中国人民大学

主办单位:中国计算机学会

活动日程:

本期ADL主题《大模型深度推理》,由中国人民大学高瓴人工智能学院教授赵鑫、中国人民大学副教授王希廷担任学术主任,邀请到俞扬(南京大学人工智能学院教授)、桑基韬(北京交通大学教授)、边江(微软亚洲研究院研究合伙人)、崔淦渠(上海人工智能实验室青年科学家)、周浩(清华大学智能产业研究院副研究员)、车万翔(哈尔滨工业大学计算学部长聘教授)、温祖杰(蚂蚁集团资深算法专家)、温睦宁(上海交通大学人工智能学院助理研究员)、林衍凯(中国人民大学高瓴人工智能学院准聘副教授)、温颖(上海交通大学人工智能学院长聘教轨副教授)、王硕(启元实验室助理研究员)、胡文凭(快手Klear文本基座预训练团队负责人)12位专家做专题讲座。

学术主任

赵鑫

中国人民大学

主任简介:赵鑫,中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用3.7万余次,曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书(高等教育出版社出版)。曾荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖,CCF-IEEE CS青年科学家奖。

王希廷

中国人民大学

主任简介:王希廷,中国人民大学高瓴人工智能学院副教授,博士生导师,入选北京市人才计划青年项目。王希廷曾任微软亚洲研究院首席研究员,于清华大学获得学士及博士学位,研究领域为大模型解释与对齐。获CCF自然科学二等奖,2篇论文入选IEEE TVCG(CCF-A)封面论文。研究成果落地支付宝百灵大模型、微软必应搜索、Outlook及MSN,影响上亿用户,年收入增益上亿元。担任AAAI领域主席、Visual Informatics (Q1)青年编委。担任过IEEE VIS(CCF-A)组委会档案主席、IJCAI领域主席。

特邀讲者

俞扬

南京大学

讲者简介:俞扬,南京大学人工智能学院教授。主要从事人工智能、机器学习、强化学习方向的研究,工作获5项国际论文奖、3项国际算法竞赛冠军。入选国家青年人才计划、IEEE Intelligent Systems “AI’s 10 to Watch”,获CCF-IEEE青年科学家奖,首届亚太数据挖掘“青年成就奖”,并受邀在国际人工智能联合大会 IJCAI 2018上作“青年亮点报告”。

报告题目:大模型背景下的强化学习

报告摘要:2024年图灵奖授予研究强化学习的先驱。强化学习已从早期游戏任务扩展到机器人控制等复杂物理环境中的应用。本次ADL将回顾强化学习技术发展历史,介绍在大模型和具身智能受到高度关注的背景下,强化学习技术的发展与变化,包括面向大语言模型的强化学习、借助大模型增强强化学习通用性、面向具身智能的决策等方面的发展趋势。

桑基韬

北京交通大学

讲者简介:北京交通大学教授、交通大数据与人工智能教育部重点实验室副主任。主要研究方向为多媒体内容分析、可信与对齐、推理与AI Agent。曾获得中科院院长特别奖、ACM中国新星奖等,作为负责人承担了相关方向的国家自然科学基金重点项目、(首批)新一代人工智能重大项目、北京市杰出青年基金、国家高层次青年人才计划等,第一/二作者论文7次获得中国计算机学会推荐的国际会议论文奖项,曾获中国电子学会自然科学一等奖和北京市科学技术奖。

报告题目:AI Agent构建方式的发展: 从手工设计到模型原生

报告摘要:首先围绕AI Agent的三个核心能力-任务规划、工具使用和记忆,梳理从依赖提示词和工作流的手工设计,向学习驱动和模型内化实现转变的过程。然后,结合两类典型应用场景, GUI Agent和Deep Research Agent,介绍技术路径和应用发展现状。最后,讨论系统层和模型层之间关系的变化,并展望未来趋势。

边江

微软亚洲研究院

讲者简介:边江博士,现任微软亚洲研究院研究合伙人、微软亚洲研究院机器学习组和产业创新中心负责人,所带领的团队研究领域涉及基于大语言模型的智能体系统、强化学习、具身智能等,以及人工智能在金融、能源、物流、制造、医疗健康、可持续发展等垂直领域的前沿性研究和应用。曾在国际顶级学术会议(ICLR, NeurIPS, ICML, KDD, WWW等)和期刊上(TKDE, TIST, TOIS, TKDD等)发表过上百篇学术论文,并获得数项美国专利。现任NeurIPS、KDD、AAAI等国际顶级学术会议领域主席。过去几年,他的团队成功将基于人工智能的预测和优化技术应用到金融、物流、医疗等领域的重要场景中,并将相关技术和框架发布到开源社区。

报告题目:Building Deep Reasoning Systems: Verifiable CoTs, Knowledge-Augmented Rationale, and Agentic Exploration

报告摘要:本次报告将从三个层面讨论如何构建可衡量的、有据可依的、且工业可用的深度推理系统。这三个层面包括:1)可验证的推理,2)知识与论据增强的生成,以及 3)智能体式探索。这三层共同作用,使深度推理系统能够可靠地推理、运用恰当的知识,并能通过迭代不断优化以解决复杂现实任务。

崔淦渠

上海人工智能实验室

讲者简介:崔淦渠,上海人工智能实验室青年科学家,博士毕业于清华大学计算机系,研究方向为大语言模型的对齐与强化学习技术。在ICML, NeurIPS, ACL, KDD等国际人工智能顶级会议与期刊上发表论文二十余篇,谷歌学术引用超12000次。获WAIC云帆奖明日之星、清华大学优秀博士论文、清华大学优秀毕业生等荣誉。代表作包括偏好对齐数据UltraFeedback, UltraInteract,密集过程奖励算法Implicit PRM, PRIME以及对强化学习熵机制的研究。

报告题目:强化学习驱动的大模型推理:方法与原理

报告摘要:强化学习技术是构建大模型深度推理能力的核心。本报告将从强化学习基础出发,介绍强化学习如何应用于提升大模型推理能力。从基于结果奖励的强化学习开始,本报告将深入探讨大模型强化学习面临的挑战:(1)面对奖励稀疏性,如何将密集奖励应用于大模型强化学习;(2)面对熵坍塌,我们如何使大模型在“探索-利用”之间找到平衡;(3)对于强化学习是否能够提升模型上限的质疑,我们如何实证地证明强化学习能够教会模型新的技能。最后,本报告还将介绍讲者团队在科学推理领域应用强化学习的最新进展和实践经验。

周浩

清华大学智能产业研究院

讲者简介:周浩,清华大学智能产业研究院副研究员,2017年博士毕业于南京大学,曾任字节跳动人工智能实验室研究科学家,副总监。研究方向是面向复杂符号系统的生成式人工智能,主要的应用包括超大规模语言模型及其在科学发现中的应用。曾领导搭建了字节跳动的文本生成中台和AI辅助药物设计两个方向的研发团队。他长期担任ICML、NeurIPS,ICLR等会议的领域主席,在人工智能重要国际会议上发表论文80余篇。曾获2019年度中国人工智能学会优秀博士论文奖,ACL 2021最佳论文奖 (1/3350),2021年计算机学会NLPCC青年新锐学者和2024年北京市科技新星。

报告题目:Inference, Learning, Memory: The Loop of Machine Thinking

报告摘要:本次Tutorial主要想要从超快的推理算法,超长上下文的记忆以及更强大的学习算法来讨论其对机器推理的意义。

车万翔

哈尔滨工业大学

讲者简介:车万翔,哈尔滨工业大学计算学部长聘教授/博士生导师,人工智能研究院副院长,国家级青年人才,斯坦福大学访问学者,中国计算机学会杰出会员。主要研究领域为自然语言处理、大语言模型。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长;国际顶级会议ACL 2025程序委员会共同主席。曾任国际计算语言学学会亚太分会(AACL)执委兼秘书长。承担国家自然科学基金重点项目和专项项目、2030“新一代人工智能”重大项目课题等多项科研项目。著有《自然语言处理:基于预训练模型的方法》一书。曾获AAAI 2013最佳论文提名奖。负责研发的语言技术平台(LTP)已授权给百度、腾讯、华为等公司付费使用。2024年获中国人工智能学会吴文俊人工智能科技进步一等奖(排名第1),2020年获黑龙江省青年科技奖,2016年获黑龙江省科技进步一等奖(排名第2)。入选斯坦福大学和爱思唯尔发布的2024年度“全球前2%顶尖科学家”榜单。

报告题目:迈向推理时代——长思维链机理及应用

报告摘要:推理大模型已成为人工智能新一代技术范式。长思维链(Long Chain-of-Thought, Long CoT)作为推理大模型处理复杂任务时的关键技术,能够显著增强模型的推理深度与广度。通过实现深度的逻辑推理、积极的探索行为和有效的反思机制,长思维链赋予模型解决更加复杂、多样化问题的能力。本报告将深入解析长思维链的基本原理及应用实践。具体内容包括系统地阐述长思维链的核心技术与机制,重点涵盖深度推理的逻辑形式与学习框架、反思能力的反馈与纠错机制、探索能力的扩展机制,以及内部与外部探索框架等关键内容。此外,报告还将详细分析长思维链中产生思维链边界与测试时扩展(Test Time Scaling)现象的根本原因。最后,报告将展望长思维链的未来发展趋势,特别关注多模态长思维链等前沿方向,以期为人工智能领域的研究者与实践者提供一定的参考与启示。

温祖杰

蚂蚁集团

讲者简介:蚂蚁集团资深算法专家,蚂蚁百灵推理模型Ring算法负责人,负责Ring系列模型的训练与开源工作。曾负责百灵千亿MoE模型架构的早期探索,并开源了Ling-Plus等模型。

报告题目:蚂蚁百灵Ring: 探索高效稳定的大规模推理模型强化学习训练

报告摘要:基于强化学习训练大规模推理模型面临非常多的挑战,本次报告重点分享我们在效率和稳定性方面的工作,介绍蚂蚁百灵Ring模型在训练中遇到的挑战和解决方向。

温睦宁

上海交通大学人工智能学院助理研究员

讲者简介:温睦宁,上海交通大学人工智能学院助理研究员。主要研究方向为强化学习、大模型智能体以及多智能体系统等方面。在过往的学术生涯中,致力于开发先进的强化学习算法,以提升语言智能体或多智能体系统在动态环境中的序列决策能力。此外,还深入参与了这些算法在编程、数学以及具身智能等领域的应用研究,在NeurIPS、ICML、ICLR等顶级学术会议上发表论文二十余篇,并自2023年起持续参与相应会议/期刊的审稿工作。

报告题目:大模型时代的多智能体强化学习

报告摘要:传统MARL在解决多智能体间信用分配与高效协同问题上已形成一套成熟的理论与方法,然而,如何将这些经典理论与基于大模型的现代智能体相结合,成为了当前的前沿挑战。本报告将系统性地梳理MARL从经典到大模型时代的技术演进脉络。具体包括:回顾以信用分配为核心的经典MARL框架,解析其如何解决同/异构智能体集群的协同决策难题;随后,报告将重点转向大模型多智能体系统与MARL的融合;并在最后展望这一交叉领域的未来趋势,探讨构建更通用、更强大的多智能体自治系统方面的潜在可能。

林衍凯

中国人民大学

讲者简介:林衍凯,中国人民大学高瓴人工智能学院准聘副教授,主要研究方向为预训练模型和大模型智能体, Google Scholar 统计引用达到 2万余次, 2020-2024年连续五年入选爱思唯尔(Elsevier)中国高被引学者和斯坦福大学全球前2%顶尖科学家年度榜单、AI100青年先锋。其成果获评教育部自然科学一等奖、 2022 年世界互联网大会领先科技成果(全球共15项)。现任CCF NOI科学委员会委员。

报告题目:大模型智能体理论与技术

报告摘要:本课程旨在介绍如何将大语言模型构建为能够自主感知、规划、行动并学习的通用智能体。课程将围绕“感知-规划-行动-记忆”的核心框架,深入剖析关键技术:包括以ReAct框架为代表的任务规划,通过示范学习、教程学习与探索学习实现的工具学习,以及结合短期、长期和反思机制的记忆系统。我们还将探讨Agentic RL等前沿智能体学习范式。最后,介绍通用计算机控制、自动化科学研究等应用案例,展示大模型智能体的广阔前景与未来方向。

温颖

上海交通大学

讲者简介:温颖,上海交通大学人工智能学院长聘教轨副教授,博士生导师。他的研究方向涉及强化学习、多智能体系统及决策大模型。他于2020年和2016年分别获得英国伦敦大学学院计算机系博士学位和研究型硕士学位,入选上海海外高层次人才,作为负责人主持自然科学青年基金,国家重点研发计划课题,上海市科学智能百团百项,上海市青年科技英才扬帆计划。他的五十余篇研究成果发表在ICML, NeurIPS, ICLR, IJCAI, AAMAS等相关领域的一流国际会议上。曾获CoRL 2020最佳系统论文奖,AAMAS 2021 Blue Sky Track最佳论文奖。他连续多年担任ICML, NeurIPS, ICLR, AAMAS, IJCAI, AAAI,等国际知名会议/期刊的AC/SPC/PC。

报告题目:Scaling Foundation Agents: Reinforcement Learning for Capability Expansion

报告摘要:大模型的能力提升依赖于持续获取高质量的数据和反馈信号。虽然预训练阶段已利用大量优质数据,但持续增长的关键在于不断引入新的高质量数据。由于人工数据生产成本高且难以满足需求,探索大模型自我迭代生成和筛选数据的方法变得至关重要。本讲座将探讨大模型基于强化学习的数据再生产过程,其核心挑战在于持续自动化设计并扩展大模型的任务环境、奖励信号,通过应用不同级别的反馈信号进行强化学习,确保只有最有价值的数据用于模型的迭代训练,激发大语言模型的包括认知与元认知能力在内的各项智能能力,以提升大语言模型智能体的泛化能力和决策任务性能。

王硕

启元实验室

讲者简介:王硕,启元实验室助理研究员,清华大学自然语言处理实验室客座研究员,毕业于清华大学计算机系,主要研究方向为大模型长序列高效处理架构与算法。近年来,围绕长序列分治推理、归纳推理、高效推理等方向开展学术研究工作,在ACL、NeurIPS、ICLR等人工智能顶级国际会议发表论文二十余篇,引用量一千四百余次。长期担任ACL、NeurIPS等国际会议审稿人。以课题负责人或子课题负责人身份承担多项国家重大科研项目。曾获国家奖学金、清华大学计算机系优秀毕业生等荣誉,入选腾讯犀牛鸟精英人才培养计划、中国中文信息学会“博士学位论文激励计划”等。

报告题目:从长文本到长思维链:大模型序列扩展的技术演进与应用

报告摘要:上下文长度限制是当前大模型在进行长文档理解、复杂任务推理和长期对话时的关键瓶颈。为了应对这一挑战,本报告将系统性地梳理长序列处理技术的发展脉络。我们将从“性能”与“效率”两个核心维度展开,探讨当前主流的技术方案。在性能层面,我们将讨论以位置编码、数据工程为代表的关键技术如何帮助模型“看”得更远、理解得更准。在效率层面,则会解析包括稀疏注意力、序列压缩等方法如何降低长序列带来的计算与存储开销。最终,我们将探讨这些技术演进如何赋能更复杂的应用,特别是如何将长文本理解能力转化为更深、更长的“思维链”,并展望其在推动模型实现从演绎到归纳式推理、构建长程智能体等前沿方向上的巨大潜力。

胡文凭

快手

讲者简介:胡文凭,2016年博士毕业于中国科学技术大学,现任快手 Klear 文本基座预训练团队负责人,主导 KwaiKlear 基座模型的技术研发。近期带领团队成功开源 Klear-46B-A2.5B 系列基座模型,积极推动大规模语言模型的开放与实际应用落地。此前曾就职于美团与微软亚洲研究院,专注于 OCR 和语音识别等基础算法研究。曾荣获国际语音通信协会(ISCA)2015–2019 年度 Speech Communication 期刊最佳论文奖。

报告题目:Klear-Reasoner:通过梯度保留策略优化提升大模型推理能力

报告摘要:从OpenAI最早将RLHF引入大模型训练,到DeepSeek提出GRPO算法,我们见证了强化学习在推理模型领域展现出的巨大潜力。然而,复现这些领先成果,远不只是“多喂点数据、跑几轮训练”那么简单。现实是,在AIME等高难度数学竞赛题,或LiveCodeBench这类复杂代码评测中,许多中小规模的开源推理模型依然与闭源SOTA存在明显差距。在本次课程中,我将分享我们团队提出的梯度保留型GPPO强化学习算法,以及基于该方法训练的Klear-Reasoner模型。这一模型在数学与代码领域的多个权威基准测试中,达到了同规模模型的SOTA水平。

时间:2025年10月17-19日

地址:北京•中国科学院计算技术研究所

报名须知:

1、报名费:CCF会员2800元,非会员3600元。食宿交通(费用)自理。根据交费先后顺序,会员优先的原则录取,额满为止。本期ADL为线下活动,请到北京现场参会。(如果确有特殊情况,不能到现场参会,可以线上参会,请会前发邮件到adl@ccf.org.cn邮箱说明情况。线上线下报名注册费用相同。线上会议室号将在会前1天通过邮件发送。)

2、报名截止日期:2025年10月15日。报名请预留不会拦截外部邮件的邮箱。会前1天将通过邮件发送会议注意事项和微信群二维码。如果届时未收到邮件,请务必咨询邮箱adl@ccf.org.cn。

3、咨询邮箱 : adl@ccf.org.cn

缴费方式:

在报名系统中在线缴费或者通过银行转账:

银行转账(支持网银、支付宝):

开户行:招商银行股份有限公司北京海淀科技金融支行

户名:中国计算机学会

报名缴费后,报名系统中显示缴费完成,即为报名成功,不再另行通知。

报名方式:

请选择以下两种方式之一报名:

2、复制以下链接到浏览器报名:

来源:CCFvoice

相关推荐