摘要:中国电子学会自2015年起开始组织实施中国科协青年人才托举工程项目,项目重点支持30岁上下潜心研究的青年科技人才,采用以奖代补、稳定支持的方式,对每一位扶持培养的青年科技人才稳定支持三年。目前,学会已成功推荐197位青年人才入选中国科协青年人才托举工程项目,本
中国电子学会自2015年起开始组织实施中国科协青年人才托举工程项目,项目重点支持30岁上下潜心研究的青年科技人才,采用以奖代补、稳定支持的方式,对每一位扶持培养的青年科技人才稳定支持三年。目前,学会已成功推荐197位青年人才入选中国科协青年人才托举工程项目,本年度中国电子学会官方公众号将继续开设“青年人才托举项目被托举人风采”栏目,集中展示优秀被托举人风采,敬请关注!
本期优秀被托举人:岳晟
岳晟,中山大学网络空间安全学院副教授,博士生导师,逸仙学者。于2022年在中南大学计算机学院获得工学博士学位,2023–2024年任清华大学博士后研究员。
当前主要研究方向为决策智能与端智能,具体包括强化学习、大模型智能体、分布式机器学习等,已在人工智能与计算机网络领域旗舰期刊(IEEE/ACM ToN、IEEE JSAC、IEEE TPDS等)与会议(ICLR、ICML、IEEE INFOCOM、ACM MobiHoc等)发表论文30余篇,其中一作/通讯CCF-A论文11篇,研究成果入选“2022-2023年中国物联网十大科技进展”,相关成果被纳入专著《Next Generation Multiple Access》作为独立章节。
曾获中国电子学会优博、ACM中国SIGAPP优博、国资计划等荣誉。主持国家自然科学基金1项、中国博士后科学基金2项、清华-美团等校企合作开发项目3项,并以骨干身份参与多项国家重点研发计划与基金委重点项目,相关研究成果已在我国民生、国防等多个领域得到应用。经中国电子学会推荐,入选第十届中国科协青年人才托举工程。
岳晟的学术生涯始于2017年,他于中南大学数学与统计学院本科毕业后,选择在本校计算机系直博,开启计算科学与实际应用结合的探索。博士初期,他聚焦网络优化领域,致力于通过优化方法解决边缘网络系统中的资源优化问题。然而,随着人工智能技术的快速发展,他意识到,必须紧跟当下的研究前沿,做更有影响力的工作。
2020年,他在导师任炬教授的鼓励下申请赴美国亚利桑那州立大学开展为期两年的访学研究,跳出舒适区,将研究方向转向更具挑战性的强化学习领域。这一转型并非坦途,强化学习领域入门相对容易,但想做出有价值的突破对于没有足够积累的学生来说可以说是天方夜谭。经历了近两年的积累和攻坚,2022年他终以第一作者身份在人工智能领域顶级会议ICLR上发表了第一个强化学习方向的研究成果,该工作首次提出了离线保守奖励模型学习的概念,使得有效的奖励模型学习能够以完全离线的方式进行,相比于国际前沿方法(如斯坦福IQ-LEARN、剑桥EDM),将性能提升了5-10倍。这次工作的探索过程让他找到了科研的钥匙,他渐渐体会到科研从0到1探索的乐趣。
博士毕业后,岳晟选择在清华大学计算机系继续从事博士后研究,进一步深入探究深度强化学习领域。他提出了可充分利用低质数据的模仿学习以及从离线到在线的模仿学习方法,使得模仿学习在训练过程中可以最大化利用低质、含噪数据,并解决了其在微调过程中的性能衰退问题,在超20个困难任务上实现超越现有方法2-4倍分数,为大规模模仿学习模型训练创造了途径。在此基础上,他又提出了一系列高效、安全的分布式策略优化方法,在理论上突破了现有方法的样本效率及通信效率的瓶颈,为自动驾驶、金融、医疗等边缘决策智能领域提供了安全有效的策略学习思路。2024年入职中山大学网络空间安全学院后,他计划依托这些年的学术积累,在大模型智能体方向继续深入探索,以期为通用人工智能时代的到来贡献自己的微薄之力。
2024年,岳晟有幸入选了中国科协青年人才托举工程项目。从湘江之畔到清华园,从太平洋彼岸到粤港澳大湾区,岳晟的科研轨迹始终追求与时代脉搏同频共振。面对未来,他充满期待:“在AI重塑世界的今天,中国青年学者既要勇闯‘无人区’,也要甘坐‘冷板凳’。我希望能做扎扎实实、顶天立地的研究,能为祖国AI发展尽一点自己的微薄但有价值的力量。”
来源:中国电子学会