摘要:他与大家分享的主题是:“大语言模型是否足够智能?聚焦流体智能评测”,届时他将介绍两个与大语言模型流体智能评测相关的工作,与大家探讨大语言模型的流体智能水平的真实边界。两篇工作均已被NAACL 2025 录用为Oral。
本期为TechBeat人工智能社区第668期线上Talk。
北京时间3 月13日(周四)20:00,香港科技大学博士生伍君杰的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “大语言模型是否足够智能?聚焦流体智能评测”,届时他将介绍两个与大语言模型流体智能评测相关的工作,与大家探讨大语言模型的流体智能水平的真实边界。两篇工作均已被NAACL 2025 录用为Oral。
Talk·信息
▼
主题:大语言模型是否足够智能?聚焦流体智能评测
嘉宾:香港科技大学 · 博士生 - 伍君杰
时间:北京时间 3月13日(周四)20:00
地点:TechBeat人工智能社区
一键预约TALK!
Talk·介绍
▼
智能系统可分为两个层级:晶体智能与流体智能。研究表明,大语言模型在晶体智能维度已展现超越人类的表现。但当面对未知任务时,这些模型能否像人类般运用流体智能实现知识迁移?在本次Talk中,我将介绍两个与大语言模型流体智能评测相关的工作,与大家探讨大语言模型的流体智能水平的真实边界。
Talk大纲
1. 背景:智能系统的分类和对大语言模型进行流体智能评测的重要性。
2. 解决方案1:从现有数据集ARC出发进行评测。
3. 解决方案2:手动构建物理概念理解任务PhysiCo进行评测。
4. 结论和未来展望:总结我们的主要发现和未来的拓展工作。
Talk·预习资料
▼
论文链接:
项目主页:
论文链接:
项目主页:
Talk·提问交流
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
▼
伍君杰
香港科技大学 · 博士生
香港科技大学在读博士生,师从Dit-Yan Yeung教授,本科毕业于中山大学, 现于耶鲁大学自然语言处理实验室(Yale NLP Lab)访问。研究方向包括大语言模型评测,长文本模型训练与评测, 检索增强生成及机器翻译。相关工作发表于EMNLP, NAACL、Web Conference等自然语言处理和机器学习的顶级学术会议。
个人主页:
https://www.techbeat.net/grzytrkj?id=43740
-The End-
如果你也想成为讲者
▼
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区
来源:老王说科学