Talk预告｜香港科技大学伍君杰：大语言模型是否足够智能？聚焦流体智能评测

摘要：他与大家分享的主题是:“大语言模型是否足够智能？聚焦流体智能评测”，届时他将介绍两个与大语言模型流体智能评测相关的工作，与大家探讨大语言模型的流体智能水平的真实边界。两篇工作均已被NAACL 2025 录用为Oral。

本期为TechBeat人工智能社区第668期线上Talk。

北京时间3 月13日(周四)20:00，香港科技大学博士生伍君杰的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是: “大语言模型是否足够智能？聚焦流体智能评测”，届时他将介绍两个与大语言模型流体智能评测相关的工作，与大家探讨大语言模型的流体智能水平的真实边界。两篇工作均已被NAACL 2025 录用为Oral。

Talk·信息

▼

主题：大语言模型是否足够智能？聚焦流体智能评测

嘉宾：香港科技大学 · 博士生 - 伍君杰

时间：北京时间 3月13日(周四)20:00

地点：TechBeat人工智能社区

一键预约TALK！

Talk·介绍

▼

智能系统可分为两个层级：晶体智能与流体智能。研究表明，大语言模型在晶体智能维度已展现超越人类的表现。但当面对未知任务时，这些模型能否像人类般运用流体智能实现知识迁移？在本次Talk中，我将介绍两个与大语言模型流体智能评测相关的工作，与大家探讨大语言模型的流体智能水平的真实边界。

Talk大纲

1. 背景：智能系统的分类和对大语言模型进行流体智能评测的重要性。

2. 解决方案1：从现有数据集ARC出发进行评测。

3. 解决方案2：手动构建物理概念理解任务PhysiCo进行评测。

4. 结论和未来展望：总结我们的主要发现和未来的拓展工作。

Talk·预习资料

▼

论文链接：

项目主页：

论文链接：

项目主页：

Talk·提问交流

▼

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

▼

伍君杰

香港科技大学 · 博士生

香港科技大学在读博士生，师从Dit-Yan Yeung教授，本科毕业于中山大学, 现于耶鲁大学自然语言处理实验室（Yale NLP Lab）访问。研究方向包括大语言模型评测，长文本模型训练与评测，检索增强生成及机器翻译。相关工作发表于EMNLP, NAACL、Web Conference等自然语言处理和机器学习的顶级学术会议。

个人主页:

https://www.techbeat.net/grzytrkj?id=43740

-The End-