iclr

14:00直播 | ICLR 2025精选论文分享

作为深度学习领域的国际顶会,ICLR 2025 大会于4月24日-28日在新加坡举办。此前通过两期“科研上新”栏目,我们为大家解读了微软亚洲研究院入选的多篇精选论文,涵盖大模型优化、信息检索、记忆构建、多模态应用、结构化推理和决策制定等方向。

直播 论文 精选 iclr 叶天竺 2025-05-13 14:04  6

ICLR'25 Oral | 大型语言模型微调的学习动态

学习动态(Learning dynamics)描述了特定训练样本的学习过程如何影响模型对其他样本的预测,为我们理解深度学习系统的行为提供了有力工具。我们通过分析不同潜在响应之间影响积累的逐步分解,研究了大型语言模型在不同微调类型中的学习动态。我们的框架能够统一

模型 语言 iclr rl dpo 2025-04-18 22:20  5

全日程揭晓!ICLR 2025论文分享会我们北京见

从 OpenAI o1 到 DeepSeek R1,推理模型进入到了全新的发展阶段,展现出来的「慢思考、强推理」能力正在加速从语言智能到认知智能的进程,并构筑起未来 AGI 的重要基石。同时,学界对大语言模型范式的探索仍在继续,扩散模型不断向主流的自回归架构发

论文 分享 llama iclr 陈键 2025-04-09 12:07  8