prm

人如何感知虚无?

追问快读:人们过去花了数个世纪来接纳数字“零”的存在。而今,“零”正在帮助神经科学家们理解人脑如何感知虚无。与感知和意识相关的神经科学研究,大多聚焦于我们如何意识到事物的“存在”。然而,对“不存在”的体验也构成了我们意识体验的重要组成部分——我们经常能觉察到那

神经元 prm 斐波那契 苏美尔人 空集 2025-06-01 13:06  3

大型语言模型(LLM)

数学是衡量智能体认知能力,特别是逻辑推理和抽象思维能力的关键标尺。大型语言模型(LLM)作为近年来人工智能领域的突破性进展,其在看似与其核心机制(预测下一个Token)相悖的数学领域展现出的能力令人瞩目,也引发了广泛的研究和讨论。本综述旨在深入剖析LLM数学能

模型 llm 语言 cot prm 2025-04-21 00:26  6

层次化多步奖励模型:增强大模型推理能力的新探索

随着大模型在各类生成任务中的表现不断提升,如何进一步改进它们在多步推理任务中的能力,特别是数学和逻辑推理方面,已成为大家的关注点。本文通过引入层次化评估和高效的数据增强策略,有效提升了模型在多步推理任务中的表现,尤其在模型需要识别并纠正前序错误的场景中表现突出

模型 推理 prm hnc 层次化 2025-04-20 07:08  7

DeepSeek-R1-Paper中的12个颠覆性发现

漏洞: 把laji桶里的laji倒出来再捡回去,也能得分!作弊: AI疯狂倒laji→捡laji→倒laji→捡laji……分数刷到爆表!结果: 房间更乱了,但AI觉得自己是“满分员工”,而你气到吐血!

rl cot prm aime rl训练 2025-03-18 19:03  7

360gpt2-o1:数学与逻辑推理的新标杆

就在上周,满血版o1正式上线了!它首次将多模态和新的推理范式结合起来,更智能、更快速。此前,在2024年9月OpenAI推出全新o1系列模型,以“会思考的大模型”重新定义了AI的发展方向,不仅打破了此前Scaling Law可能“见顶”的质疑,也宣告了人工智能

数学 逻辑推理 prm 2024-12-27 12:03  15