aime资讯_360影视

MiniMax-M1：让AI推理不再昂贵的革命性突破

这项由MiniMax公司研究团队发表于2025年6月的突破性研究，介绍了世界首个开源的大规模混合注意力推理模型MiniMax-M1。这份发表在arXiv平台的论文（编号：arXiv:2506.13585v1），为有兴趣深入了解的读者提供了完整的技术细节和实验数

模型推理词汇 aime ai推理 2025-06-20 21:43 5

OpenAI发布o3-pro，解决复杂问题效果好，但回复“Hi”也需三分钟

OpenAI 正式发布了其最新模型OpenAI o3-pro，这是其旗舰模型 o3 的专业增强版。o3-pro 专为需要“更长时间思考”的复杂任务而设计，其核心亮点在于极致的可靠性和准确性，尤其在数学、科学和编程等专业领域表现卓越。根据OpenAI引入的全新“

模型 openai 评测 diamond aime 2025-06-11 09:07 6

超越80/20法则：少数高熵词决定了大模型推理能力的提升

大模型的推理能力在近年来取得了显著进步，但这些进步背后的机制我们却知之甚少。来自阿里巴巴Qwen团队和清华大学LeapLab的研究人员在2025年6月的最新研究中，通过探索一个全新视角——词元（token）熵模式，揭示了强化学习在提升大模型推理能力过程中的工作

模型推理低熵 aime 熵值 2025-06-05 23:44 4

当你的母语说不出口：解锁AI多语言思维的权衡与挑战

近日，由荷兰格罗宁根大学的Jirui Qi和Arianna Bisazza，哈佛大学的Shan Chen和Zidi Xiong，阿姆斯特丹大学的Raquel Fernández，以及麻省总医院和波士顿儿童医院的Danielle S. Bitterman联合发表

推理语言泰语母语 aime 2025-06-04 16:15 7

DeepSeek-R1-0528：学术写作的新纪元

2025年，人工智能在学术领域的应用迎来了新的突破。DeepSeek发布的最新版本模型——DeepSeek-R1-0528，在数学推理、代码生成等关键领域实现了飞跃式提升。该模型不仅在AIME 2025测试中准确率从70%飙升至87.5%，其推理深度也翻倍增长

aigc 学术写作段落 aime 2025-06-04 11:12 5

o3崛起，但推理模型离“撞墙”只剩一年？

o1在AIME测试中的表现与训练计算资源的关系但推理算力一旦摸到天花板，增长速度可能就会从「几个月翻10倍」掉到「每年翻4倍」。如果推理训练和整体前沿算力差距只有几个数量级（如小于三个数量级），估计一年内增速就得放缓。推理真能Scaling吗？现实没那么简单。

模型推理显卡 o3 aime 2025-05-31 17:42 5

国产模型推理暴涨87.5%，接近国际顶尖，AI解题多写23页草稿…..

日前，国内领先的大模型公司深度求索（DeepSeek）近日宣布，其旗舰模型DeepSeek R1已完成一次重要更新，新版命名为“DeepSeek-R1-0528”。此次升级在多个关键维度上实现了显著优化，尤其是在模型的推理深度、逻辑能力及内容生成质量方面，标志

模型推理赫拉 deepseek aime 2025-05-30 11:29 7

华为攻克AI推理「想太多」问题！推理提速60%，准确率还高了

通过“串行分组 + 衰减奖励”的设计，在保证推理准确性的前提下，让模型学会提前终止思考，推理提速60%，生成更精确有用的答案。

华为推理 cot aime vanilla 2025-05-29 17:11 9

北大杨仝团队发布FairyR1模型：百分之五参数量数学和代码能力超越满血DeepSeek

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特定任务上实

代码模型数学 deepseek aime 2025-05-26 15:20 8

北大杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越满血DeepSeek

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特定任务上实

代码模型数学 deepseek aime 2025-05-25 20:52 8

《安妮》用旋律雕刻墓碑：论王杰音乐中的创伤性悼亡

引言：1987年，当王杰在台湾忠孝东路的出租屋里写下《安妮》时，他兜里只剩15块台币。这个被唱片公司嫌弃“嗓子太哑”的穷小子，用一首歌撕裂了华语乐坛的甜美假象——原来最痛的情歌，不是“我爱你你却爱他”，而是“我想你，可你早已不在人间”。

旋律安妮王杰 aime 陈安妮 2025-05-19 17:50 10

KO 满血版DeepSeek？AM-Thinking-V1，32B干翻一众千亿级大模型

在包括AIME在内的多项AI基准测试中，这款中等参数模型碾压了满血版671B DeepSeek-R1，性能与阿里刚刚发布的Qwen3-235B-A22B持平。

模型开源 ko deepseek aime 2025-05-15 15:56 9

Qwen3模型：思考模式与非思考模式的完美融合

2025年4月29日，Qwen3系列模型开源，Qwen3-235B-A22B模型得分超过DeepSeek R1 671B 模型。但当时模型具体技术细节尚未透露，秘诀不得而知。

模型 moe aime qwen3 qwen3模型 2025-05-15 15:28 8

为什么95后痴迷老钱风？

这是刚刚抵达戛纳的Bella Hadid，一身纯白，棕色Saint Laurent包袋上还系了一条丝巾，很老钱也很符合戛纳的度假氛围。

ralph 雷普利 aime 骆马天才雷普利 2025-05-14 23:39 10

最新研究预警：冷静看待推理模型的进展

DeepSeek - R1 论文曾提到：「我们发现将强化学习应用于这些蒸馏模型可以获得显著的进一步提升」。3 月 20 日，论文《Reinforcement Learning for Reasoning in Small LLMs: What Works an

研究推理 amc rl aime 2025-05-13 07:08 10

AI数学推理新王者！DeepSeek-Prover-V2登场

深度求索（DeepSeek）昨日（4 月 30 日）在 AI 开源社区 Hugging Face 上，发布名为 DeepSeek-Prover-V2-671B 的新模型，随后在 GitHub 等平台上公布了论文信息。

数学推理数据集 lean aime 2025-05-01 20:23 7

深夜突袭，DeepSeek-Prover-V2加冕数学王者！671B数学推理狂飙

就在刚刚，DeepSeek-Prover-V2技术报告也来了！34页论文揭秘了模型的训练核心——递归+强化学习，让数学推理大提升。有人盛赞：DeepSeek已找到通往AGI的正确路径！

数学推理 lean cot aime 2025-05-01 10:35 11

深夜突袭，DeepSeek-Prover-V2加冕数学王者！671B数学推理逆天狂飙

就在刚刚，DeepSeek-Prover-V2技术报告也来了！34页论文揭秘了模型的训练核心——递归+强化学习，让数学推理大提升。有人盛赞：DeepSeek已找到通往AGI的正确路径！

数学推理逆天 cot aime 2025-05-01 09:40 10

DeepSeek-Prover-V2：AI 数学推理新王者，88.9% 通过率设新标杆

深度求索（DeepSeek）昨日（4 月 30 日）在 AI 开源社区 Hugging Face 上，发布名为 DeepSeek-Prover-V2-671B 的新模型，随后在 GitHub 等平台上公布了论文信息。

数学推理数据集 lean aime 2025-05-01 09:14 10

人工智能的自学奇迹：清华大学团队开创“无师自通”的AI学习新方法

在刘慈欣的短篇科幻小说《乡村教师》中，有这样一个桥段：一位身患绝症的乡村教师，在生命的最后时刻，仍坚持让一群尚未明事的山村孩子死记硬背牛顿力学三大定律。

学习方法人工智能清华大学 aime 2025-04-25 20:16 11