MiniMax-M1:让AI推理不再昂贵的革命性突破
这项由MiniMax公司研究团队发表于2025年6月的突破性研究,介绍了世界首个开源的大规模混合注意力推理模型MiniMax-M1。这份发表在arXiv平台的论文(编号:arXiv:2506.13585v1),为有兴趣深入了解的读者提供了完整的技术细节和实验数
这项由MiniMax公司研究团队发表于2025年6月的突破性研究,介绍了世界首个开源的大规模混合注意力推理模型MiniMax-M1。这份发表在arXiv平台的论文(编号:arXiv:2506.13585v1),为有兴趣深入了解的读者提供了完整的技术细节和实验数
OpenAI 正式发布了其最新模型OpenAI o3-pro,这是其旗舰模型 o3 的专业增强版。o3-pro 专为需要“更长时间思考”的复杂任务而设计,其核心亮点在于极致的可靠性和准确性,尤其在数学、科学和编程等专业领域表现卓越。根据OpenAI引入的全新“
大模型的推理能力在近年来取得了显著进步,但这些进步背后的机制我们却知之甚少。来自阿里巴巴Qwen团队和清华大学LeapLab的研究人员在2025年6月的最新研究中,通过探索一个全新视角——词元(token)熵模式,揭示了强化学习在提升大模型推理能力过程中的工作
近日,由荷兰格罗宁根大学的Jirui Qi和Arianna Bisazza,哈佛大学的Shan Chen和Zidi Xiong,阿姆斯特丹大学的Raquel Fernández,以及麻省总医院和波士顿儿童医院的Danielle S. Bitterman联合发表
2025年,人工智能在学术领域的应用迎来了新的突破。DeepSeek发布的最新版本模型——DeepSeek-R1-0528,在数学推理、代码生成等关键领域实现了飞跃式提升。该模型不仅在AIME 2025测试中准确率从70%飙升至87.5%,其推理深度也翻倍增长
o1在AIME测试中的表现与训练计算资源的关系但推理算力一旦摸到天花板,增长速度可能就会从「几个月翻10倍」掉到「每年翻4倍」。如果推理训练和整体前沿算力差距只有几个数量级(如小于三个数量级),估计一年内增速就得放缓。推理真能Scaling吗?现实没那么简单。
日前,国内领先的大模型公司深度求索(DeepSeek)近日宣布,其旗舰模型DeepSeek R1已完成一次重要更新,新版命名为“DeepSeek-R1-0528”。此次升级在多个关键维度上实现了显著优化,尤其是在模型的推理深度、逻辑能力及内容生成质量方面,标志
通过“串行分组 + 衰减奖励”的设计,在保证推理准确性的前提下,让模型学会提前终止思考,推理提速60%,生成更精确有用的答案。
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实
引言:1987年,当王杰在台湾忠孝东路的出租屋里写下《安妮》时,他兜里只剩15块台币。这个被唱片公司嫌弃“嗓子太哑”的穷小子,用一首歌撕裂了华语乐坛的甜美假象——原来最痛的情歌,不是“我爱你你却爱他”,而是“我想你,可你早已不在人间”。
在包括AIME在内的多项AI基准测试中,这款中等参数模型碾压了满血版671B DeepSeek-R1,性能与阿里刚刚发布的Qwen3-235B-A22B持平。
2025年4月29日,Qwen3系列模型开源,Qwen3-235B-A22B模型得分超过DeepSeek R1 671B 模型。但当时模型具体技术细节尚未透露,秘诀不得而知。
这是刚刚抵达戛纳的Bella Hadid,一身纯白,棕色Saint Laurent包袋上还系了一条丝巾,很老钱也很符合戛纳的度假氛围。
DeepSeek - R1 论文曾提到:「我们发现将强化学习应用于这些蒸馏模型可以获得显著的进一步提升」。3 月 20 日,论文《Reinforcement Learning for Reasoning in Small LLMs: What Works an
深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。
在刘慈欣的短篇科幻小说《乡村教师》中,有这样一个桥段:一位身患绝症的乡村教师,在生命的最后时刻,仍坚持让一群尚未明事的山村孩子死记硬背牛顿力学三大定律。