o3崛起,但推理模型离“撞墙”只剩一年?
o1在AIME测试中的表现与训练计算资源的关系但推理算力一旦摸到天花板,增长速度可能就会从「几个月翻10倍」掉到「每年翻4倍」。如果推理训练和整体前沿算力差距只有几个数量级(如小于三个数量级),估计一年内增速就得放缓。推理真能Scaling吗?现实没那么简单。
o1在AIME测试中的表现与训练计算资源的关系但推理算力一旦摸到天花板,增长速度可能就会从「几个月翻10倍」掉到「每年翻4倍」。如果推理训练和整体前沿算力差距只有几个数量级(如小于三个数量级),估计一年内增速就得放缓。推理真能Scaling吗?现实没那么简单。
日前,国内领先的大模型公司深度求索(DeepSeek)近日宣布,其旗舰模型DeepSeek R1已完成一次重要更新,新版命名为“DeepSeek-R1-0528”。此次升级在多个关键维度上实现了显著优化,尤其是在模型的推理深度、逻辑能力及内容生成质量方面,标志
通过“串行分组 + 衰减奖励”的设计,在保证推理准确性的前提下,让模型学会提前终止思考,推理提速60%,生成更精确有用的答案。
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实
北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座,通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下,模型在特定任务上实
引言:1987年,当王杰在台湾忠孝东路的出租屋里写下《安妮》时,他兜里只剩15块台币。这个被唱片公司嫌弃“嗓子太哑”的穷小子,用一首歌撕裂了华语乐坛的甜美假象——原来最痛的情歌,不是“我爱你你却爱他”,而是“我想你,可你早已不在人间”。
在包括AIME在内的多项AI基准测试中,这款中等参数模型碾压了满血版671B DeepSeek-R1,性能与阿里刚刚发布的Qwen3-235B-A22B持平。
2025年4月29日,Qwen3系列模型开源,Qwen3-235B-A22B模型得分超过DeepSeek R1 671B 模型。但当时模型具体技术细节尚未透露,秘诀不得而知。
这是刚刚抵达戛纳的Bella Hadid,一身纯白,棕色Saint Laurent包袋上还系了一条丝巾,很老钱也很符合戛纳的度假氛围。
DeepSeek - R1 论文曾提到:「我们发现将强化学习应用于这些蒸馏模型可以获得显著的进一步提升」。3 月 20 日,论文《Reinforcement Learning for Reasoning in Small LLMs: What Works an
深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
就在刚刚,DeepSeek-Prover-V2技术报告也来了!34页论文揭秘了模型的训练核心——递归+强化学习,让数学推理大提升。有人盛赞:DeepSeek已找到通往AGI的正确路径!
深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub 等平台上公布了论文信息。
在刘慈欣的短篇科幻小说《乡村教师》中,有这样一个桥段:一位身患绝症的乡村教师,在生命的最后时刻,仍坚持让一群尚未明事的山村孩子死记硬背牛顿力学三大定律。
来自谷歌和伯克利的华人研究员发现,随着采样数量和验证强度的增加,模型的推理性能有显著的提升。
2025 年 4 月 17 日,豆包 1.5・深度思考模型正式亮相,凭借多模态推理、低延迟性能及专业领域卓越表现,一举跻身全球大模型第一梯队。该模型以创新架构与前沿技术为支撑,在企业服务、消费级应用等多场景展现强大竞争力,成为国产大模型发展的重要里程碑。
今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。
这是近期OpenAI频繁调整产品路线图后的最新发布。OpenAI此前曾调整o系列推理模型发布计划,打算不再单独推出o3模型,而是将推出GPT-5,由GPT-5集成o3。不过,4月初,OpenAI CEO山姆·奥尔特曼(Sam Altman)表示计划有变,因为“
o4-mini和o3是两款多模态模型,能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式(思维链中可以思考图像)。