蚂蚁开源轻量级推理模型Ring-lite,多项Benchmark达到SOTA
在多项推理榜单(AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等)实现了轻量级推理模型的SOTA效果,比肩3倍激活参数大小的10B以下 Dense 模型,再次验证了 MoE 架构的推理潜力。
在多项推理榜单(AIME24/25、LiveCodeBench、CodeForce、GPQA-diamond等)实现了轻量级推理模型的SOTA效果,比肩3倍激活参数大小的10B以下 Dense 模型,再次验证了 MoE 架构的推理潜力。
与大模型“六小龙”中趋于沉寂的其他几家同行相比,MiniMax用连续5天的上新,带来了久违的热闹场面。自6月17日起,MiniMax一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。
本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,展现了强大的推理能力。它能够进行不断反思,并解决更复杂的任务。
对于不少网友和科技博主吐槽 iOS26 界面丑的情况,苹果客服表示,目前的 iOS26 是测试版本,也已接到过用户反馈界面设计丑的情况,但目前正式版本尚未发布,后续如果很多用户反馈这一问题的话,也有可能会改善的,建议等正式版本推送后再关注相关测评。(来源:封面
当地时间周二,法国人工智能初创公司Mistral宣布推出其首个推理模型,声称能够与OpenAI和DeepSeek等竞争对手的产品相抗衡。
最近,来自多家研究机构的林孙、魏红林、金枝吴等研究人员发表了一篇题为《评估即为一切:通过评估设计战略性夸大LLM推理能力》的研究论文,该论文发表于2025年6月5日的arXiv预印本平台(arXiv:2506.04734v1)。这项研究深入探讨了一个令人担忧的
推理模型 基准测试 deepsee deepseek推理模型 2025-06-09 15:43 4
在2022年前后,张翔宇对当时计算机视觉(CV)领域的自监督学习范式产生了深刻的怀疑。他观察到,无论是contrastive learning还是MIM(Masked Image Modeling),虽然在小规模实验中表现优异,却普遍缺乏可扩展的scaling
这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
推理大模型中的注意力机制可以去掉吗?这是当下最具挑战性的开放问题之一。过去半年,伴随长思维链的爆火,模型在复杂推理任务中普遍需要生成成千上万的 tokens 才能产出高质量解答。然而,这也与 Transformer 架构天然矛盾:随着生成长度的增长,Atten
随着人工智能 (AI) 工具撼动了科学工作流程,Sam Rodriques 梦想着进行更系统的转型。他的初创公司 FutureHouse 位于加利福尼亚州旧金山,旨在培养一名“AI 科学家”,能够指挥从假设生成到纸张生产的整个研究管道。
近日,伊利诺伊大学香槟分校和加州大学伯克利分校的研究团队在arXiv预印本平台发表了一篇题为《ALPHAONE: Reasoning Models Thinking Slow and Fast at Test Time》的研究论文。该论文由Junyu Zhan
科技媒体 marktechpost 今天(5 月 27 日)发布博文,报道称微软研究院联合清华大学、北京大学组建团队,推出奖励推理模型(Reward Reasoning Models,RRMs),通过显式推理过程动态分配计算资源,提升复杂任务评估效果。
今年年初,DeepSeek-R1以低成本、高性能以及开源特性在全球AI圈内爆火走红,风头一度压过OpenAI,同时也开启了国产推理模型持续“狂飙”时刻。
5月14日,全球最大的大模型整合应用平台Poe发布数据显示,中国大模型公司深度求索的DeepSeek-R1模型使用率,已由2月的峰值下降了50%,但目前仍处于推理模型分类中的第三位。而快手团队的可灵(Kling系列)大模型,则在视频生成模型分类中迅速登顶,占据
5月14日,全球最大的大模型整合应用平台Poe发布数据显示,中国大模型公司深度求索的DeepSeek-R1模型使用率,已由2月的峰值下降了50%,但目前仍处于推理模型分类中的第三位。而快手团队的可灵(Kling系列)大模型,则在视频生成模型分类中迅速登顶,占据
前些天到处都在流传着 DeepSeek-R2 即将发布的传言,DeepSeek 确实有新动作,不过大家没等来 R2,等来的是 DeepSeek-Prover-V2,它当然也是开源的。
已经流传了一个月的时间;特别是最近一周内,坊间对Qwen 3的猜测不断在“憋个大的”与“最终难产”之间反复横跳。
通用 r2 deepseek 推理模型 deepseekr2 2025-04-30 14:40 9
杭州一家中厂的算法从业者告诉「电厂」:“近几个月网上不少DeepSeek R2的泄露信息,有人说R2要在5月份发。Qwen 3(这个时间发布)肯定是想抢个先机。”
通用 r2 deepseek 推理模型 deepseekr2 2025-04-29 22:05 9
大多数模型目前已经或将很快可通过 AI 开发平台 Hugging Face 和 GitHub 在 “open” 许可 下下载。它们的参数规模从 6 亿到 2350 亿不等。参数大致对应模型解决问题的能力,通常参数越多,模型的表现越好。
离年夜饭仅剩几个小时,国内某家云服务器的工程师突然被拉入工作群,接到紧急任务,要求其快速调优芯片,以适配最新的DeepSeek-R1模型。该工程师告诉我们,“从接入到完成,整个过程不到一周”。