反转！Claude 3.5超大杯没有训练失败，最新爆料：内部自留，用于合成数据和RL训练

摘要：明敏发自凹非寺量子位 | 公众号 QbitAI传闻反转了，Claude 3.5 Opus没有训练失败。只是Anthropic训练好了，暗中压住不公开。semianalysis分析师爆料，Claude 3.5超大杯被藏起来，只用于内部数据合成以及强化学习奖励

明敏发自凹非寺量子位 | 公众号 QbitAI传闻反转了，Claude 3.5 Opus没有训练失败。只是Anthropic训练好了，暗中压住不公开。semianalysis分析师爆料，Claude 3.5超大杯被藏起来，只用于内部数据合成以及强化学习奖励建模。Claude 3.5 Sonnet就是如此训练而来。

除此之外，文章还进一步分析了为什么说OpenAI的Orion训练失败也是不准确的。感兴趣的童鞋可以阅读原文~https://semianalysis.com/2024/12/11/scaling-laws-o1-pro-architecture-reasoning-training-infrastructure-orion-and-claude-3-5-opus-failures/— 完 —

来源：狮子游戏团

标签：训练 claude rl

本文地址：https://news.43u.com.cn/a/192771.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!