DeepSeek新模型“火”到海外，Meta首席AI科学家称开源大模型正超越闭源

摘要：【DeepSeek新模型“火”到海外，#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1，并称该模型性能对标OpenAI o1正式版之后，海外AI业界对该模型的讨论

【DeepSeek新模型“火”到海外，#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1，并称该模型性能对标OpenAI o1正式版之后，海外AI业界对该模型的讨论还在持续。

热议的焦点在于，当开源模型能力赶上最新的闭源模型，可能改变大模型的竞争格局。

据DeepSeek介绍，DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中，得分与o1正式版接近，部分测试中得分还超过o1正式版。该模型在后训练阶段大规模使用了强化学习技术，在只有极少标注数据的情况下提升了模型推理能力。

AI业界人士已经在讨论开源的影响。Meta首席AI科学家Yann Lecun表示，DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司，不如说意味着开源大模型正在超越闭源。“DeepSeek会从开放研究和开源中获利，可能会类似Meta的PyTorch和Llama。他们提出新想法，并在别人的工作基础上实现。因为他们的工作是公开和开源的，每个人都能从中获利，这就是开放研究和开源的力量。”Yann Lecun表示。#DeepSeek性能或与美国最好模型相当#

来源：新浪财经

标签： meta deepseek 闭源

本文地址：https://news.43u.com.cn/a/532541.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!