摘要:【DeepSeek新模型“火”到海外,#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论
【DeepSeek新模型“火”到海外,#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论还在持续。
热议的焦点在于,当开源模型能力赶上最新的闭源模型,可能改变大模型的竞争格局。
据DeepSeek介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中,得分与o1正式版接近,部分测试中得分还超过o1正式版。该模型在后训练阶段大规模使用了强化学习技术,在只有极少标注数据的情况下提升了模型推理能力。
AI业界人士已经在讨论开源的影响。Meta首席AI科学家Yann Lecun表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。“DeepSeek会从开放研究和开源中获利,可能会类似Meta的PyTorch和Llama。他们提出新想法,并在别人的工作基础上实现。因为他们的工作是公开和开源的,每个人都能从中获利,这就是开放研究和开源的力量。”Yann Lecun表示。#DeepSeek性能或与美国最好模型相当#
来源:新浪财经
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!