DeepSeek新模型“火”到海外,Meta首席AI科学家称开源大模型正超越闭源

360影视 2025-01-26 14:25 2

摘要:【DeepSeek新模型“火”到海外,#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论

【DeepSeek新模型“火”到海外,#Meta首席AI科学家称开源大模型正超越闭源#】#DeepSeek或改变整个AI行业格局# DeepSeek上周发布开源的DeepSeek-R1,并称该模型性能对标OpenAI o1正式版之后,海外AI业界对该模型的讨论还在持续。

热议的焦点在于,当开源模型能力赶上最新的闭源模型,可能改变大模型的竞争格局。

据DeepSeek介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中,得分与o1正式版接近,部分测试中得分还超过o1正式版。该模型在后训练阶段大规模使用了强化学习技术,在只有极少标注数据的情况下提升了模型推理能力。

AI业界人士已经在讨论开源的影响。Meta首席AI科学家Yann Lecun表示,DeepSeek-R1面世与其说意味着中国公司在AI领域正在超越美国公司,不如说意味着开源大模型正在超越闭源。“DeepSeek会从开放研究和开源中获利,可能会类似Meta的PyTorch和Llama。他们提出新想法,并在别人的工作基础上实现。因为他们的工作是公开和开源的,每个人都能从中获利,这就是开放研究和开源的力量。”Yann Lecun表示。#DeepSeek性能或与美国最好模型相当#

来源:新浪财经

相关推荐