紫牛热点|DeepSeek深夜悄悄放大招，“小幅”改进版能力大提升

摘要：DeepSeek在北京时间24日深夜悄悄放了个大招，没有像美国的OpenAI等技术公司那样事先炒作，就默默推出一个新版本DeepSeek-V3-0324。从命名方式看是V3的小幅改进版，然而能力是掩盖不住的，这个新版本的各项指标都有大幅提升，而且对硬件的需要很

DeepSeek在北京时间24日深夜悄悄放了个大招，没有像美国的OpenAI等技术公司那样事先炒作，就默默推出一个新版本DeepSeek-V3-0324。从命名方式看是V3的小幅改进版，然而能力是掩盖不住的，这个新版本的各项指标都有大幅提升，而且对硬件的需要很低，尤其值得注意的是采用了可免费商用的开源方式，等于在AI界又扔了一颗炸弹，立刻引起国外AI研究者的关注。

国外AI研究者测试DeepSeek-V3-0324

DeepSeek发布这个模型时，没有发布任何白皮书、博文或市场推广，除了模型文件本身，只有一个README文件，内容还是空的。这种做法与西方AI公司精心策划的产品发布形成了鲜明对比，OpenAI等公司在发布校招版本之前，经常会炒作几个月。

新的DeepSeek-V3-0324拥有6850亿个参数，从命名方式来看，属于V3的小幅改进版本，然而它的能力却不是小幅改进。

DeepSeek-V3-0324发布后，立刻有国外研究者进行了测试，他们发现该产品较上一版本有了显著改进。AI研究人员Xeophon在社交媒体平台发帖称 "在我的内部工作台上测试了新的DeepSeek V3，它在所有测试中的各项指标都有大幅提升。它现在是最好的非推理模型，超越了Sonnet 3.5。"

升级后的V3在代码编写、数学推理等方面得到显著提升，尤其是代码领域，已经与此前据称代码能力最强的Claude 3.7 Sonnet处于同一水平上，不少网友直呼眼前一亮。

国外AI研究者所做的评比

新的DeepSeek对硬件的需要进一步降低，AI研究员Awni Hannun在社交媒体上说，用苹果公司的消费级Mac Studio本地部署运行DeepSeek-V3-0324，速度达到20 token/秒！虽然Mac Studio的售价接近1万美元，但与英伟达的天价GPU相比，简直是白菜价，小型公司也用得起，不需要建立昂贵的数据中心。

而且DeepSeek-V3-0324采用了新的MIT许可开源方式，可以免费用于商业用途，预计会受到小型企业的欢迎。

国外AI研究人员相信，DeepSeek-V3-0324的发布时间和特点强烈表明，它将成为DeepSeek下一代模型R2的基础。外界预计DeepSeek-R2将在未来几个月内推出，性能有可能直接对标OpenAI的下一代旗舰模型GPT-5。（扬子晚报国际新闻工作室宋世锋）

校对石伟

来源：扬子晚报

标签： deepseek 紫牛 sonnet deepseek深夜

本文地址：https://news.43u.com.cn/a/928105.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!