DeepSeek-V3深夜惊爆上新!V3开源升级接近Claude3.7水平,必须重视!

360影视 动漫周边 2025-03-26 00:26 2

摘要:3月24日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。

3月24日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。

目前已在Hugging Face上开源,并迅速登上了Trending榜单。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,该版本的最新模型也已经同步至官网、App 和小程序,关闭“深度思考”就可体验。

此次发布的版本更新,在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3-0324生成前端代码的能力大大提升。

DeepSeek-V3-0324编程与数学能力大幅提升

【基准测试提升显著】

根据国外开源评测平台kcores-llm-arena的最新测试数据,V3-0324的代码能力达到了328.3分,超过了普通版的Claude 3.7 Sonnet(322.3分),接近思维链版本的334.8分。

这一成绩意味着,新版V3已成为目前编程能力最强的开源模型之一。

【Web前端开发能力优化】

代码生成准确率提升

生成的网页与游戏前端更加美观

【中文写作能力升级】

风格与内容优化

实现与R1写作风格对齐

中长篇写作内容质量提升

多轮交互式改写能力提升

翻译质量与书信写作优化

AI新技术发展迅猛!投资者应如何布局?

DeepSeek新模型的改变对于业内来说也具有重大意义,一方面其大大降低了大模型的能耗及计算成本,进一步动摇了华尔街对于顶级模型基础设施的投资规模假设;另一方面,中国人工智能行业对开源的广泛共识又迅速推动国内AI行业的发展,不断缩短其与世界顶尖对手的距离。

【数据中心】:中国移动、中国联通、中国电信、首都在线、云赛智联、润泽科技、杭钢股份、拓尔思、汉得信息、青云科技、浙大网新

来源:金融界一点号

相关推荐