DeepSeek宣布将开源五个模型代码库

360影视 2025-02-22 04:06 2

摘要:DeepSeek介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。该公司将自己定义为小公司,并表示每一次分享都会变成强有力的势能,加速行业发展旅程。

2 月 21 日,DeepSeek宣布接下来一周,会陆续开源五个模型代码库,称此举是“虽小但真诚的进步”,并将“完全透明地”分享。

开源代码库是指将代码库公开,任何人都可以查看、下载、修改和使用其中的代码。这比开放模型权重更进一步,开源程度更为彻底。

这意味着任何人都可以在DeepSeek基础上进行再次创新,提升模型性能,加速模型领域的创新。

DeepSeek介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。该公司将自己定义为小公司,并表示每一次分享都会变成强有力的势能,加速行业发展旅程。

公司还说,这一领域不存在“高高在上的象牙塔”,而是秉持车库创业精神,与社区共同构建创新力量。

上个月, DeepSeek发布了开源 R1 推理模型,震惊了全球人工智能行业,该模型的性能可与 OpenAI、Anthropic 等公司的前沿模型相媲美,但开发成本更低。

去年 7 月,DeepSeek低调的创始人梁文峰在接受采访时表示,该公司并不优先考虑将其人工智能模型商业化,开源可以带来软实力。

“事实上,开源更多的是一种文化行为,而非商业行为,为开源做出贡献会让我们赢得尊重。”他在访谈中表示:“让其他人效仿你的创新会带来很大的成就感。”

几天前,DeepSeek 还发布了一种名为 Native Sparse Attention (NSA) 的新算法,旨在提高长上下文训练和推理的效率。

自上个月以来,DeepSeek 的用户群呈爆炸式增长。数据分析平台 QuestMobile 最新数据显示,从上线以来至 2 月 9 日,DeepSeek App 的累计下载量已超 1.1 亿次,周活跃用户规模最高近 9700 万。

来源:裴裴科技智慧

相关推荐