DeepSeek 外网爆火

360影视 2025-01-27 00:04 2

摘要:DeepSeek 全名为杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年。是量化私募巨头幻方量化旗下的 AI 公司。由浙江大学人工智能专业背景的梁文锋创立,他也是幻方量化的创始人。其团队成员大多来自清华大学、北京大学、中山大学、北京邮电大学等顶尖

DeepSeek 全名为杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年。是量化私募巨头幻方量化旗下的 AI 公司。由浙江大学人工智能专业背景的梁文锋创立,他也是幻方量化的创始人。其团队成员大多来自清华大学、北京大学、中山大学、北京邮电大学等顶尖高校,呈现出 “年轻高学历、注重开源、重视创新” 的特点。

技术实力卓越:2025 年 1 月 20 日发布的 DeepSeek-R1 模型性能对标 OpenAI O1 正式版,在 Codeforces、GPQA Diamond、Math-500、MMLU、Swe-bench Verified 等测试中,得分与 O1 正式版接近,部分测试中得分还超过 O1 正式版。开源策略优势:DeepSeek 走开源路线,发布的开源模型使业界可以低成本快速复制出逻辑推理能力更强大的模型,用户在数据安全、使用成本等方面都有获益,冲击了闭源模型的市场格局。成本控制出色:如 DeepSeek-V3 仅用 557.6 万美元的预算,在 2048 个 H800 GPU 集群上花费 3.7 天 / 万亿 tokens 的训练时间,就足以媲美 O1、Claude、Gemini 和 Llama 3 等顶级模型的性能,大幅降低了训练成本。传播因素影响:可能由于 X 平台(原推特)的算法调整让 DeepSeek 的相关内容获得了更多曝光机会。也可能是华尔街的投资者们看中了 DeepSeek 的潜力,通过各种渠道进行宣传,引发了市场关注。

从硬件角度看,

寒武纪为其提供定制化训练芯片。

中科曙光液冷服务器市占率超 40%,深度绑定 DeepSeek 数据中心建设。

紫光国微的 FPGA 芯片适配边缘 AI 场景,已进入 DeepSeek 供应。

来源:互动趣味空间

相关推荐