摘要:“我们打算招募更多的闲置算力”,在接入DeepSeek-R1之后,青云科技市场总监王玉圆向北京商报记者透露,在她看来,“这波连锁反应中,最早受益的是上游的算力公司”。
“我们打算招募更多的闲置算力”,在接入DeepSeek-R1之后,青云科技市场总监王玉圆向北京商报记者透露,在她看来,“这波连锁反应中,最早受益的是上游的算力公司”。
2024年底至今,DeepSeek是名副其实的科技圈顶流,随之产业链震动,一众云计算企业接入,2月6日百度智能云宣布千帆大模型平台上线DeepSeek-R1与DeepSeek-V3模型首日,超1.5万家客户进行模型调用;多家国产GPU(图形处理器)适配,摩尔线程即将开放的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署;大模型应用规模化集成,包括但不限于网文、网安、图形影像类……
谁也不想错过这次机遇。“紧锣密鼓”“一直在关注”“快”,是北京商报记者与产业链各环节公司交流时听到最多的词。
连锁反应继续
“上线21天,日活用户2215万”,2月5日,第三方机构AI产品榜带来了DeepSeek的最新数据。对比几天前“上线18天日活用户数1500万”的成绩单,DeepSeek的增长曲线依然陡峭。资本市场也快速反应,用DeepSeek概念股涨停潮释放热情。
其实,同在AI产业链上的各类企业更早嗅到机会,“在DeepSeek-V3发布时(2024年12月26日),青云内部就在做测试了,V3版本体量比较大,比较费卡,后来DeepSeek发布了体量更小的DeepSeek-R1(2025年1月20日)包括一些蒸馏版本,青云快速上线了4个DeepSeek-R1系列模型和文生图版本模型”。王玉圆告诉北京商报记者。
此前,华为云、腾讯云、百度智能云、阿里云已接入DeepSeek模型,和青云科技同日官宣合作的有天翼云、京东云、字节跳动旗下的火山引擎。
类似的合作还会继续,“我们正在测试DeepSeek-R1满血版,希望用更低成本的方式接入,但不管是用什么类型的GPU,青云都会尽快给客户提供DeepSeek-R1满血版服务的”。王玉圆说。
处于产业链上游的算力企业也快速跟进。截至目前,沐曦、天数智芯、摩尔线程、海光信息4家国产GPU企业均宣布已适配DeepSeek模型服务。
摩尔线程市场生态高级总监吕其恒告诉北京商报记者,“DeepSeek蒸馏模型可以直接部署在我们的GPU和集群上。DeepSeek-V3和R1模型需要一定的适配,摩尔线程的CUDA(由NVIDIA开发的并行计算平台和编程模型)兼容比较完整,春节期间很快就完成了适配”。
据他透露,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。
国产芯片大展拳脚
从硬件基础设施到软件应用开发,大模型上下游产业链包括GPU芯片、CPU芯片、数据采集、标注、存储和管理等上游环节,大模型开发、训练、优化等中游环节,以及大模型应用开发、大模型部署与运维等下游企业。
“影响最大的,我认为是国产算力芯片产业,我国成熟制程芯片全产业链有很强的供给能力,DeepSeek的出现,让AI对算力的需求有所降低,国内的FPGA(现场可编程门阵列)和ASIC(供专用集成电路的芯片)算力芯片将在AI领域大展拳脚。”工信部信息通信经济专家委员会委员盘和林向北京商报记者表示。
王玉圆也认为,DeepSeek引发的连锁反应中,受益最快的是算力产业。“青云计划招募更多的闲置算力,通过青云的基石智算CoresHub对外提供服务。”她进一步解释,“有算力需求的企业和开发者,不需要直接去买算力,而是在青云平台调用API的方式,直接按token计费,门槛更低。”
这也是云厂商提供大模型服务的普遍方式,区别在于自建还是租用算力。具体到青云,叫作算力共营,2024年已有多家智算中心接入,不过“我们现在想招募更多算力资源”,王玉圆说。
相比之下,百度的模式更重。2月5日,百度智能云宣布,已点亮昆仑芯三代万卡集群,并将进一步点亮3万卡集群。中国工程院院士、清华大学计算机系教授郑纬民认为,当下构建国产自主万卡系统充满挑战,但至关重要。
用起来是关键
芯片、集群离用户端太远,普通用户对产业链下游的应用关注更多。
据不完全统计,目前安恒信息、奇安信、天融信、360、美图、阅文、视觉中国、联想等大模型应用都已接入DeepSeek。
其中天融信于2月6日宣布,天融信天问大模型正式完成DeepSeek大模型的接入,赋能安全事件检测分析、威胁情报融合等多个场景,进一步提升了天融信现有的安全产品和服务能力。
“春节期间(和DeepSeek的)合作就发生了”,自家大模型已集成DeepSeek的一家公司负责人告诉北京商报记者。“我们可能两天后官宣跟DeepSeek相关的合作”,另一位业内人士跟记者交流的当天,相关合作就已披露。
“差不多3天吧”“春节加班了”“紧锣密鼓”,在与多家AI相关企业的沟通时,北京商报记者能明显感受到从业者的时不我待。
2月6日的最新消息来自百度智能云:“2月3日,百度智能云千帆大模型平台正式上线DeepSeek-R1与DeepSeek-V3模型,模型上线首日,超1.5万家客户通过千帆平台进行模型调用。”
除了直接调用DeepSeek官方API,企业和开发者还可通过云厂商调用API,或采购能够适配DeepSeek的GPU,本地化部署DeepSeek服务。
“云厂商更多是将DeepSeek等模型集成到自身云平台,为用户提供‘算力+模型’的综合服务,类似‘傻瓜相机’的集成应用,适合对AI技术需求相对较小且技术能力偏弱的个人开发者或者中小企业。GPU公司更多是关注模型的算法优化、整体速度等运行效率和性能,适合对计算性能和能耗要求较高且大规模部署大模型技术推理与训练的企业。”瑞达恒研究院经理王清霖告诉北京商报记者。
北京商报记者 魏蔚
来源:北京商报