摘要:2月1日,硅基流动和华为云宣布联合⾸发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。基于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球⾼端GPU部署模型的效果。
来源|蓝血研究
随着DeepSeek的爆火,国产大模型云服务平台SiliconCloud(硅基流动)开始被大家关注。
2月1日,硅基流动和华为云宣布联合⾸发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。基于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球⾼端GPU部署模型的效果。
硅基流动(siliconflow)成立于2023年8月,由袁进辉博士创立。袁进辉是清华大学计算机系的博士,并曾在微软亚洲研究院任职,是一位“拿着锤子找钉子”的“技术派”。
硅基流动扎根AI Infra(AI基础设施),袁进辉将公司定位为“token工厂”,希望通过自研推理引擎,让开发者实现“token自由”,让模型像水电一样能按需使用。硅基流动的使命就是降低大模型应用成本和开发门槛,加速AGI(人工通用智能)普惠人类的发展进程。
AI Infra之所以重要,在于它是整个AI生态系统的基石。它连接算力和应用的AI中间层基础设施,涵盖了数据准备、模型训练、模型部署和应用整合等环节。而在其众多组成部分中,AI推理(AI Inference)的比重尤为突出。现在,AI领域的主战场正悄然从训练向推理转移。在模型规模不断扩大的同时提升推理效率和性能已是行业的关注点,成为推动AI应用落地的核心问题。“而且在AI推理市场,我还有未尽的使命。”袁进辉说。
以下为甲子光年对袁进辉的采访:
问:为什么选择在Infra方向创业?
袁进辉:核心原因有两个:一是这个领域的空间足够大,二是确定性够高。这点大家很容易理解。所谓确定性高,就是在行业早期,基础设施层面的机会往往是最为稳妥的,类似于“卖铲子、卖水”的角色,空间也非常广阔。从整个行业的机会来看,可以分为应用层和底层基础设施。基础设施作为服务全行业的底座,有三个主要的切入点:芯片、模型和基础设施(Infra)。最终,这三者如果要取得长远的成功,都会走向类似于云计算(cloud)的形态,将模型和芯片整合在一起。我认为,从Infra的角度往云计算方向发展,机会并不比其他方向小。
问:为什么要以推理部署为中心?
袁进辉:推理的计算需求和消耗的算力远远超过了训练。虽然我们可以不用展开具体公式,但大家都知道,这主要取决于token的量。
训练的token量是固定的,类似一个游泳池,数据量有限;而推理的数据量则像一条不断流动的大河,几乎是无止境的。另外,训练的客户集中度非常高,几乎不可能有外部的创业公司能够独立承担这类大规模训练任务。原因在于,他们缺乏长期运营上千、上万张GPU集群的能力去打磨模型。
此外,训练的提升空间已经非常有限。如果大家在一线从事相关工作,应该了解当前MFU理论(机器使用率)可以做到70%,而现在最好的训练效率大约在50%到接近60%左右。剩下的提升空间不多了。而推理还有很大的优化潜力,特别是随着O1等技术的出现,test-time compute也带来了新的机会。
问:去年8 月创立硅基流动时,如何说服投资人支持?
袁进辉:关键在于 “人” 和 “事”。团队经受过考验,在 AI方向人才稀缺;AI Infra 前景好,从推理切入合理,“事” 本身的吸引力和市场空间能汇聚人才,但外界可能更看重 “人”。
问:模型厂商能提供推理服务,AI推理还能单独成为生意吗?
袁进辉:能。AI推理市场空间大、标准化程度高且有专业性。AI应用广泛,token生成量巨大,推理成本高昂但使用量持续增长;其底层技术使用接口统一,便于标准化;用好推理存在技术门槛,标准化推理部署产品能满足共性需求。
问:全球AI 推理市场规模有多大?
袁进辉:可从两方面推算。一是依据生成token 数量,全球AI 企业众多,token生成量不断增加,按一定成本标准可推算市场规模;二是从算力运行推理任务角度,推理所需GPU 数量超过训练且持续增长,结合服务器成本、租金及利润可推出市场规模。
问:硅基流动与定位为 “算力运营商” 的 AI Infra 公司有何不同?
袁进辉:硅基流动核心产品是SiliconCloud,提供一站式大模型API 云服务平台。我们更像 “模型能力供应商”,将算力加工成接近用户需求的产品,即成品模型,而非原始算力资源,也因此称自己为 “token 工厂”“模力社区” 。
问:硅基流动与海外做AI 推理的公司有何异同?
袁进辉:相同点是对市场理解、瞄准需求及核心产品追求的指标相似。不同点在于产品类型和定价体系不同,市场选择有差异。海外同行多关注美国市场,硅基流动起点是国内市场,也参与全球开源项目,吸引了海外需求。
问:硅基流动如何在全球众多AI 推理企业中脱颖而出?
袁进辉:现在可用产品证明优势。在完全竞争市场中,保持持续小幅领先很关键,竞争是综合的,不同阶段侧重不同,初期应聚焦一个关键点。
问:硅基流动的稀缺性体现在哪?
袁进辉:团队在AI infra 积累深厚,在深度学习框架等项目经验丰富。在文生图和语言模型推理速度上优势明显,用英伟达GPU 跑模型,速度领先。
问:硅基流动做了哪些别人没做或不愿做的事?
袁进辉:我们优化消费级GPU 等低端硬件。消费级GPU 性价比高但优化难度大,很多厂商不愿投入资源,我们解决了这一问题,给用户更多选择。
问:硅基流动会进入AI 应用领域吗?
袁进辉:不会,我们专注于AI Infra 和相关工具,解决场景共性问题,构建工具箱和工具链,转变为云端产品。
问:硅基流动推出多款主流服务器永久免费服务的原因是什么?
袁进辉:这是一种策略,免费服务面向开发者,提供小模型,有流量限制,目的是引流和培养使用习惯,对企业用户的更高需求服务则收费。
问:硅基流动目前主要市场在国内还是海外?
袁进辉:我们优先服务PLG 覆盖的市场化客户,这类客户海外市场机会更大;大B 市场是第二阶段目标。
问:中国AI 企业应如何出海?
袁进辉:海外市场付费意愿和能力强,建议先进入。海外企业服务生态完善,做差异化优势的标准化产品更有优势。
问:AI行业出海,人需要跟着业务出去吗?
袁进辉:只做海外市场,人出去更有优势;偏底层产品、服务中小企业或通过PLG 开拓市场,人不一定需要出国;服务大企业则需线下拜访,在美国必须有本地销售团队。
问:为什么用 “伟大” 形容代码类应用 Cursor?
袁进辉:Cursor这类编程工具能理解和索引整个项目,让无编程能力的人通过自然语言交互实现小应用程序,打开了 “人人都能成为开发者” 的可能性。
问:Cursor是你心目中的 “超级应用” 吗?
袁进辉:是的。虽然当前用户群体未达几亿,但从价值和潜力看,它在生产环节潜力巨大,在其他领域还未出现类似潜力的应用。
问:面对各类大模型产品,你的心态有何变化?
袁进辉:技术突破时兴奋,但技术投入和发布频率高,出现 “审美疲劳”,人们开始反思技术实际价值,兴奋度下降,对实际应用的期待增加。
问:硅基流动成立一年,是否达到预期?
袁进辉:基本达到。技术指标、核心引擎表现及产品推出符合预期,用户反馈良好。未达到预期的是应用普及速度,服务规模和token 生成量未达预想。
问:OneFlow被收购后,有想过不做AI Infra 方向吗?
袁进辉:没有。我的专长是发挥技术价值,希望产品在多场景产生影响,所以选择做基础设施层。
问:年初你问自己 “我成长了吗”,现在觉得自己成长了吗?
袁进辉:成长了。这一年节奏快,成长主要体现在日常业务上,如市场、产品迭代、资源配置等,在体系化搭建上更加成熟。
来源:反做空一线