摘要:被称为国产大模型骄傲的DeepSeek,得到了全球最大云厂商AWS的强力支持。北京时间3月11日凌晨,AWS宣布在Amazon Bedrock推出全托管的 DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用的海外云厂商。与此同时,
被称为国产大模型骄傲的DeepSeek,得到了全球最大云厂商AWS的强力支持。北京时间3月11日凌晨,AWS宣布在Amazon Bedrock推出全托管的 DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用的海外云厂商。与此同时,DeepSeek也成为了首个登陆Amazon Bedrock的国产大模型。
针对这次合作,平时很少出面的亚马逊总裁兼CEO Andy Jassy,也专门在海外社交媒体上发帖,亲自为DeepSeek站台。
那么,DeepSeek为什么会携手AWS,双方携手的背后又意味着什么呢?
对于心怀天下的DeepSeek来说,出海是必然的选择。据海外媒体爆料,2月5日,DeepSeek在香港旺角和尖沙咀分别注册了DeepSeek Limited和DeepSeek (HK)Limited两家公司,究其目的,显然是准备以香港为跳板,加速走向海外市场。
不过,神龙出海的DeepSeek,必然会遭遇恶劣的天气和强悍的对手,它需要披上厚重的护鳞甲。
在个人用户层面,高性价比的产品和坚决的开源策略,已经为DeepSeek披上了两层护鳞甲。今年2月,DeepSeek的日活跃用户数已经超过3000万,跃居全球第二,仅次于OpenAI。无论是在国内还是海外的个人用户,特别是在开源社区用户当中,DeepSeek均拥有非常高的人气。
在国内企业市场,DeepSeek一方面赢得了国家超算互联网平台、三大电信运营商、腾讯、百度等云厂商强大的算力支持,还有像硅基流动、云轴科技等技术服务商帮助完成企业部署,可谓顺风顺水。
由此可见,在企业市场,大模型要创造商业价值,就需要一整套的生态系统,特别是云平台提供算力、适配、开发、运维、工具链等系统性的支持。
当DeepSeek一声长吟、冲向惊涛骇浪的时候,AWS适时送来了护体的黄金甲。
早在今年1月30日,DeepSeek-R1就已经在Amazon Bedrock Marketplace上推出,企业客户可使用自己管理的基础设施运行该模型。此外,企业客户还可以通过Amazon Bedrock自定义模型导入功能,上传自己微调的DeepSeek-R1蒸馏版Llama模型,将其作为完全托管的模型运行,该功能使客户通过单一API导入和使用其自定义模型以及现有模型。如今,已经有数千名企业客户使用Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。
现在,当DeepSeek启动海外企业市场扩张的同时,AWS又在Amazon Bedrock推出全托管的 DeepSeek-R1模型,让企业客户能够以更低的成本、更便捷的方式使用这个获得一致好评的推理模型。
要知道,AWS为DeepSeek量身定做的这身护鳞甲,可谓海外市场最强战衣,为什么这么说呢?
首先,低价是王道,而AWS帮助DeepSeek做到了没有更低,只有最低。在AWS推出全托管模式之前,企业客户如果希望部署DeepSeek-R1 671B大模型,在云平台本地部署的成本仍然高达15695美元/月。有了全托管模式,企业客户不再需要本地部署,只需要调用API就能够使用大模型的能力。而以DeepSeek低至0.00135美元/1000 tokens输入和0.0054美元/1000 tokens输出的API调用成本来计算,总拥有成本(TCO)的节省可不止一星半点。
其次,对于企业客户来说,DeepSeek不是拿来玩耍,而是拿来用的。如何让DeepSeek在Amazon Bedrock更好用?AWS给DeepSeek加持了大量非常实用的功能,老冀给大家说道说道:
1.安全防护:可以为任何AI模型设置安全规则,能拦截85%的有害内容;独创的自动检查机制,可以防止AI“胡说八道”;在查询企业数据时,能过滤掉75%的错误回答。
2.知识库:可以安全地连接企业内部数据,让AI聊天机器人能够基于企业实际情况给出准确回答。
3.Agents:能自动完成多个步骤的复杂任务,用自然语言与用户交流,自动调用各种系统和接口完成任务,安全地访问企业私有数据,记录AI的思考过程,持续改进服务质量,能记住用户以前的对话,提供更个性化的服务。
4.模型评估:快速测试和对比不同AI模型的性能,把评估时间从几周缩短到几小时,帮助企业更快上线新应用。
5.提示词管理:简化创建、测试、管理和分享提示词,通过缓存和智能路由功能,更好地管理大量提示词,减少响应时间,提高质量,降低成本。
最低的价格、最好用的功能,你说AWS为DeepSeek出海打造的这身护鳞甲,是不是很强?
话说如今国内市场越来越卷,渴望并布局出海的中国企业多了去了,其中当然也包括字节跳动/腾讯/阿里/百度和“AI六小龙”等众多涉足大模型的厂商。可是,令人大跌眼镜的是,只有DeepSeek获得了AWS的垂青,成为唯一入选Amazon Bedrock并采用全托管模式的中国大模型厂商。
据老冀了解,在过去一年多的时间,AWS把国内主流的大模型完完整整、仔仔细细地测了个遍,最后才选定了DeepSeek。这是因为他们认为,DeepSeek是中国最强的大模型,没有之一。
再看同样入选Amazon Bedrock并采用全托管模式的其他大模型,你就会倒吸一口凉气。除了DeepSeek-R1,能够入AWS法眼的只有Anthropic的Claude系列、Meta的Llama系列、Mistral、Stable Disffusion、Cohere。
入选的大模型,可谓各有所长:Claude是首席技术专家,代码能力无人能及,创意写作得心应手,还擅长深度思考和分析;DeepSeek就像是精英分析师,既是数学建模的专家,也是金融分析的能手,还擅长处理复杂的语言任务……
这其实也说明,DeepSeek已经跻身全球最强大模型的行列,并且具备了独特的竞争力。
这也说明对于AI大模型,作为云平台的AWS始终保持开放、没有偏见的态度。一方面,AWS通过推出Amazon Bedrock Marketplace,帮助多达184个大模型上架,供企业客户使用。AWS深知,大模型就像企业专业团队员工,每个都有自己的特长和擅长的领域,没有一个模型可以适用所有场景一统天下,Choice Matters!
另一方面,对于那些具备更强悍实力的大模型,AWS还会通过提供全托管模式,给予更多的扶持。如今,包括DeepSeek在内,共有7家大模型厂商享受到了AWS提供的VIP待遇。也就是说,对于大模型厂商来说,进门吃AWS的自助餐相对容易一些,只有那些最强者才有上桌吃大餐的资格。
看到这里,估计很多朋友会有个印象,那就是AWS就是个为大模型提供算力支持的云平台厂商。实际上,AWS在AI上的布局远远不止这些。
实际上,AWS自己也有自研大模型Amazon Nova,包括文本对话、多模态、生成高质量图像、生成高质量视频的六款大模型,用Andy Jassy的话来说就是,“万物皆可生成”。
此外,AWS还用自研芯片Trainium搭建AI算力,发布了适用于大模型的Amazon S3 Tables大规模表格数据存储,构建了新型无服务器分布式数据库Amazon Aurora DSQL。在AWS看来,满足客户需求才是关键,客户需要什么,AWS就提供什么。
当然,为了AI,AWS也投入了最多的真金白银。2024年第四季度,亚马逊的资本支出高达263亿美元,其中绝大部分都用于AWS的AI投资。2024年,亚马逊的资本支出比排名第二的微软高出 58%。
2025年,AWS仍然一掷千金。据分析师预测,2025年亚马逊的资本支出将超过1000亿美元,主要仍用在AWS的AI投资上面。同样是在2025年,预计微软的资本支出只有800亿美元,而阿里巴巴的资本支出则不到亚马逊的五分之一。
AWS已经清晰地看到,AI赛道的竞争,已经不只是模型工具的迭代,而是商业价值的比拼。对于企业客户,不能提供一个所谓的“最强大模型”就了事,而要根据企业的不同场景,为其量身定制不同的大模型并实现有效联动。最终,AI需要帮助企业客户降本增效,实现商业价值,才算完成了使命。
由此,我们对于AI的发展历程就有了更明确的认知:
随着2022年11月ChatGPT的横空出世,2023年成就了AI的实验之年;紧接着的狂卷算力和狂推大模型,让2024年成为了AI的生产之年;2025年,DeepSeek推出高性价比大模型,让大家重新思考AI的商业模式,重构AI的商业价值。如今,在AI上投入最多、布局最广、能够为企业客户提供更丰富商业价值的AWS,显然再一次跑在了AI赛道的最前面。
来源:老冀说科技