摘要:亚马逊云科技业务的诞生,背景可追溯到互联网泡沫破裂前的1998年,当时亚马逊已经成为全球最大的在线书店。爆炸式增长的业务需求和电商大促流量洪峰等技术挑战迫使亚马逊在分布式系统、数据库管理、网络安全和高可用架构等方面进行了大量技术投入和探索,为今天AWS (Am
亚马逊对开源的态度,与其对软件生态的认知密不可分。
文|钱丽娜
2024 财年亚马逊云科技业务销售额为 1076 亿美元,与 2023 财年的 908 亿美元相比增长 19%。
亚马逊云科技业务的诞生,背景可追溯到互联网泡沫破裂前的1998年,当时亚马逊已经成为全球最大的在线书店。爆炸式增长的业务需求和电商大促流量洪峰等技术挑战迫使亚马逊在分布式系统、数据库管理、网络安全和高可用架构等方面进行了大量技术投入和探索,为今天AWS (Amazon Web Services,以下称“亚马逊云科技”)的诞生奠定了技术基础。
2002 年 7月,亚马逊推出了其第一个版本的“Amazon.com Web Services”,该平台用于创建专门为开发人员和网站所有者设计的创新Web解决方案和服务,彼时云计算概念还鲜有人知。2003年,Benjamin Black 与人合著论文,帮助启动了 Amazon Web Services 和 IaaS 云计算市场。当时亚马逊管理网站工程团队的Black与 Chris Pinkham 共事,Pinkham 敦促 Black 考虑如何更有效地扩展亚马逊的基础设施,他们探索了应用程序与基础设施的抽象和解耦,意识到将基础设施作为服务出售可能有很大价值,并将想法告知创始人杰夫·贝索斯,得到了他的批准。
2006年,亚马逊云科技正式发布 Amazon EC2(计算)和 Amazon S3(存储)服务,开创了云计算时代。这两个服务的高可用性、高持久性、高扩展性设计理念以及按需付费模式,为数据的驱动创新提供了坚实后盾,并为大数据和人工智能时代的到来铺平了道路。亚马逊云科技秉持 API - first的理念,所有服务通过API提供,方便开发者集成和使用,为亚马逊云科技的发展和生态系统建设奠定了基础。
01
积极拥抱开源
开源软件的出现早于亚马逊,并在一定程度上成就了亚马逊。像Linux 操作系统这样的开源软件,为如今包括亚马逊云科技在内的大多数数据中心提供了支持,云计算、数据和开源软件相互融合。
随着云计算格局的成熟,亚马逊开始认识到开源技术的战略重要性,并更积极地拥抱开源,提供基于广泛使用的开源技术托管服务。
亚马逊云科技为PostgreSQL和MySQL 等各种开源数据库推出了亚马逊关系数据库服务(Amazon RDS)。这使各组织能够利用这些数据库的强大功能,同时将维护任务交给亚马逊云科技处理。此外,亚马逊云科技还推出了弹性Kubernetes 服务(Amazon EKS),通过支持 Kubernetes,亚马逊云科技与行业领先的容器编排平台保持一致,以便与充满活力的开发者和贡献者社区进行互动。Amazon Lambda 允许开发者根据事件运行代码,进一步集成了无服务器框架等开源工具,这种灵活性吸引了欣赏开源优势的开发者。
除了提供托管服务外,亚马逊云科技还开始直接为多个开源项目作出贡献。这种参与有助于在社区内重建信任,并展示了亚马逊云科技对协作的承诺。
比如亚马逊云科技一直是 Kubernetes 的重要贡献者,发布了许多开源工具,如亚马逊云科技软件开发工具包(SDKs)、Amazon Amplify 和云开发工具包Amazon CDK。这些工具使开发者能够在遵循开源原则的同时在亚马逊云科技上构建应用程序。
亚马逊云科技新推出的 Amazon Bedrock 服务让客户能够使用基础模型,甚至 Amazon Bedrock 服务所提供的一些模型也是开源的,比如 Stability AI 公司的 StableLM 和 Stable Diffusion,以及DeepSeek公司发布的DeepSeek-R1。这一新策略使亚马逊云科技得以创建一种全新的商业模式。
02
不会只有一个模型“一统天下”
亚马逊对开源的态度,也与其对软件生态的认知密不可分。
亚马逊CEO Andy Jassy在2024 re:Invent大会上提出了亚马逊自身部署人工智能中的三项关键洞察:首先,随着生成式AI应用规模的扩大,计算成本变得至关重要。人们非常渴望获得更高的性价比;其次,构建一个真正优秀的生成式AI应用实际上非常困难。最后,当让开发者自由选择他们想要使用的模型时,模型的多样性显而易见。
Jassy说:“这并不让我们感到意外,因为我们一次又一次地学到同样的教训,即永远不会有单一的工具能够统治世界。”
同样,也“不会只有一个模型‘一统天下’”,这是亚马逊在技术发展历程上的洞察。Jassy在一次演讲中曾表示:“就像数据库领域,探讨了10年,大家会使用各种各样的关系型数据库或者非关系型数据库。在分析领域也是如此,曾经大家觉得TensorFlow会成为唯一的AI框架,最终PyTorch成为了最受欢迎的那个。”
在基于大模型构建应用时,不同的应用场景需要的技术指标也各不相同,延迟、成本、微调能力、知识库协调能力、多模态支持能力等等,都会因场景需求的不同而被取舍。
以快速响应场景为例,DeepSeek-R1的深层思考模式显然不太合适,据了解其生成首个token的用时超过30秒,而Amazon Nova则只需要数百毫秒即可生成响应。目前的DeepSeek-V3模型是文生文模型,并不支持图形等多模态信息的输入。显然,即便是DeepSeek也不是万能的。
基于这一理念,亚马逊云科技在提供领先的模型如Amazon Nova系列之外,更加致力于为企业用户提供丰富的模型“选择”,为此构建了轻松接入全球领先模型的Amazon Bedrock,并不断扩展其模型“朋友圈”,现已有AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等厂商入驻。
近期Amazon Bedrock正式上线了Luma AI Ray 2 模型。该模型是一款由Luma AI推出的最新版本视频生成模型,可以广泛用于内容创建、娱乐、广告和媒体使用案例,从而简化从概念到执行的创意流程。亚马逊云科技还推出了Amazon Bedrock Marketplace功能,为客户提供100多个热门、新兴的专业模型。
今年3月11日,亚马逊云科技宣布,DeepSeek-R1现已作为完全托管的无服务器大语言模型(LLM)在Amazon Bedrock上正式可用,亚马逊云科技是首个将该模型作为完全托管服务推出的云服务提供商。这次的发布堪称在亚马逊云科技上使用DeepSeek-R1的最佳打开方式,同时也是最省心的方式,集各种优势于一身:满血版的强大性能、完全托管的省心省力及极致弹性,同时尽享Amazon Bedrock的各种强大的构建工具与企业级的安全防护功能。
03
构建“全家桶”技术能力
基于场景选择合适的模型只是构建应用旅程的第一步,随着构建的深入,解决工程化难题的能力成为能否实现快速创新的关键。
Amazon Bedrock聚焦企业应用AI的实际需求,在模型选择之外,增添了一系列重磅功能。借助Amazon Bedrock,包括DeepSeek-R1在内的领先模型都能轻松获取这些实用功能,并由此进入构建应用的快车道。这些实用型功能几乎涵盖企业级AI创新的方方面面,可以简要概括为以下4种工具类型:
优化效果、延迟和成本:如低延迟优化推理、模型蒸馏、提示词缓存等功能,大幅提升推理效率。以模型蒸馏功能为例,它能够将特定知识从功能强大的大模型转移到更小、更高效的模型,运行速度最快可提高500%,成本降低75%。
基于企业自有数据的定制优化:模型微调功能和知识库功能不断丰富,现已支持GraphRAG等图数据,并能够快速且经济高效地从文档、图像、音频以及视频中提取信息,并将其转换为结构化格式的Amazon Bedrock Data Automation功能等。
负责任AI的安全和审查:Amazon Bedrock不断丰富其Guardrails功能,以简化企业实施负责任AI的投入,例如为其加入自动推理检查功能,从而能够轻松识别事实性错误,以提升生成回答的准确性。
实现复杂功能的多智能体功能:Amazon Bedrock不但提供智能体功能,还针对智能体的快速发展,进一步推出了多智能体协作功能,使客户能够轻松地构建和协调专业智能体来执行复杂的工作流程。凭借多智能体协作功能,客户可以通过为项目的特定步骤创建和分配专用智能体,从而获得更准确的结果,并通过编排多个并行工作的智能体来加速任务。
亚马逊云科技大中华区解决方案架构总经理代闻说,从2006年3月14日亚马逊云科技推出第一款产品发展到如今,亚马逊云科技已拥有超过240项全功能的服务。亚马逊云科技的核心软件开发逻辑采用的是逆向工作法,即只有客户有需求才会去进行相应开发,分析客户所提问题背后的根本原因,进而开展创新。“客户往往只会说需要更快、更便宜的GPU(图形处理器),却不会讲实际上需要像ASIC(定制芯片)这种更具体的东西,因为后者才能真正为用户解决它的痛点问题。在这种情况下,我们就会通过创新办法来解决这类隐藏需求。”
亚马逊云科技的创新呈现出矩阵式、全栈式的创新形态。从基础的硬件到Amazon Bedrock平台软件,再到“speech to speech”的模型发布,其能力还会不断增强。
对于开箱即用的服务,作为大型云服务提供商,亚马逊云科技能够实现全栈创新,而且每个层面的创新之间还存在联动。基础设施层面,要求提供更快、更高性价比的服务;平台软件层面,用户通常会关心输出能否可控,模型能否进行更好的比较;在模型能力层面,目标是要打造更具性价比、多模态、更高精准度且具备负责任AI特性的模型;在开箱即用服务层面,要考虑能否接入更多软件。
“计算机科学先驱”Alan Kay曾说过“真正认真对待软件的人应该打造自己的硬件”。当上层的软件系统有了新的需求标准,底层就该以新的硬件方式去加速软件运行效率。实际上,这个决定在最初时备受争议,很多人并不看好一个云服务厂商能够成功研发CPU。从2018年至今,亚马逊走过了从0开始的ARM处理器发展历程。几个月前,亚马逊推出了迄今为止最强大的Amazon Graviton芯片的第四代产品——Amazon Graviton4,其单核计算性能提升了30%,虚拟CPU数量和内存容量都是上一代的3倍。到如今新增的处理器中,超过半数都是Amazon Graviton芯片。这意味着在新增的处理器芯片里,Amazon Graviton芯片的数量比其他任何一款处理器芯片都要多,足以见得在云计算创新的大环境下,硬件创新的速度之快。“当下大家对于获取高性能、低延迟且高性价比的硬件系统有了新需求。并且随着生成式AI框架不断发展,这给底层硬件带来诸多创新契机。”代闻说,“为什么我们能为某些应用场景提供数十万片芯片组成的集群,其性能相较于此前的GPU集群还能提升5倍以上,核心原因就在于这些硬件是专为构建大型生成式模型而打造的。这本质上是一种软件驱动硬件创新、硬件服务软件需求的基本构想。”
来源 | 2025年4月刊
来源:新浪财经