2024 re:Invent现场直击 | 生成式AI时代 落地应用看疗效

摘要:如同沙利文大中华区总监李庆所言:本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化,这表明过去一年中,全球用户正在积极使用亚马逊云科技进行生成式AI应用的探索和创新。

2024亚马逊云科技re:Invent落下帷幕。大会的新发布让来参会的客户合作伙伴和用户感到前所未有的震撼。

如同沙利文大中华区总监李庆所言:本届re:Invent大会上的新发布更加侧重于产品的实际应用和工具优化,这表明过去一年中,全球用户正在积极使用亚马逊云科技进行生成式AI应用的探索和创新。

本次更新有两个方面让李庆印象深刻:一是随着全球企业对生成式AI的深入应用,数据不仅实现跨区域的传输与协同,更实现跨地域、跨区域的深度连接;二是亚马逊云科技进一步优化生成式AI的应用,从数据存储、治理到管理的全流程提升,旨在简化 AI 对数据的使用,同时强化模型功能、增加AI agent 管理和应对模型幻觉的功能。此外,新发布的Amazon Nova 大模型家族备受期待,这一系列的模型和亚马逊云科技的开放选择理念将为用户带来更多创新机会,进一步推动 AI 的发展。

关注客户需求 市场会带来惊喜

无论是云上的创新,还是对于GenAI路上的演进,在谈到面向未来的布局是,亚马逊云科技全球服务副总裁Uwem Ukpong接受记者采访时说出了最朴实的话:“一切从客户的角度出发,这是我们认同的,也是这样身体力行实践的。亚马逊云科技却是可以从企业文化上、从行动上真真正正地体现到这一点,我们所做的一切都是从客户的角度出发。”

Uwem Ukpong负责全球业务扩展,比如在全球范围当中选址,在哪些地方来建亚马逊云科技的数据中心。他认为遵循的逻辑就是业务机会和业务需求。亚马逊云科技的销售人员遍布全球各地,会及时反馈不同地区的市场情况,长期保持与当地客户的一种互动,当意识到某个国家的客户和市场增长,开始向另外国家购买云服务时,亚马逊云科技会迅速做出判断留住这些客户。那就必须考虑在当地建设数据中心,比如说墨西哥一直在用美国的数据中心,但当地的需求实际上和美国不一样,于是今年1月份亚马逊云科技在墨西哥开了数据中心。类似的决策同样发生在中国台湾、沙特、新西兰,德国。

同样,亚马逊云科技踏上生成式AI道路的时候,本想是用一个智能体完成一个任务。但是有些客户成功部署了单一的智能体以后,希望在组织内部布置第二个甚至更多的智能体。亚马逊云科技综合市场情况来判断,意识到这不是一个公司重心或者是热点问题,而是客户需求的问题。比如现在有供应链的客户,他们的生成式的应用会从仓储到物流、到这个库存到订单到现金等各个环节他都要涉及到,他们希望通过不同的智能体整合在一起。基于此,亚马逊云科技提供和开发多智能体的架构。

Uwem Ukpong同时在自有数据中心中负责 AI 的创新中心,帮助客户来进行概念设计的认证,确保他们的投资能够有很好的回报,并且能够将他们的概念设计真正的转变为生产。他表示,起初,金融行业使用GenAI应用较多,但有意思的是,现在一些公共部门、老牌的公司,比如说包括像联邦一级的,还有州一级的政府机构或者事业部门,也会要用到亚马逊云科技的GenAI功能。

现在,制造行业、生命科学,医疗卫生这些行业也变得越来越积极。从使用AI对话式聊天机器人开始,到图像生成、内容生成,甚至有一些过去没有关注到的应用程序的提升和改善,来自客户的需求和应用总给亚马逊云科技不断的惊喜。这也意味着有越来越多的机会。还是那句话:一切以客户的需求出发,GenAI的落地取决于他们的业务模式和场景。

全栈创新 创新联动

此次大会,亚马逊云科技展示了从基础设施层、中间层,再到应用层的系统性创新能力。

亚马逊云科技大中华区解决方案架构总经理代闻总结为:全栈创新,创新联动。

首先,从模型到模型的工程平台到数据的提供再到底层的创新,包括物理数据中心的创新,亚马逊云科技是着眼全栈来进行重大更新。在基础架构层面,做更好的性价比、更高性能的这种硬件。

所以比如Trainium2相较GPU实例,Trn2实例的性价比高出30%至40%。Trn2实例集成16个Trainium2芯片,由高带宽低延迟的NeuronLink技术实现互连。单节点提供20.8 pFLOPS FP8算力,专为生成式AI训练和推理而构建。

第二,每一项更新中间它是有这个因果关系,有互动关系的,这样的创新联动其实是非常重要的,而不是说只是打一个点上的参数,或者打一个榜等等之类的。

亚马逊云科技如何针对现实世界的工作负载优化Graviton性能的,传统CPU的评价机制一般都是各种benchmark(基准测试),就像是通过跑100米短跑来训练马拉松。虽然在这两种情况下都在跑步,但你从根本上是在为不同的挑战进行训练。Graviton则是在通过真实工作负载的性能数据来进行微架构演进, 相比传统芯片设计公司,云厂商有大量实际场景和案例,对不同应用的侧重点和优化方向,让芯片更加贴近使用场景。当然大规模的一个网络传输,重新用了这个 SRD 的协议,让整个数据中心的网络建设能够达到更好的效果,以此来实现10p10u。

除了底层的硬件和平台,在易于使用方面的 Amazon Q 方面的更新,总结一下的话有三个方,三个大的方面。一是面向开发者的Amazon Q Developer全新推出三个Agent,用于生成单元测试、文档和代码审查,与Gitlab深度集成,升级的重点是超越代码完成,自动生成单元测试,覆盖更广的开发任务。

二是针对企业场景的重点支持,这次发布Amazon Q Developer Transformation VMware Workloads to cloud native architectures,还有针对大型机的Q Transform服务——Amazon Q Developer Transform mainframe applications to accelerate migrations,其实这两个方面都是在企业里面场景会看到的,所以亚马逊云科技会更加着重在企业的场景里边怎么样让这个开发者包括是 IT人员更好的实现现代化应用。

三是Amazon Q在于机器学习方面的集成, Amazon Q Developer in SageMaker Canvas是一个非常好的一个开始。

GenAI时代 不看广告、看疗效

生成式 AI 时代,代闻形象的套用一句话:不看广告、看疗效。Amazon Bedrock的全面更新,以及生成式AI助手Amazon Q重大发布,最新发布Amazon Bedrock Marketplace,提供了来自领先供应商的100多个新兴和专业基础模型,为客户提供更多选择,来加速GenAI 的落地的应用步伐。

在2024 re:Invent全球大会展示厅入口,有一项突破性的体验活动,即世界首个由AI驱动、全自动生成对话的全息图,首次实现两个AI驱动全息投影之间的生成对话;可以实时捕捉参与者的全息投影并集成到AI驱动的叙述中;具备动态个性适应的多语言能力; 无缝融合自然语言处理、语音合成和逼真的全息图等多种AI模式。

展位上由人工智能和数据副总裁Swami Sivasubramanian博士与监控与可观测性副总裁Nandini Ramani进行AI驱动的动态对话,实时响应参与者的输入指令。通过整合亚马逊云科技的无服务器架构和生成式AI模型,如Amazon Titan Image Generator和Luma AI,Proto开发了一个文本到全息图的管道,可以在几分钟内将文本输入转换为沉浸式全息显示。

生成式AI城市生动展示Amazon Bedrock生成式AI能力的模型都市中。一列由Anthropic的Haiku模型驱动的高速列车迅速驶来,而Sonnet模型则利用其高级推理能力调度城市复杂的交通网络和红绿灯系统。

互动区包括一个由AI驱动的影院,生成动态视频内容;一个展示内容guardrails(护栏)和知识库的Oracle应用程序;以及一个利用多模态模型和代理工作流的AI自拍站。同时,生成式AI新闻频道提供关于城市事件的实时AI生成更新。借助DREAM City演示中的元素,这一引人入胜的体验突显了Amazon Bedrock在模型导入、多模态AI和代理协调方面的多功能性。

其实在生成式AI融合之路上,亚马逊云科技端到端、完整的系统创新能力构建并非一朝一夕,但所有的技术都最终落地到应用层面,围绕客户应用需求来创新,最终的选择交给客户,这才是生成式AI技术的真正价值。


来源:DT时代

相关推荐