Amazon Nova:向大模型“渐进式”创新say NO

摘要:但两年来,大模型的创新似乎陷入泥沼,万众期待的颠覆性并没有出现,反而逐渐进入到渐进式创新的轨道。尼古拉斯·尼葛洛庞帝在《数字化生存》中写道:渐进思想是创新的最大敌人。

2023年初,大模型的横空出世,为世界带来无比的震撼,也让我们愈发相信生成式AI会改变整个世界的运行轨迹。

但两年来,大模型的创新似乎陷入泥沼,万众期待的颠覆性并没有出现,反而逐渐进入到渐进式创新的轨道。尼古拉斯·尼葛洛庞帝在《数字化生存》中写道:渐进思想是创新的最大敌人。

正是要改变这种局面,向大模型的渐进式创新 say NO,在今年的亚马逊云科技 re:Invent大会上,亚马逊云科技发布了全新自研基础模型Amazon Nova,接过大模型时代创新的“黄色领骑衫”。

让大模型创新不再“遥不可及”

科技文明的进步,一方面依赖技术创新,另一方面则要依靠技术的普惠。只有将技术的应用成本逐渐降低,才能盘活生态,让更多的组织和人参与到广泛的技术创新当中来,才能最终推动科技文明的演进。

在大模型时代开启以来,创新的进展并没有如业界所想象的那样快,高昂的成本因素是让很多创新者望而却步的主要原因。

亚马逊云科技刚刚发布的AI 基础模型“Amazon Nova”,正在带来模型应用的技术普惠。

根据亚马逊云科技公布的数据,Amazon Nova的每百万token的输入价格低至0.0175美元,输出价格低至0.07美元‌‌!相比于业界主流的基础模型,使用成本可以大幅降低75%。

这是一次巨大的突破,为什么呢?

我们知道,决定大模型应用深度的是推理侧的发展。而大模型在处理复杂推理任务时,往往伴随更高的计算、存储的资源依赖,和更高的数据量和更精细的数据处理需求,导致模型使用的成本居高不下,限制了AI推理侧的应用创新。

而Amazon Nova在使用成本上的明显优势,在处理复杂推理任务时具有很高的成本效益,在诸如分析复杂文档、视频,理解图表、示意图,生成高质量的视频内容等应用上具备明显优势,这就减轻了模型使用者的创新成本。

当然,更高的性价比,并不代表性能更低。相反,在多项基准测试中,Amazon Nova Pro成功超越了GPT-4o,显示出其在性能上的强大竞争力‌。同时‌Amazon Nova系列模型支持任意模态输入和输出,能够处理文本、图像、视频等多种类型的数据,适用于多种应用场景

‌以性价比作为Amazon Nova的突破口,其实也并不是无的放矢。据悉,亚马逊云科技内部构建的AI应用中,开发者需要处理多种类型的数据,并且希望有更低的延迟、更低的成本、具备微调能力等。正是注意到了开发者和用户的切实需求,Amazon Nova最终以高性价比的形态,并以多样化的模型选择,来开这场基础模型应用的“普惠”之路。

面向更多场景,为大模型“瘦身”

Amazon Nova之所以是系列基础模型,是源于对用户需求的理解。

客观地说,模型并不是越大越好,由于不同应用场景对模型的需求各异,大模型并不能适用于所有情况。在选择模型时,需综合考虑任务需求、数据规模和成本效益等因素,找到最适合的模型平衡点。

大模型也要“瘦身”,针对具体任务要求,匹配不同的模型已是大势所向。

正是基于此,Amazon Nova 系列提供了六种大模型,其中包括四种基础模型,以及生成图像和视频的两种视觉内容生成模型。

首先,Amazon Nova Micro 模型就是典型的“瘦身”模型,作为一个纯文本模型,它拥有最轻的体量。可以在 Amazon Nova 系列模型中以极低的成本提供最低的延迟响应。据了解,Amazon Nova Micro模型的上下文长度为 128K 个令牌,并针对速度和成本进行了优化,在文本摘要、翻译、内容分类、交互式聊天和头脑风暴以及简单的数学推理和编码等任务上表现出色。

对于开发者的日常简单任务处理,Amazon Nova Micro模型就完全可以胜任,且速度更快,成本更低。

其次,Amazon Nova Lite 模型是一个高效且经济的多模态模型,具备强大的图像、视频和文本处理能力。模型同样以低成本著称,支持高达300k的上下文或长达30分钟的视频输入,能够快速且准确地生成文本输出。

比如在内容创作方面,Amazon Nova Lite模型能够将多媒体内容转化为文本描述,帮助用户轻松实现内容的创作和编辑。同时,该模型还能够从图像和视频中提取关键信息,并将其转化为文本形式,为新闻、广告、娱乐等行业提供了重要的应用价值。

第三,Amazon Nova Pro模型同样是一个功能强大的多模态模型,它支持处理广泛的任务,能够在准确性、速度和成本之间实现绝佳平衡。对用户而言,Amazon Nova Pro模型可以显著提升内容创作和处理的效率,支持图像、视频和文本的快速理解和生成,助力用户高效完成各种复杂任务。此外,Amazon Nova Pro还支持自定义微调,能够根据用户的数据和需求进行个性化优化,提供更加精准的响应和输出。

第四,Amazon Nova Premier模型号称是最强大的多模态模型,其特点在于能够处理复杂推理任务,具备卓越的性能和准确性。从用户的角度,Amazon Nova Premier模型可以作为“教师模型”使用,帮助用户蒸馏出定制化的专用模型,以满足特定任务的需求。

另外,两个新发布的Amazon Nova模型,分别是:图形生成模型Amazon Nova Canvas和视频生成模型Amazon Nova Reel,可用于提升宣传广告的创意。比如Amazon Nova Canvas支持生成和编辑图像,提供配色方案和布局控件,并内置有安全控件,用于可追溯性的水印和用于限制有害内容生成的内容审核。

Amazon Nova Reel可根据关键词或可选的参考图像生成6秒视频,支持用户调整摄像机运动以生成具有平移、360度旋转和缩放的视频,据悉可制作2分钟视频的版本即将推出。

站在用户视角做创新

创新的“第一性原理”要回归业务的本源和本质,并从用户需求处入手,这意为一种用户视角。

过去一些新的产品推出,总是“我能提供什么样的服务?”而站在用户视角的“第一性原理”,这个逻辑就变成了“用户需要什么样的服务?”,这其实应该是未来创新的一种思维转变。

在笔者看来,Amazon Nova系列模型,就是站在用户视角做创新的典范。

第一,通过多样化的模型系列,涵盖了文本、图像和视频生成等多个领域,使得Amazon Nova能够满足不同客户的多样化需求,无论是处理简单文本任务还是复杂创意内容生成,都能找到合适的模型。

第二,通过高性能与成本效益的平衡,拉低了模型使用的“门槛”。让更多开发者和用户有能力参与到模型推理的创新中来。

第三、在创意内容生成方面,Amazon Nova系列也展现出了强大的实力。如Amazon Nova Canvas模型能够通过文本提示生成并编辑专业级别的图像。而Amazon Nova Reel模型则提供了视频生成功能,可以创建长达6秒的视频内容。这些功能Nova在广告、营销或培训内容创作等领域拥有了广泛的应用前景。

第四、安全性与负责任的AI应用。所有Amazon Nova模型中都植入了内容审核和水印等安全措施,以防止有害内容的传播。此外,亚马逊云科技还推出了AI服务卡(Service Cards),以提供关于使用案例、限制和负责任的AI实践等信息。这些措施有助于确保Amazon Nova系列模型在应用过程中的安全性和合规性。

第五、无缝集成与便捷的开发环境。对于企业用户来说,Amazon Nova系列最具吸引力的特点之一是其与亚马逊云科技基础设施的无缝集成。通过Amazon Bedrock平台,企业可以直接对这些模型进行微调和知识蒸馏,使其更好地适应特定的业务需求。

第六、持续的创新与发展规划。亚马逊云科技在推出Amazon Nova系列模型的同时,也展示了其持续创新和发展规划。例如,计划在2025年推出Speech-to-Speech模型(语音到语音)以及Any-to-Any模型(即支持跨文本、语音、图像和视频的多模态转换)。这些新的模型将进一步扩展Amazon Nova系列的应用场景和功能范围,为用户带来更加便捷和智能的体验。

无疑,AI时代的创新将是一次漫长的过程,但我们不能因为它的周期漫长而失去创新的“爆发力”,亚马逊云科技对Amazon Nova系列模型的技术普惠,和一揽子的创新,证明了其正站在大模型创新的山巅之上。

*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。

来源:科技正能量

相关推荐