OpenAI加入“降价大军”：GPT-4o音频成本下降六成

摘要：北京时间12月18日，OpenAI在第9天的直播发布上宣布，其o1大模型正式面向开发者开放，API（应用程序编程接口）现已支持功能调用。另外，OpenAI还针对语音等场景的实际需求进行了降价。

北京时间12月18日，OpenAI在第9天的直播发布上宣布，其o1大模型正式面向开发者开放，API（应用程序编程接口）现已支持功能调用。另外，OpenAI还针对语音等场景的实际需求进行了降价。

值得注意的是，今年年中以来国内AI大模型打起了“价格战”，API价格一降再降，相比之下OpenAI的API价格一直居高不下。而本次发布，OpenAI也加入了“降价大军”，其正式版o1模型的API与预览版本相比思考成本下降了60%，GPT-4o的音频成本也下降了60%。降价幅度最大的GPT-4o mini的音频价格比当前价格便宜了10倍。

正式推出o1模型

OpenAI开发者平台负责人Olivier Godement（右）、OpenAI后训练团队成员Michelle Pokrass（中）等进行直播发布

今日OpenAI的发布主要针对开发者，相比前几次发布，本次OpenAI的直播人员进行了一次“轮换”，率先登场的是该公司后训练（post-training）团队的两名成员，其公布的内容主要包括面向开发者正式发布o1正式版模型。

直播人员Michelle Pokrass表示，正式版o1模型相比GPT-4o的各项能力均有升级，包括函数调用，结构化输出、编程以及数学能力，“除了能力变化之外，正式版o1模型比预览版可以减少60%的token（直译为语句，通常作为计价单位）消耗，这意味着它对于开发者的程序来说，更快、更便宜。”

Michelle表示，虽然收到了很多开发者要求提供o1-pro的需求，但很可惜目前OpenAI还没有发布o1-pro，“我们正在实验室努力工作中，应该很快就会推出。”

针对音频场景大幅降价

OpenAI研究人员Sean（中）等进行直播发布

在本次直播的“后半场”中，OpenAI研究人员Sean主要介绍了OpenAI的实时API，并着重介绍了其构建实时语音场景中的应用，让开发者可以构建自己的ChatGPT高级语言体验。

在演示中，Sean将一枚硬币大小的微控制器装入了一个驯鹿玩具中，链接API后，驯鹿玩具就展示了流畅的实时交流能力。Sean表示，“这只是这项能力的冰山一角，想象一下，你可以把这枚微控制器装入很多地方，比如眼镜、房间摄像头和麦克风里，就可以拥有具有上下文感知能力的语言助手，只要设置Wi-Fi和token消耗，它就可以链接了，我十分期待人们能用它来做什么。”

同o1一样，GPT-4o的token消耗也下降了60%，不过其价格也进行了同步下调。“我听到了开发者们关于成本的反馈，我们正在降低成本，从现在开始，GPT-4o音频的token将比以前便宜60%，而GPT-4o-mini（迷你版本）音频的价格将比当前价格便宜10倍。”OpenAI开发者平台负责人Olivier Godement说。

此外，OpenAI还针对开发者推出了偏好微调（Preference Fine-Tuning）功能，该技术采用了一种名为“直接偏好优化（DPO）”的创新方法，通过对比不同的AI回答，让模型学会识别什么样的回答更符合用户的偏好，其目的是让AI模型的个性化定制变得更加简单和高效，更加贴合开发者的需求。

来源：新京报

标签： openai api 音频

本文地址：https://news.43u.com.cn/a/225030.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!