摘要:北京时间12月18日,OpenAI在第9天的直播发布上宣布,其o1大模型正式面向开发者开放,API(应用程序编程接口)现已支持功能调用。另外,OpenAI还针对语音等场景的实际需求进行了降价。
北京时间12月18日,OpenAI在第9天的直播发布上宣布,其o1大模型正式面向开发者开放,API(应用程序编程接口)现已支持功能调用。另外,OpenAI还针对语音等场景的实际需求进行了降价。
值得注意的是,今年年中以来国内AI大模型打起了“价格战”,API价格一降再降,相比之下OpenAI的API价格一直居高不下。而本次发布,OpenAI也加入了“降价大军”,其正式版o1模型的API与预览版本相比思考成本下降了60%,GPT-4o的音频成本也下降了60%。降价幅度最大的GPT-4o mini的音频价格比当前价格便宜了10倍。
正式推出o1模型
OpenAI开发者平台负责人Olivier Godement(右)、OpenAI后训练团队成员Michelle Pokrass(中)等进行直播发布
今日OpenAI的发布主要针对开发者,相比前几次发布,本次OpenAI的直播人员进行了一次“轮换”,率先登场的是该公司后训练(post-training)团队的两名成员,其公布的内容主要包括面向开发者正式发布o1正式版模型。
直播人员Michelle Pokrass表示,正式版o1模型相比GPT-4o的各项能力均有升级,包括函数调用,结构化输出、编程以及数学能力,“除了能力变化之外,正式版o1模型比预览版可以减少60%的token(直译为语句,通常作为计价单位)消耗,这意味着它对于开发者的程序来说,更快、更便宜。”
Michelle表示,虽然收到了很多开发者要求提供o1-pro的需求,但很可惜目前OpenAI还没有发布o1-pro,“我们正在实验室努力工作中,应该很快就会推出。”
针对音频场景大幅降价
OpenAI研究人员Sean(中)等进行直播发布
在本次直播的“后半场”中,OpenAI研究人员Sean主要介绍了OpenAI的实时API,并着重介绍了其构建实时语音场景中的应用,让开发者可以构建自己的ChatGPT高级语言体验。
在演示中,Sean将一枚硬币大小的微控制器装入了一个驯鹿玩具中,链接API后,驯鹿玩具就展示了流畅的实时交流能力。Sean表示,“这只是这项能力的冰山一角,想象一下,你可以把这枚微控制器装入很多地方,比如眼镜、房间摄像头和麦克风里,就可以拥有具有上下文感知能力的语言助手,只要设置Wi-Fi和token消耗,它就可以链接了,我十分期待人们能用它来做什么。”
同o1一样,GPT-4o的token消耗也下降了60%,不过其价格也进行了同步下调。“我听到了开发者们关于成本的反馈,我们正在降低成本,从现在开始,GPT-4o音频的token将比以前便宜60%,而GPT-4o-mini(迷你版本)音频的价格将比当前价格便宜10倍。”OpenAI开发者平台负责人Olivier Godement说。
此外,OpenAI还针对开发者推出了偏好微调(Preference Fine-Tuning)功能,该技术采用了一种名为“直接偏好优化(DPO)”的创新方法,通过对比不同的AI回答,让模型学会识别什么样的回答更符合用户的偏好,其目的是让AI模型的个性化定制变得更加简单和高效,更加贴合开发者的需求。
来源:新京报