最新技术“强化微调”发布

摘要:想让你的AI模型秒变专家吗?OpenAI最新技术强化微调做到了,这一突破让AI领域为之沸腾。OpenAI的CEOSamAltman兴奋地表示强化微调是他今年的最大惊喜。

最新技术"强化微调"发布。

想让你的AI模型秒变专家吗?OpenAI最新技术强化微调做到了,这一突破让AI领域为之沸腾。OpenAI的CEOSamAltman兴奋地表示强化微调是他今年的最大惊喜。

这项技术通过全新的模型定制方法让开发者能用高质量任务集对模型进行微调,并通过参考答案评估模型响应。运作机制上当模型面临问题,研究者会给模型充足思考空间,随后评估其解答,并通过强化学习强化正确答案的思路,抑制错误答案的思路。仅仅十几个例子,模型就能以全新方式学习特定领域推理,展现出惊人能力。

在直播发布中OpenAI展示了强化微调在01模型上的能力,01-mini版本在推算致病基因得分上从17分飙升至31分,甚至超越了正式版01的25分。OpenAI高级副总裁Mark千直言这项技术能让小体量模型能力飞跃至专家水平,现已推出预览版,明年正式上线。

该项目旨在让开发人员和机器学习工程师创建高精度微调的专家级模型。新的模型自定义技术使得数十至数千个高质量任务都能被模型接纳与定制,并在提供的参考答案中对模型响应进行分级处理。

发布会上还看到了OpenAI的华裔面孔,如高级副总裁MarkChen和研究员Julie,他们在展示中展现了对公司的归属感。误入中文的瞬间无疑揭示了在OpenAI中华裔员工已将这里当作自己的家。OpenAI正引领我们进入全新的AI时代,期待强化微调为我们带来的无限可能。

你觉得强化微调会开启新的AI革命吗?欢迎在评论区留下你的看法。AI剪辑。

来源:今生故事馆

相关推荐