OpenAI官宣新一代最强模型o3有啥亮点？

摘要：oba正式发布了新一代的模型叫o3unproview，正式发布的可能要到明年。在昨晚的凌晨ai第十二天直播里面公布了open ai的o3模型，三个月前刚刚公布了o1模型，这次又直接跳过了o2，也公布了o3。

oba正式发布了新一代的模型叫o3unproview，正式发布的可能要到明年。在昨晚的凌晨ai第十二天直播里面公布了open ai的o3模型，三个月前刚刚公布了o1模型，这次又直接跳过了o2，也公布了o3。

这样的模型公布完之后在一些社交媒体上基本上就沸腾了，什么原因？目前o3的模型特别是在代码能力上得到了一些突飞猛进的进展，包括了一些做一些数学题目，基本上达到博士级别，以o1模型又得到了进一步的提升，提升幅度是非常大的。一起来看一看o3的整理。

首先它是公布了对软件工程师来讲是比较难的，它有一个测试机叫swebench测试机，这个测试机应该是软件工程考试的测试机，非常难的。记得之前大模型出来的时候大概只有零点几，百分之一都不到。o1模型proview出来之后大概得分是在四十一点三，这次o3模型已经达到了七十一点七，很厉害，又比o1模型比三个月之前的模型又增长了百分之三十，特别厉害。

还有一个比较猛的是什么？公布了一个叫cold force的全球是俄罗斯非常著名的写代码竞赛的平台叫cold force，也看了一下，之前也没关注到，有这样一个榜单的全球会把最牛逼写代码的这些人都会做竞赛。

目前o3的得分达到了两千七百二十七分，相当于整个榜单的一百七十五名，在全世界来看基本上已经超过了百分之九十九点九九的人写代码的能力，硬是很oppo的非常强。在o1大概在一千两百五十八分到了o3模型，能力肯定是超过了据专家水平。

之后又公布了一些数学竞赛的比赛叫aiem二零二四年和博士级的科学考试叫gpqadiamond，数学方面的能力虽然没有编程进化的这么猛，但是也是挺厉害的。在这个方面的能力基本上比之前的o1pro的模型又得到了比较大的提示，原来五十六点七，现在是九十六点七。

原来preview的博士的考试大概是七十八分，现在大概是在八十七分，又增长了十分。特别是在一些比较难的数学上面，又做了一个让o3模型又做了一个有全世界六十多个顶尖数学家联合开发的测试评估级叫research match，之前大概模型的能力有二，就一百分里面只有两分，现在达到了二十五点二分，率是非常高的。