摘要:距离正式发布仅两周年,每周用户超过3亿,就是这个让全世界为AI疯狂的公司OpenAI,在圣诞节前连续12个工作日,在自家公司的办公室里搞起了直播。每天发布一点点,有点儿“挤牙膏”那味儿了。
文|A姐
编辑|李薇
12天“挤牙膏”终于结束了!
距离正式发布仅两周年,每周用户超过3亿,就是这个让全世界为AI疯狂的公司OpenAI,在圣诞节前连续12个工作日,在自家公司的办公室里搞起了直播。每天发布一点点,有点儿“挤牙膏”那味儿了。
习惯了看3分钟解读电影,看电视剧都开两倍速的你,是否真的端坐屏幕前看了一整场直播?到底这12天里OpenAI发布了哪些炸裂升级?
年底+期末,从打工人到打工人的孩儿,圣诞节?开什么玩笑,哪还有心思过节。A姐也一样不想写稿子。既然OpenAI一再升级,那必须考考ChatGPT有没有更聪明,出道题吧,让ChatGPT自己总结一下“贵司”到底都升级了什么。
这是目前输出的内容最为准确的版本。
在撇清责任这一块,ChatGPT是懂免责的(看图片最底下一行小字)。
是的,ChatGPT犯错了,最明显的就是日期,“12Days of OpenAI”是从12月5日开始的连续12个工作日,但是ChatGPT给的10个版本中,只有1个版本的日期是剔除了休息日的其他都是从5日Day1开始顺序排下来的,所以,可以看到从Day3开始,后面的日期都是错误的。
ChatGPT是懂“996福报”的,直接给自家老板上“007模式”了。
好好好!没想到A姐我这个天选打工人想摸鱼,你个“没得感情的机器”ChatGPT也跟这摸鱼。
网络上已经有不少第10-12天的发布内容了,不知道出于什么原因,除了那个日期正确的版本总结了12天的发布内容,其他的版本都只给了前9天的总结。但是,给全12天发布内容的版本却是最不准确的——
——好像说了,好像又没说。
A姐此时暗戳戳:我要是指着你啊,早晚得被老板骂死!
手动补上Day10-Day12的发布亮点——
第10天(12月18日):在美国与ChatGPT进行语音对话的免费电话号码(1-800-CHAT-GPT),在WhatsApp集成了基于文本交互的ChatGPT功能。
第11天(12月19日):用户可以使用MacOS上的桌面应用程序来查看和自动化他们的ChatGPT工作。使用“使用应用程序”按钮,用户可以使用更多编码应用程序,比如,BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio等。
第12天(12月20日):推出最新型号o3,其中包括o3和o3 mini。
大大小小一堆新东西,果然还是把大招憋到了最后一天。
o1之后是o3?OpenAI解释,名称跳过“o2”的原因是Telefonica的O2电信品牌的存在,这可能会导致混淆和版权问题。
o3可以在各种基准测试中优于o1,包括数学和科学,从其在AIME 2024(一个竞争数学基准)和GPQA(一个包含生物学、物理和化学问题的博士级科学基准)上的表现可以看出。
目前,o3尚未向公众提供。也是,上面括号里的那些字都认识,放在一起也确实看不懂是什么。
O3 mini是o3系列中的新型号,将支持三种推理选项:低、中和高。在低水平上,它在Codeforces竞争代码基准上的表现与o1-mini相同,但在中高水平上,它的性能可以与o1相当。
除了内部安全测试外,OpenAI首次开放o3模型进行外部安全测试。安全研究人员可以通过在OpenAI网站上填写表格来提前访问该模型,该网站将开放到1月10日。
阿尔特曼在直播结束时表示:o3模型计划于1月底推出,完整的o3模型将在之后推出。
12天的发布让A姐印象最深的还是,Canvas和电话也可以用ChatGPT了,这两个更新才是“让世界充满AI”的理想态跟普通人更近了。
先来看Canvas。今年10月的发布的Canvas功能,改变了很多人的ChatGPT工作流程。现在,它免费提供给所有ChatGPT用户,并且还进行了一些更新。新的界面和内嵌模式,可以让素人借助ChatGPT更轻松地实现协作的写作和编码项目。
而第10天的发布才是让A姐最最最惊掉下巴的!ChatGPT被引入手持电话和WhatsApp,这一招,OpenAI让AI极大地扩大了可访问性。
当我们想到最先进技术代表的AI时,通常会联想到移动应用程序和强大的计算机。科技公司也通常会专注于最新和最伟大的平台,但OpenAI故意反向走。
在演示期间,OpenAI团队使用了从现代iPhone到复古拨盘电话的设备,证明该服务几乎适用于任何电话技术。
从现代到古早,OpenAI要的是所有用户在位置和通信渠道中保持ChatGPT的核心功能。
好吧,老板说让我下次去美国的时候给ChatGPT打个电话试试。那么问题来了:来前儿车票谁给报销?
来源:略懂的小咖一点号