摘要:上周五晚,OpenAI的“12天12场直播”活动落下了帷幕。第一天,完整版的o1模型惊艳了全场,能直接解决奥赛级别的难题,并引发了有关教育的讨论。
,抓住风口(iOS用户请用电脑端打开小程序)
本期要点:OpenAI商业化之路还很曲折?
你好,我是王煜全,这里是王煜全要闻评论。
上周五晚,OpenAI的“12天12场直播”活动落下了帷幕。第一天,完整版的o1模型惊艳了全场,能直接解决奥赛级别的难题,并引发了有关教育的讨论。
第三天,Sora正式版亮相,所有的ChatGPT Plus用户每个月都有约50次的体验机会。但如果想要更多次地使用o1模型和Sora,或者享用更高级的功能,还要购买200美元/月的Pro会员。
但是,随后的直播内容却显得平淡无奇,包括了工作助手Canvas、o1-mini的强化微调、高级视频语音模式、与苹果的合作、“Projects”项目功能、搜索功能升级等等。
这些功能虽然也具有一定的价值,但整体给人一种“调起得太高、后面唱不上去了”的感觉。
好在,最后一天o3模型登场,再次点燃了大家的热情。o3模型在编程和数学等方面都远超前一代的o1模型。包括在ARC-AGI基准测试(一种用于评估AI大模型抽象推理能力的测试)中,o3的表现也令人瞩目。
过去各个大模型在这个测试上的评分几乎为零,o1也仅为25%左右,人类的分数约是85%,而o3的分数却达到87.5%,已经超越了人类。
虽然o3模型目前的高成本让其难以用于实际场景,但也让大家看到了OpenAI开发出更强大模型的希望,不少人甚至惊呼,OpenAI已经在通往AGI(通用人工智能)的路上了。
不过,俗话说,外行看热闹,内行看门道,我认为OpenAI的表现只能算是差强人意,甚至暴露出了自己在经营上的弱点。
首先,不可否认,o1和o3模型有很大进步,我们在实际使用中也发现,o1在回答问题的质量上也有显著提升,但客观来说这些进步仍然是在Scaling Law范围内实现的。
即使在OpenAI自己的体系之中,o1和o3也最多只能算是达到了第二层推理者(reasoner)的水平,距离AGI还有好几道槛要过。
而且,正如我们在9月份o1模型刚推出时所预测的,o1模型的推理能力,其他公司也有可能在短期内掌握。就在o1模型正式推出不久,Deepmind的Gemini也推出了类似的推理功能。
也就是说,这12天的直播充分展示了OpenAI的技术实力,o1和o3模型都很强,但它们并不会给OpenAI带来决定性的胜利。
反而,通过这12天的直播,我们可以发现OpenAI在经营上有很大的问题:
第一,讲的东西太多太杂,不清楚要对外传递什么信号,这是市场问题;
第二,在业务层面目标不清、四面出击,没有明确的商业化方向,这是战略问题;
第三,更严重的是,一味强调技术优势,但却并非不可超越,也没有在平台化和开放合作的基础上构建长期业务壁垒,这可是核心竞争力问题。
从业务的角度,在这12天里既有与苹果的商业合作成果,也有o1和o3这样的基础性研究成果,还有Sora和Canvas这样的模型应用能力展示,但OpenAI却把这一堆成果全都混在了一起。
从这种混乱的表现看来,OpenAI可能还没有想清楚自己未来究竟要朝哪个方向努力,而是在用12次炫技来展示自己的新功能,而且这些新功能都远没有达到一骑绝尘的水平,以至于公众对于OpenAI大部分的直播内容都比较无感。
在商业上,这种做法其实比较危险。
当技术并未与对手拉开显著差距,或无法广泛普及时,就将其过早公开展示,可能会为对手指明方向,甚至会给竞争对手留下可乘之机,因为当对手们迅速推出同类产品后,你的领先性会迅速减弱。
正如在年初令全球惊叹的Sora,直到最近才向公众开放,然而OpenAI所期待的热烈反响并未出现,大部分人只是简单体验一下,没有感受到其特别之处,也就没有掀起什么波澜。
原因也很简单,在这长达10个月的等待时间里,国内外已有多种视频生成模型抢在Sora之前对公众开放了,只有专业视频制作者能感受到Sora的差异。所以可以说,Sora反而让对手的视频应用得以迅猛发展。
未来,等到o3模型也向公众推出时,很可能面临同样的尴尬境况。公众仍然感受不到其厉害之处,也搞不清自己要用它来干什么,加上届时o3模型价格可能也会非常昂贵,就又会像Sora一样默默无闻。
当然,o3模型或许就是个ToB的产品,比如可以给大公司用于编程、科研、投资分析等工作,并不是给普通消费者用的。但OpenAI并未明确这一点,显得思路不清。
因为我们看到,除了苹果以外,OpenAI并没强调和有广泛用户基础的应用有什么具体合作,我们还失望的注意到,他们这次的演示也没有强调GPT Store。似乎OpenAI忽视了自己最核心的竞争力之一——构建AI生态系统的潜力。
这是个典型的技术导向、而不是市场导向的公司的做法:他们并不准备将GPT Store打造成一个开放的平台,吸引全球的开发者和企业加入。要知道,技术优势无法永恒,产业生态才是王道。通过各类开放应用让OpenAI的技术在各个领域发挥更大的作用,才应该是OpenAI这类平台公司的发展重点!
道格拉斯·恩格尔巴特(Douglas Engelbart)的“Mother of All Demos”(所有演示之母)
最后,让我们用一个故事结尾吧。
1968年,斯坦福研究院的道格拉斯·恩格尔巴特(Douglas Engelbart)在“Mother of All Demos”(所有演示之母)中,向人们展示了被称为“XY位置指示器”的鼠标、图形界面、超文本、实时协作和视频会议等一系列革命性的技术。颇像今天OpenAI的炫技。
但这些演示并未直接带来商业利益,反而是苹果公司等更加市场化的初创企业汲取了这些成果,转化为个人电脑,取得了巨大成功。
OpenAI对自身核心竞争力的缺乏理解、战略上的分散以及没有明确的商业化路径,都表明他们仍然把自己当成了一个像斯坦福研究院那样的研究机构,而不是他们希望成为的商业实体。
这12天的直播没有像恩格尔巴特的演示那么具有革命性,却像恩格尔巴特一样缺乏商业化思考,他们将注定很难利用自己在AI技术领域的领先地位获取到足够多的商业利益。也许多年后大家回忆起这次直播,也会像回忆当年的“Mother of All Demos”那样,认为他们自己的商业化虽然不成功,却启发了很多创业者吧。
当然,对于大部分人而言,这种启发是有价值的,看到更多的可能性,才能真正拥抱未来。
所以最后做个小广告,前哨AI少年冬令营开始招募了,我们针对10-18岁青少年打造了全新课程,让孩子解锁ChatGPT与AI智能体等最前沿的AI新技能,创作出出色的个人AI作品,优秀学员更有机会获得暑期实习机会。
王煜全要闻评论,我们明天见。
【科技特训营】看懂科技产业,离不开长期观察。线上书院模式,与王老师深度链接!为未来五年做好准备,先人一步,看清未来!
来源:王煜全一点号