摘要:OpenAI 联创、CEO 萨姆·奥特曼(Sam Altman)此前因休陪产假,曾一度缺席自家公司新品发布会,终于在这场 AI 峰会上露面了。
第三届红杉资本 AI 峰会近日在美国洛杉矶落下帷幕,150 位全球顶尖 AI 创始人共话最前沿的 AGI 动向。
红杉资本合伙人 Pat Grady 认为,「下一轮 AI,卖的不是工具,而是收益。」这个观点最近也在 AI 圈内广为传播。
OpenAI 联创、CEO 萨姆·奥特曼(Sam Altman)此前因休陪产假,曾一度缺席自家公司新品发布会,终于在这场 AI 峰会上露面了。
半小时左右的现场专访中,奥特曼畅谈了 ChatGPT 的来时路,以及其如何演进成个人 AI 助手的构想;分享了他反逆向思维的公司管理理念;还透露了 OpenAI 后续涉及语音交互、编程应用场景、定制模型等方面的发展路线。
奥特曼接受红杉资本的专访。图片来自:YouTube
从 GPT 到 ChatGPT,只因网友太爱跟 AI 聊天
与主持人简单寒暄后,奥特曼回顾了 OpenAI 自 2015 年创办以来的发展历程,并把这 10 年拆分成了 6 个关键节点:
1.OpenAI 早期 14 人团队的第一个产品 DALL·E API(应用程序编程接口)问世;
2.该团队决定深入无监督学习领域,并由此搭建了 GPT-1、GPT-2 大模型,在此之前他们曾探索过自创游戏系统、机械手等方向的可能性;
3.大模型迭代到 GPT-3 后,他们发现如果继续烧钱升级至 GPT-4,将进入「10 亿美元模型」时代,所需资金已经远超能力范围;
4.于是 OpenAI 先后尝试通过开放 GPT-2 权重、开发 GPT-3 API,来逐步开拓营收业务,此举收获了不少硅谷创企的关注;
5.到了 GPT-3.5 时,OpenAI 的 API 已有大约 8 个应用场景;
6.受到 API 用户商业化场景的启发,OpenAI 的新产品 AI 聊天助手 ChatGPT 于 2022 年 11 月上线,其团队也持续投入到搭建「能让用户与 AI 模型对话的产品」的工作当中。
GPT-4o 版本的 ChatGPT。图片来自:OpenAI X 账号
时至今日,不到两年半的时间,ChatGPT 的周活跃用户数已超 5 亿人次。初步跑通 AI 聊天助手的商业模式后,OpenAI 也没有懈怠,最近半年内动作频频,推出 GPT-4.1 系列模型、GPT-4.5 模型、o3 和 o4-mini 视觉推理模型、基于 GPT-4o 能力的一系列音频模型、Deep Research 功能等。
当被问到「GPT-5 会超越人类吗」,奥特曼称,o3 已经非常聪明了,如果你认为自己的能力远超 GPT-3,那或许还需要一点时间。
奥特曼称 OpenAI 无大公司病,赶路一身轻
OpenAI 的产品之所以能保持着较快的更新频率,与其背后公司高层有意识减轻「大公司病」脱不开关系。正如奥特曼在此次专访中所说的,很多公司虽然规模越做越大,但产品上新、升级的效率反而有所下降。
奥特曼还进一步分享了他的团队管理思路,他更倾向于拥有一个「小而精」、「小而美」的团队。「自古以来就有个说法,一个好的高管,一定是一个忙碌的高管」,他说道,类似地,团队内的每个人手头都应该有很多事情做,每个人都有着高价值和高影响力,这样一家公司才能一直有所成长,而不是停滞不前。
他也毫不留情地调侃道:
否则,公司里会有很多人坐在房间里,为一些无伤大雅的产品细节开会、争吵,或高谈阔论其他事情。
OpenAI 关键人物。图片来自:CNN
而且,在他看来,这套理论对于当前大公司的 AI 转型困境也同样适用。
奥特曼称:「大企业在变革中总是落后,很多初创公司已经远远超越了他们。这是由于大企业通常受限于僵化的流程,比如每年才开一次安全委员会,而这种速度根本跟不上 AI 领域的变化。」他对此感到「失望」,却「不意外」。
同时他认为,不论是智能手机,还是 ChatGPT 使用方式,也有着类似的代际差异,「 20 岁左右的年轻人使用 ChatGPT 的方式,和 35 岁左右的中年人完全不同,这就像智能手机刚出现时那样」。
奥特曼进一步总结道:
年轻人通常把 ChatGPT 当作操作系统来用,将其接入各种文件、为其设置复杂的提示词,甚至在做许多重要人生决定前,会先问问 ChatGPT 的意见;而年龄大一些的用户则更多是把 ChatGPT 视作谷歌浏览器的一个替代品。
目前,OpenAI 公司内部已经让 ChatGPT 负责写一部分关键性代码。未来,OpenAI 希望 ChatGPT 最终能胜任用户私人 AI 助理这一角色。
「我们希望持续做更多的事情,搭建一个重要的互联网平台,让 AI 伴随用户一生,并在不同类型的服务中都能提供帮助。」奥特曼还围绕此透露了一些可能的执行路线:
优化 ChatGPT 的核心 AI 订阅服务,不断升级模型,同时也会提供 API 或 SDK,以帮助其他人基于该平台创造更多价值;API 与 ChatGPT 相融合,成为用户处理各种事务的个人 AI 助手,通过类似 HTTP 的新协议,支持数据传输、认证和支付,可连接不同的工具和 Agent。下一步,OpenAI 将持续发力语音交互和 Agent
在公开的访谈视频中,主持人和观众多次向奥特曼询问与 OpenAI「下一步将走向哪里」相关的问题。总的来看,奥特曼提到了以下 6 大趋势:
1.语音交互:语音对于 OpenAI 来说非常重要,目前 OpenAI 的语音产品还不够好,但会持续优化,未来高质量的语音模型将会带来全新的设备形态;
2.编程能力:编程能力对于 OpenAI 来说是核心,未来模型不单单支持生成文字或图片,还能直接生成完整的程序,帮助用户执行操作;
3.模型定制:理想状态是一个小模型拥有极大的上下文窗口长度,能存储用户所有的数据和历史操作,无需再训练,这是 OpenAI 的长远目标之一;
4.传感器数据收集:有人已经把这些数据接入 API,部分场景呈现出的效果很好,最新的模型已经能较好地处理这些数据,未来 OpenAI 也会更加系统地整合这些数据;
5.API 访问:OpenAI 与学术界有合作项目,为其提供模型访问服务,从而帮助社会科学和人文学科研究者探索长期未解的问题;
6.算法开发:算法突破仍然是最高杠杆的要素,数据、算力和算法是三大关键点。
奥特曼回答观众提问。图片来自:YouTube
3 年内,AI 有望从工具人转变为研究者,甚至自主创收
奥特曼眼中的 AI 技术路线、AI 能力变革、AI 应用方向,似乎无时无刻不处于一个快速动态变化的过程之中。
他分享道,未来一年,AI 发展将主要集中在3大方面,分别是 AI 基础设施扩展,开发更聪明的 AI 模型,以及将 AI 整合到社会中。
据奥特曼判断,2025 年会是「AI Agent 承担推理工作」的一年,也可能不止于此;2026 年有望进入 AI 做出科学发现的阶段;2027 年机器人有望从研究对象变成真正的经济创造者。
OpenAI放弃用「终点」找「路径」
当然,未来的一切都是未知且富于变化的。与采用逆向工程规划公司发展的选择不同,在奥特曼这里,通过「倒推」、「从果溯因」的方法来敲定一家公司的长期发展战略,并不是一种明智的选择。
奥特曼直言:「历史上很少有人通过这种倒推的方法实现成功。」OpenAI 不追求所谓的终极战略,而是灵活应对当下状况,不断调整策略,持续产出更好的模型和产品。换而言之,OpenAI 这艘游艇更倾向于因时而动,顺势而为。
此外,当谈及 OpenAI 计划融资 400 亿美元、公司投后估值或达 3400 亿美元的传闻时,奥特曼并没有透露更多相关内容,但也没有直接否认。
奥特曼完整访谈视频入口:
https://www.youtube.com/watch?v=ctcMA6chfDY
来源:爱范儿一点号