奥特曼采访回应“偷走”吉卜力!套壳OpenAI也能成为大生意

360影视 欧美动漫 2025-04-08 17:00 3

摘要:在这场访谈中,OpenAI CEO 奥特曼接受了印度博主兼开发者 Varun Mayya 的专访,聊到了多个当前 AI 技术从业者最关心的话题:包括最近火爆出圈的 GPT-4o 图像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地

刚刚,奥特曼又有了一个新采访!干货满满。

在这场访谈中,OpenAI CEO 奥特曼接受了印度博主兼开发者 Varun Mayya 的专访,聊到了多个当前 AI 技术从业者最关心的话题:包括最近火爆出圈的 GPT-4o 图像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地路径等等,甚至还有他本人对 AI 带来失业焦虑的思考。

画个重点,本次采访亮点有:

GPT-4o爆火,“现在生成的图像数量远远超过了我原本以为互联网有的需求。我们很快就会突破十亿张总图像的里程碑。”谈到“一键生成吉卜力”、宫崎骏"反对AI”的争议话题,奥特曼表示AI会带来内容创作的民主化。“当然,它也带来一些负面影响,也确实改变了艺术形式本身。但从整体来看,这是进步。”“套壳”也会产生了不起的生意,OpenAI也是从这种贬低中成长起来的“他们说你们不过是个小研究实验室,迟早会被 Google 碾压。你们只是把点子包装一下,真正的价值会被视频平台拿走、被大公司抢走。”对于编程自动化问题,重要的是“提效”而非AI完全接管编程工作:“你说完全 100% 自动化,能构建一个复杂系统而完全不碰代码——这是一种情况。但我更关注的是“程序员效率提升10倍”这种事情。我认为今年或明年就可能发生。”不过,编程仍然是OpenAI的Agent瞄准的方向。奥特曼表示,“代码领域将会成为一个重要突破口。”

以下是经过整理的播客访谈全文,为了方便阅读,顺序略微调整:

主持人:女士们先生们,我现在与 Sam Altman 在一起。Sam,最近我看到你发了不少推文。他们以前叫“posts”,现在又改叫“Xs”。我都不知道现在该叫什么了。

奥特曼:我也不知道他们现在叫啥。

主持人:反正你最近发了不少关于印度的内容,也发了很多关于新版图像生成的内容。首先我得说,我有幸提前试用了那个图像生成工具,真的非常棒。从情绪板制作、生成图片、到UI设计,体验都非常出色。而且这个工具还很智能。

我们做了个特别聪明的用例——我们让它生成一个3D模型的正面图,然后再让它生成左侧视角、右侧视角和背面视角,再把这些图像扔进另一个模型中生成网格,并把这些贴图重新映射上去。我们甚至还能让它生成高度图。想想几个月前这些还不存在,现在居然做到了,真的太震撼了。现在的用户反响如何?有没有什么数据可以分享?

奥特曼:我不确定能不能分享具体数字,但我可以说,我们现在生成的图像数量远远超过了我原本以为互联网有的需求。我们很快就会突破十亿张总图像的里程碑。

主持人:哇哦,那可是个巨大的数字。你有没有看到什么特别有创意的用法?除了把自己变成动漫风之外。

奥特曼:让我觉得特别兴奋的是各种各样的创意用例。当然,最开始火起来的是把自己变成动漫角色,但后来我看到人们创造了很多我以前完全没想过的新类型图像,真的很惊喜。当然,也有很多很棒的商业用途,比如小企业用它来做新Logo、平面设计等等。但最打动我的是那种纯粹的创造力——人们用它做出了前所未有的图像,这真的让我很激动。

主持人:太棒了。我还想聊聊另一个方面,就是UI和设计类工作。我们原本以为这些工具一发布,就能代替我们完成大部分工作。但实际上,在我们公司,我们还有很多视频剪辑师和平面设计师。结果发现我们还是需要人来操作这些工具——因为人类仍然需要负责任,需要维持上下文,某种程度上相当于这些工具的“经理”。你觉得这就是工作的演变路径吗?你有没有观察到类似现象?或者说你对未来工作的变化有怎样的看法?

奥特曼:我觉得这会因职业而异,有些工作可能会完全消失,由AI端到端完成。但大多数情况是,人们有了新工具后,工作效率更高、质量更好。比如,依然会有人负责让网站看起来很棒,只不过大家对网站“好看”的期待会提升,结果是我们所有人都能看到更好的成果。也许内容产出还会变多,在这样的世界中,对这类工作的需求可能会更高。然后还会出现一些全新的职业,这是我们现在还没见过的。

主持人:你现在有没有一些例子?

奥特曼:比如一些客户支持类的工作,我认为AI已经能端到端完成了,那属于我刚才提到的第一类。至于第二类——我们刚刚在说的平面设计师的例子——审美仍然非常重要。

你知道的,平面设计师以前用纸笔做设计,后来有了电脑工具,他们能做得更多、更好。我们仍然需要优秀的平面设计。现在我们又有了新工具,它显然会改变设计师的工作流程,一些原本有人付钱的任务,现在可能不会再有人付钱。

在我看来,未来依然会有“让这个网站好看”的岗位,也许从业人数减少了,但他们收入更高;又或者从业人数变多了,因为我们突然能做出更多网站了。也许这个世界原本对平面设计的需求就远比我们承受得起的高——这方面我们现在还不好说。

还有一种是全新的工作类型,第一个例子就是“Prompt Engineer(提示工程师)”。在AI出现之前,根本不存在这个职位。甚至很难想象有这么一种职业。现在有很多这样的例子,但这个对我来说最亲切。

主持人:确实很有意思,每当这些新职业出现时,总是先被人嘲笑。比如那些做“套壳”(rapper)的人,我们后面会聊到。就算是“提示工程师”,很多人现在也不当回事。大家觉得只是写写英文而已。你会为这个职业辩护吗?有没有什么方法能让这些刚进入这个领域的人不觉得自己在“掉价”?

奥特曼:我小时候就知道我想学计算机编程,可是我身边的大人都说,那就是个爱好,不是正经职业。那时候他们觉得电脑没前途,非得去当医生、律师这种“稳定职业”才算正经。他们觉得学编程是条危险的路。但我当时觉得我理解了一些他们不懂的事。我真心鼓励大家相信自己的判断——就算某个工作在过去不是高地位、被认可的,也不代表它将来不会变得有价值。这就是科技进步的方式。

主持人:你以前写过一篇博文,叫《被误解的勇气》(The Strength to Be Misunderstood),我超喜欢那篇。那篇文章真帮了我很多。你是很多年前写的,我当时刚决定做内容创作者,那时候这个职业地位也不高。

奥特曼:说到你的工作,我记得大概十年前吧,我会去和年轻人聊创业。我喜欢问他们觉得哪些行业最有意思,因为年轻人的观点往往不一样,而且往往是对的。当时很多人说他们想做YouTuber。我当时一脸懵逼,心想:啥?但那一刻我意识到:我不能像别人以前否定程序员那样,去否定他们。

主持人:我还想提另一个最近在网上争议比较大的话题:宫崎骏的那个视频。那个视频当然是被断章取义了——他在看一个很早期的模型动画,一个怪物在扭动,他说“我不喜欢这个”。作为一个从业几十年的艺术家,我能理解他的感受。我们创作图像或视频的过程,曾经需要付出大量努力,现在却变得简单多了,有时反而有点失落。

作为艺术家,这种变化多少有点让人沮丧。但作为一个创业者,要养团队、发工资,我又觉得这项技术非常有价值,它帮我提升了效率,减轻了压力。你怎么看艺术的变化?我们该如何看待它?

奥特曼:想象一下三十年前你想做你现在做的事情,那几乎是不可能的。你需要一个摄像机、VHS录像带,还得想办法剪辑,这些步骤都很复杂。就算完成了,还得自己去分发录像带,因为当时还没有YouTube,网络也很差。但现在,世界上任何人只要有一部智能手机,就能拍摄并上传视频。如果他说的内容有趣,全世界都能看到并受益。

我认为内容创作的民主化对社会是个巨大好处。当然,它也带来一些负面影响,也确实改变了艺术形式本身。但从整体来看,这是进步。我非常相信科技的力量,它可以赋予所有人更多工具,降低门槛,让更多人有能力为社会做贡献,最终大家都能从中获益。是的,它可能会导致一些工作消失,也让原本凭技能吃饭的人面临更多竞争。但总体来说,这是社会的福祉。

我自己的亲身经历是看到创业门槛的变化。以前创业需要很多资金和资源,但后来这些门槛都被削弱了,特别是像 AWS 的出现,这是其中最重要的转折点之一。

另一个大变化就是互联网的普及。再加上 Y Combinator 从 2005 年起所推动的一种潮流——年轻、有技术背景的创始人突然可以更容易地创办公司了。这带来了大量的新产品和新技术,造福了整个世界。当然,被这些公司竞争掉的传统企业可能不太高兴。但从世界公民的角度来说,我们确实拥有了更多可能性。OpenAI 本身也是一个例子——我们这个小团队能做出这样的事,只是因为技术栈的准入门槛大大降低了。

我同意,特别是像 Stripe 出现之后,还有在印度,UPI 的普及,让新的公司、新的产品激增。以前很多事因为繁琐的流程根本做不起来。我猜设计领域现在也开始出现类似的变化。

主持人:说到 Y Combinator,我想请你戴上“20岁版本的你”的帽子——假设你回到当年,知道现在所有的一切,有人劝你别去做“GPT套壳”(rapper),因为 OpenAI 迟早会干掉你;也有人说基础模型没用,套壳才是能赚钱、能融资的东西。在这样的辩论下,你会怎么做?

奥特曼:你只是在做套壳”这种说法,其实以前在别的领域也常见。有人也说过,“你只是建立在 AWS 上的一个套壳”,类似的评论也不少。

但现在,人们基于 AI 正在建立非常了不起的新公司。大多数公司会失败,或者发展一般,但有些会找到持久的商业模式,创造巨大的价值。这一直都是世界的运行方式——大多数初创公司都会失败,但少数成功的会极其成功。所以,把所有东西都简单 dismiss 掉,说它们只是套壳,听起来好像很聪明,但实际上完全错了。我记得人们以前对 OpenAI 也有类似的说法。

主持人:他们当时都说了啥?

奥特曼:他们说你们不过是个小研究实验室,迟早会被 Google 碾压。你们只是把点子包装一下,真正的价值会被视频平台拿走、被大公司抢走。这些话还是一两年前说的。我觉得,有些话听起来酷又老练,像是能看透一切。但要建立伟大的公司或投资它们,最关键的一课是:不要被这种“伪聪明”的观点带偏。所以如果我是现在在 YC 的 20 岁年轻人,有人说我做的是 GPT 套壳,我反而会觉得:嘿,我可能走在了正确的方向上。

主持人:那你有没有具体的想法?如果你不是在 OpenAI,而是一个普通创业者,手上有 50 万美元,你会做什么?

奥特曼:出于原则,我一般不回答这种问题。因为我最在意的是:大家不要去复制别人的创业点子。

我自己想出来的创业点子,说不定都挺“平庸”的。而某个现在正在写代码的 20 岁年轻人,提出一个听起来荒谬又“烂透了”的想法,说不定那才是下一个 OpenAI。我不希望我抛出一个“中规中矩、与现实脱节”的想法,让别人因此放弃自己疯狂又独特的创意。所以我的建议是:去做你那个疯狂的点子。如果你觉得它对,那它就值得尝试。

主持人:就像你必须做你真正热爱的事情,否则你永远也造不出 Snapchat。因为在第一天,所有人都会说这想法太烂了。太棒了 Sam。

主持人:我们前几天刚和你们的 CPO Kevin 做了一期播客,他跟我说代码自动化会在 2025 年实现。Anthropic 说是 2027 年,他说不,我们能更快,可能 2025 或 2026。那你怎么看?你觉得什么时候“写代码=写英文”会变成现实?还是说根本不会?

奥特曼:我觉得更重要的问题是“自动化的程度”。如果你说完全 100% 自动化,能构建一个复杂系统而完全不碰代码——这是一种情况。但我更关注的是“程序员效率提升10倍”这种事情。我认为今年或明年就可能发生。

主持人:就是说程序员效率提升10倍。其实现在已经提升了好几倍了吧?我身边用上 AI 的人,效率已经提升得很明显了。

奥特曼:有些人说是提升了2倍、3倍,但我还没听到有多少人说达到了10倍这种程度。

主持人:但你觉得明年就可能达到这种“质变”?

奥特曼:预测,特别是带有时间表的预测,总是很难。但我觉得我们可以把目标定在那里。

主持人:你知道这里面其实也有些负面因素。比如 Daniel Gross 曾经写过一篇文章,说印度有 2500 亿美元的出口是 IT 服务。站在这个角度想,有一天这些服务可能会被 GPT-4 或 GPT-5 的 token 替代。对印度来说,那 2500 亿非常重要。而这些工程师中,不是所有人都能成为高端工程师,从而从这项技术中受益。有些人只是做简单的 CRUD 应用,但他们面临来自“使用 AI 的10倍程序员”的竞争。而且那些工程师的成本可能更低,因为 token 本身就便宜。你觉得印度该怎么做,才能在这个过程中保持相关性?

奥特曼:我觉得这是一个非常重要的问题。从整体来说,我相信世界对代码的需求远远超过了我们现在的供给。我的看法是,世界非常渴望更多的软件,而现在正好到了爆发的时候。如果你给人们这些能大幅提高效率的工具,那些原本只能产出一定价值的开发者,将能创作出更高价值的产品。当然,他们要为 AI 支付一部分费用,所以不能独占全部价值,而且代码的市场价格可能也会下降。但我愿意打赌,这就是“杰文斯悖论”的又一个例子。

主持人:所以说,虽然单价会降,但需求也会同步提升,是吧?

奥特曼:我认为是这样的。

主持人:听你这么说还挺让人安心的。

奥特曼当然,不是所有行业都会这样。但代码这一块,我确实是这么判断的。

主持人:我们现在也能看到一些早期的智能体(Agent)了。比如 DeepResearch,真的挺棒的,但它还是偏被动,不会自动读取我的卡片并执行操作。像 DeepResearch 风险较低,但我们也看到你对 Agent 非常看好,很多公司也是。那么你觉得,到今年年底或明年,我们会看到哪些 Agent 的实际用例?哪些会出现在日常生活中?

奥特曼:还是用编程的例子来讲吧。你对一个编码Agent说:“我想加个新功能”,然后它自己去处理,过一会儿回来给你个 PR(Pull Request),说“搞定了”。这种事情一旦成为现实,会让人觉得非常疯狂。还有其他类别,比如让 Agent 去替你完成某些事,像是网络运营方向就已经稍微展示了这种能力。我觉得代码领域将会成为一个重要突破口。

主持人:那有没有一些消费级的用例?比如点外卖、叫车这种。

奥特曼:这些正是我认为一定会发生的事。而且,它们看起来会非常像“Agent风格”的任务。

主持人:那我再问你一个问题。假设你现在是一个普通员工,但你所在的公司是个传统企业,适应新技术很慢。他们可能试过 GPT-3,结果就觉得不过如此,后来就没再管了。如果你在这样的公司里,怎么劝都劝不动他们用新工具,你会怎么做?你会跳槽去一家动作更快但风险更高的公司吗?

奥特曼:我大概会这么做。因为我觉得不采用这些新技术的公司,以后会处境艰难。当然,有些行业可能还能撑下去。但就我个人来说,我会为自己的职业负责,我希望不断学习成长。如果我感觉自己无法接触到这些工具,那这家公司就很“坏掉”了。

主持人:有道理。那最后一个问题你就可以解放啦:你这么多年做了很多事,从 YC 到 OpenAI,也投资了不少公司。你对 AI 有什么观点是最开始相信的,但后来你的看法完全改变了?

奥特曼:我原本以为 AI 会对社会产生更剧烈的冲击。我曾经有一个非常科幻的预想,觉得 AI 会彻底颠覆一切。也许未来确实会走向那一步,但目前,它只是一个超强的工具,生活的其他部分依旧照常运转。其实我很高兴这样。我觉得这是好事,说明我当年想得太天真了。事实证明如果真发生那种巨变,也许反而是坏事。但无论如何,现在的现实和我十年前的预期大不一样,而我觉得这样反而很好。

主持人:我也觉得这样挺好。如果我们真的能拥有“神一样的技术”,能解决医疗问题,减少我们讨厌的工作,反而让我们多做喜欢的事,那一定是件好事。我也希望这项技术最终能造福所有人。

主持人:那印度有没有贡献力量?至少从你发的内容来看,印度用户非常活跃。

奥特曼:我相信印度现在是我们增长最快的市场。印度对我们来说一直都非常特别,它是最早在美国之外大规模接受AI的市场之一。现在,我几乎可以肯定,它是我们增长速度最快的市场。

主持人:哇,那真是……

奥特曼:看到这一切真的很酷。

主持人:这太疯狂了。那你看到印度用户在用AI做其他事情吗?比如深度研究?他们是愿意付费的市场吗?

奥特曼:几个月前我去了印度,那时图像生成工具还没发布。我几乎不停地听到各种用户故事,他们讲自己怎么用ChatGPT,用GPT-4做了什么。AI已经深深渗透进了印度社会,用途非常广泛。当然,也有用户反馈我们的定价对印度市场的大规模普及来说太高了。我们也在研究解决办法。可惜现在我们的算力成本仍然很高,但我们正在努力开发更高效的模型,我很乐观,未来我们能把成本降下来。

谢谢你,Sam,这次采访非常精彩。谢谢你临时抽时间做这个节目。希望印度能继续热情使用这些技术。

奥特曼:我毫不怀疑这点。我从来没见过一个国家对技术的采纳速度这么快。

主持人:太酷了。希望我们能继续做更多,也希望你能看到时间线上出现越来越多你们创造的作品。

来源:51CTO

相关推荐