深度丨Salesforce前CEO:Agent按结果付费将取代订阅制;语音交互会超过文本,成为下一代用户界面的核心

360影视 欧美动漫 2025-09-13 14:40 1

摘要:在硅谷的创业版图里,Bret Taylor 是一个绕不开的名字:曾任 Salesforce 联合 CEO、Twitter 董事长,也是 Google Maps 的缔造者之一。就在 2023 年,他选择从金字塔尖的管理岗位抽身,在 ChatGPT 发布的震荡时刻

在硅谷的创业版图里,Bret Taylor 是一个绕不开的名字:曾任 Salesforce 联合 CEO、Twitter 董事长,也是 Google Maps 的缔造者之一。就在 2023 年,他选择从金字塔尖的管理岗位抽身,在 ChatGPT 发布的震荡时刻,与老友 Clay Bavor 一拍即合,创立了新的公司 Sierra。这一次,他把赌注押在了 AI Agent——一个既让人兴奋又充满争议的赛道上。

在 Bret 看来,AI 的价值不再只是“提高效率”,而是第一次让机器能够真正独立完成一项完整的任务。Sierra 采用了与传统软件公司完全不同的商业模式:只在 Agent 成功解决问题时收费。他说,这种模式像极了 Salesforce 当年引入的云订阅,将会成为整个行业的新范式。

但 Sierra 的野心远不止于“省钱”。Bret 一再强调,AI 的真正价值在于帮助企业夺取市场份额。如果电信公司通过 AI Agent 将流失率降低 5%,整个生命周期价值模型就会彻底改写。他把这称为“客户体验的台阶式变化”,而这种变化,只有在数千万、上亿用户的超级企业里才能发挥出真正威力。

对 AI 的未来,他并不掩饰自己的乐观:语音交互会超过文本,成为下一代用户界面的核心;AGI 的标准已经被模型反复超越,未来几年甚至可能出现由 AI 推动的第一批科学突破;而“超级智能”的讨论,则提醒人类在无法理解系统时,必须用技术去监管技术。

与此同时,他也承认这个行业正在经历一场类似 90 年代互联网的泡沫。就像当年的 Pets.com 与 Amazon 并存,AI 也会有大批失败者,但长期来看,它必然会像互联网一样重塑全球经济。“一定会有人亏掉很多钱,但也一定会有人赚到很多钱。”

Bret 还直指一个常被忽视的现实:代码正在商品化,但软件不会消失。写 ERP 的代码可能变得轻而易举,但合规、维护、更新和监管这些“无聊却关键”的部分,才是企业真正愿意付钱的理由。软件就像一片草地,“你写了它,就得负责养护它”。

如今,Sierra 已经拿下数十家全球头部客户,从电信到保险,从安防到媒体。它的 Agent 能帮用户完成理赔、办理贷款,甚至在汽车抛锚时自动派出道路救援。在 Bret 心中,Sierra 的使命是成为企业与用户之间最自然的桥梁,在一个由对话驱动的未来,重构客户体验的底层逻辑。

这既是机会,也是豪赌。Bret Taylor 再一次把自己推上了风口浪尖。

主持人:

今天我很高兴能和 Bret 对话。谢谢你来上节目。

Bret Taylor:

谢谢你邀请我。

主持人:

我想从 2023 年初说起。当时你离开 Salesforce,你还是联合 CEO。能不能聊聊你当时决定创办新公司的过程?你看过哪些方向?为什么最后在那个时间点落在了 Sierra?

Bret Taylor:

我宣布离开 Salesforce 的时间,刚好和 ChatGPT 发布几乎是同一周。我不知道你相不相信“宇宙力量”这种东西,但就像每一个人,尤其是像我这样技术宅,第一次使用那样的产品时,我整个人都被震撼了。

老实说,当时我对自己离开 Salesforce 之后要做什么并没有百分之百的把握。我本来只是想先离开,再慢慢想清楚,这是人生里挺值得做的一件事。可是一旦接触到这项技术,我立刻着了迷。我每天都在用。我的朋友——LinkedIn 联合创始人 Reid Hoffman——当时给我看了 GPT-4 的早期版本,我完全不敢相信它表现出的共情能力和人类般的自然对话。虽然我关注 AI 已经很多年,但如果你在 2022 年 10 月问我“大语言模型是什么”,我大概只会一脸茫然。

后来我意识到:这种我并没有紧密跟进的技术,其实真的会改变世界。我当时只知道自己想投身其中,至于要做什么,还不确定。但那没关系。这种感觉有点像我第一次接触互联网的时候,大家都隐约觉得它会改变一切。至少我是这么觉得的,所以我很兴奋能投身其中,仅此而已。

之后,我和 Clay Bavor(我认识他 20 年了)约了一顿午餐,本没打算一起创业,但吃着吃着,我发现他和我一样痴迷。当时他在 Google CEO Sundar Pichai 手下工作。到午餐结束时,我们比原计划多点了几道菜,也顺便决定了——我们要一起创业。虽然完全不知道要做什么,但我们坚信:当一场技术的“地震级”变革来临时,会产生大量商业机会。它会重组用户的需求,企业的需求,以及软件厂商能提供的资源。

如果你回顾互联网的出现,它孕育了如今市值最大的几家公司,比如 Amazon、Google;它也冲击了微软(尽管微软挺过来了),以及 Siebel Systems 这种没能挺住的公司。技术浪潮重塑了“新势力 vs 老巨头”的格局,并开辟了巨大的新市场。互联网带来了搜索和电商,大模型也会带来类似的巨大变革。

所以我和 Clay 都辞了职,先休整了几个月,再和很多客户交流,最后决定做 Sierra。我们要打造面向客户体验的 AI Agent。从 ADT 家庭安防,到纽约的 Ramp,再到 SiriusXM,都在用我们的智能体来接电话、提供在线交互,或者和用户展开对话。它们能帮用户升级/降级 SiriusXM 的套餐,也能在 ADT 警报响起时主动打电话通知业主。这些应用场景非常令人兴奋。

Sierra 的商业模式与客户合作

主持人:

请你具体聊聊 Sierra——比如和一个新客户合作时,你们的实际流程是怎样的?能不能带我走一遍?因为这个领域虽然在客户服务里并不是全新,但你们的做法是新的。你们和客户合作的方式,和你在其他软件公司时会有什么不同?

Bret Taylor:

我先从我们的商业模式说起,因为这会帮助回答你的问题。Sierra 和传统软件公司最大的不同,是我们只为“结果”收费。

对大多数客户来说,这意味着:当 AI Agent 能够自主解决用户来电或在线对话中的问题时,我们才收取费用;如果 AI Agent 需要把问题转给人工客服,那就是免费的。

我们很喜欢这种模式,我认为它会成为未来智能体的标准商业模式。因为“Agent”一词来自“Agency”(自主权),其本质就是强调一定程度的自主完成任务。而未来最先进的智能体,都会从头到尾完成一件任务,无论是帮销售团队生成新线索,解决客户服务问题,还是为反垄断审查做法律分析。

如果一个 AI Agent 不只是帮人类提高效率,而是真正完成了一项工作,那为什么不直接为“任务完成”付费呢?就像企业里的销售岗位,薪水之外还有佣金,因为结果可衡量。所以我认为 AI Agent 按结果计费,就像给它“提佣金”,不仅能在厂商和客户之间建立一致的激励关系,而且从第一性原理上看也合理。

这很像 Salesforce 当年引入的 云订阅模式,彻底改变了软件行业。当时 Mark Benioff 和 Parker Harris 推出 Salesforce,以订阅而不是永久授权的方式收费,整个市场格局都变了。我相信智能体也会带来类似的变革。

再说到我们和客户的合作关系——当你的收入完全依赖于结果时,厂商和客户之间的关系就会彻底不同。

大多数软件厂商和客户的关系是“保持距离”的。你如果见过企业做 ERP 系统上线,就知道执行起来非常复杂:几乎所有人都告诉我,ERP 项目比预计时间多拖两年,成本也远超预算。

而在这种项目里,你去问 1 万个参与的人:系统集成商会怪软件厂商,软件厂商会怪系统集成商,最后谁都不愿意承担责任,除了那个付钱的客户。于是大家嘴上都说“没问题,一切顺利”,成功总有千百个父亲,失败却是孤儿。

问题就在于:在这种关系中,唯一真正关心结果的只有客户。系统集成商是按小时收费的,激励并不正确;软件厂商在合同签完之后也已经拿到钱了,至于部署能不能成功,就靠客户自己去消化。

所以,基于结果的定价迫使软件公司和客户之间建立全新的关系。它让厂商更有责任心,也让客户真正知道自己买到了什么。

在 Sierra,我们把重点放在两个方面:

第一是 产品可用性。如果客户要实现结果,就必须让实现过程尽可能简单。我们在市场上独树一帜,既有面向技术团队的产品,也有面向运营团队的产品。你完全可以在没有任何技术知识的情况下,构建一个 AI Agent。我们的目标是赋能尽可能多的客户体验专家。

第二是 合作支持。我们提供所谓的“Agent 开发支持”,如果客户需要帮助上线,我们甚至会“整车开过去”帮他部署(这当然是夸张的说法,但确实投入很多资源)。这种深度陪伴式的支持,也是我们的独特之处。

老实说,我还不确定最终市场会怎样演变,但我很认同这套愿景。我尤其喜欢客户清楚知道 Sierra 为他们创造的价值——因为他们只在 Agent 真正解决问题时才付费。这种关系非常简单直接,我很喜欢,也愿意坚持下去。

主持人:

所以你们现在已经有上百家客户,其中 50% 的客户年收入超过 10 亿美元,20% 的客户年收入超过 100 亿美元。对吗?

Bret Taylor:

没错。

主持人:

为什么你们会专注这些大客户?而不是采取类似 Shopify 那样的思路,去服务大量中小企业?

Bret Taylor:

很简单,大公司有大问题。我很喜欢用第一性原理思考。想象一下:如果你是一家全球性的消费品牌,拥有一亿甚至数亿用户,在大模型出现之前,你根本不可能和他们逐一展开对话。

在呼叫中心有个指标叫 “每次联系成本”(cost per contact),它衡量的是接听电话或在线客服所需的全部人工与技术成本。这取决于对话的复杂度、客服的资质,以及客服是否在本地还是外包到海外。

通常来说,接听一次电话的成本在 10 美元到 20 美元之间。而对很多消费品牌而言,他们的单个用户平均收入(ARPU)甚至比这还低。这意味着:他们根本负担不起和用户对话

这也是为什么你打电话给很多消费品牌时,要么找不到电话,要么被层层 IVR 菜单挡住。这不是因为他们不在乎客户,而是经济上不可持续。如果所有用户都能随意打电话给他们,他们会破产——这对客户也不是好事。

但现在,大语言模型彻底改变了这一点。它不仅能降低电话成本,而且是降低两个数量级。这就让客户沟通的经济模型发生了翻天覆地的变化。

所以,我们选择面向大型企业客户,正是因为这种客户体验上的“台阶式变化”,只有在数千万、上亿用户规模的公司里才真正有意义。而这些,恰恰就是全球最大的企业。

很多人一提到客户体验里的 AI Agent,会想到呼叫中心自动化,这当然是一个巨大的应用场景。但如果你换个角度思考:你现在能在同样的成本下,和用户进行比以往多一百倍甚至一千倍的对话。这意味着什么?

想想那些竞争激烈的行业,比如电信公司。市场规模有限,用户只能在几家公司之间选择。如果你能通过 AI Agent 让客户留存率提高 1 个百分点,这就是巨大的价值;如果能把流失率降低5 个百分点,你整个公司的用户生命周期价值模型都会发生根本性变化。

所以我认为,企业客户正在从两个层面看待这项技术:

第一层是直接的成本节省。没错,你可以省下客服成本,把钱返还给股东。

第二层是更高级的战略考量:能否通过改善体验来夺取市场份额。

后者才是真正令人兴奋的地方。这也是 Sierra 想要帮助全球最大品牌实现的目标。

AI Agent 是否已经能独立完成任务

主持人:

你们现在的 Agent,是否已经能够在没有人工参与的情况下,真正帮客户完成一些事情?我指的不是简单的聊天机器人,而是那些本来应该由人工来做、而且涉及经济价值的任务。能不能举个例子?

Bret Taylor:

当然。我举几个。

我们有零售客户,用户只需要上传一张损坏商品的照片,系统就能立即自动裁定保修申请,并且连接库存系统,直接发出一件新的替换产品。

在另一端,用户甚至可以在我们的平台上,通过 AI Agent 端到端地完成房屋再融资

主持人:

真的完全没有人工介入?

Bret Taylor:

对,没有人工在环。这些 Agent 的表现非常惊人。你完全可以用 Sierra 平台上的 Agent 来采取实际行动,我们 100% 的客户都在这么做。

在一定程度上,这里涉及一个 AI 技术叫 检索增强生成(RAG)。简单来说就是“基于知识库回答问题”。但现在这几乎已经成了商品化能力。把 ChatGPT 和一个知识库拼接起来,一个工程师周末就能做出来——这在三年前还像科幻小说,现在只需要一个周末。这就是技术发展的疯狂之处。

真正困难的是,把这些技术用在 高度监管的复杂流程里。我们和健康保险、医疗服务、银行、财产险与意外险公司都有合作。比如理赔流程,这就不是简单的“问答”了,而是需要合规审查的复杂对话。

那么问题来了:如何给 AI 设置 可靠的安全护栏?既要基于 AI,又要有确定性规则。还要解决一些看似细微但至关重要的技术问题,比如40 多种语言的转写准确率

你可能觉得转写里漏掉“and”或“or”无所谓,但如果漏掉的是账号号码,那后果就严重了。这就是“难点”。

再举个例子:我们有客户在做道路救援。如果你和 AI Agent 聊天时,背景突然有汽车喇叭声,很多系统会以为有人打断了它,于是中断回复——因为它没法区分“喇叭声”和“人声”。

所以,我们的平台就是为了解决这些问题:可靠的安全护栏、多语言对话(文本和语音)、确定性与 AI 双重的监管模型(supervisor models),甚至包括一些看似简单却关键的能力,比如“分辨电视背景音和真实对话”、“识别汽车喇叭而不中断交流”。

我相信三四年后这些问题都会变得简单,但现在仍然极难,这也是为什么市场对我们的产品需求非常旺盛。

语音是否会比文本更重要

主持人:

我很高兴你提到了语音。我很好奇,在你们的应用场景里,语音除了聊天之外是如何融入的?你觉得语音会不会比文本在 Agent 里占据更大的比重?

Bret Taylor:

我认为会的。事实上,在我们的平台上,语音的使用量已经超过了文本。这其实挺惊人的,因为我们才在去年 11 月上线语音功能。

原因有几个。首先,从人类的本能角度看:如果你去看未来科技的电影,或者读科幻小说,人与计算机交互的方式几乎总是“对话”。语音是最自然、最符合人体工学的界面。我们天生就会说话,不需要学习。它的摩擦很低,也非常普适。

我们常常谈到“数字鸿沟”,而如果和技术交互的方式仅仅是“开口说话”,这会让技术的可及性大大提高,尤其是在多语言支持和足够耐心的情况下。

其次,从产业现状来看:在电信、医疗保险等行业,大量的客户服务仍然依赖电话。这不仅是消费者和企业之间的沟通,甚至是医疗服务提供者与保险支付方之间的对话,也都在电话线上完成。

AI 的到来,等于把这个最古老的模拟渠道——公用电话交换网(PSTN)——第一次变成了数字渠道

过去,每一家企业几乎都有一个“数字自助服务团队”,他们的任务就是让用户尽量去用网站而不是打电话,因为那样更便宜、更快,对用户和公司都好。现在则完全不同了:你打电话也没问题,因为接电话的其实就是和你在网站上交互的同一个 AI Agent。这简直不可思议。

这就像当年互联网协议里的 TCP/IP。我们现在等于是把“互联网”放到了电话上,让电话第一次成为数字交互的渠道。

从商业逻辑上讲,有句创业界的谚语:“要做止痛药,而不是维生素。”因为人们一定会买止痛药,而维生素只是“想买”。

AI 在语音渠道的应用就是止痛药。电话客服是成本最高、效率最低的渠道,而且几乎所有人都讨厌它。即使你遇到世界上最好的客服代表,也往往是在等待了 10 分钟之后才接通。要建一个零等待的呼叫中心,经济上根本不可行。

所以,没有任何一方会为当下的电话体验辩护——消费者讨厌,企业讨厌,客服人员自己也讨厌。而现在,AI 技术能直接把这个问题解决掉。这就是为什么语音会产生巨大影响。

展望未来,我也不能确定最终会走向哪里。但它一定会很激动人心。比如在巴西和印度,WhatsApp 已经成了人们办理贷款、买保险的核心渠道。我四年前去巴西,看到有人在 WhatsApp 上办房贷,直接上传 PDF 文件。我当时都惊呆了。

如果你想象一下未来,几乎所有公司都能有自己的对话式 Agent,那也许意味着:每家公司都会有 WhatsApp 窗口来完成服务,或者也许智能音箱会重新流行起来。

再比如开车场景。CarPlay 现在很好,但你其实没法在车里做太多事。如果未来你能在开车时和 Agent 对话,帮你处理邮件,或者像一个“博士级别的私人助理”一样,随时提供服务,那会让通勤变得超级高效。

所以我觉得,这不只是经济上的变化,更是一次 全新的用户界面范式转变。我们正在让计算机真正具备“对话能力”。

顺便说一个小趣事:前几天我接电话时,下意识地把手机放到耳边。对于在线观众来说,我现在就是把手放在脸旁边做打电话的动作。直到那一刻,我都觉得这是最正常不过的。结果我的孩子看着我说:“你为什么把手机贴到脸上?好奇怪。”

那一刻我突然意识到:我真的老了。对于我们这一代人,这很正常;但对于新一代孩子来说,他们和手机的交互方式完全不同。他们从来没见过旋转拨号电话。他们成长的世界里,计算机天生就能理解人类的语言、语气、甚至讽刺,他们觉得“拥有一个能帮我做研究的个人 AI Agent”再自然不过。

我们可能还没有意识到第二层、第三层的连锁效应,但孩子的一句话已经让我感受到:整个交互习惯正在彻底改变。

模型与技术路径

主持人:

那么从技术层面来看,你们在 Sierra 是否自己训练模型?你们真正的技术“秘方”是什么?是模型本身,还是别的东西?

Bret Taylor:

我们做了大量的 微调(fine-tuning),但我们不会预训练模型。我认为大多数应用型 AI 公司都不该去做预训练。原因很简单:那是一个快速贬值的资产,投入巨大,但对股东来说未必能带来有意义的回报。

不过我们所做的,依然非常复杂。举个例子:在 Sierra 平台上,一个 Agent 回复客户的一条消息,背后可能需要调用 20 多次推理请求才能生成。

这意味着:在我们系统的底层,并不存在一个单一的模型,也不存在某种统一的“参数规模”。而是多个不同的模型、不同的供应商、不同的能力组合在一起,针对具体任务动态选择。

我认为应用型 AI 的未来就是这样。它很像数据库领域:你不会问“存储数据的正确方式是什么”,因为每个场景都有不同的数据库可选。Snowflake、Databricks、传统事务型数据库,数不胜数。一个现代的技术专家会清楚地知道:针对某个特定场景,该用哪种数据库。

我认为应用型 AI 也会走到同样的地步。这些模型会成为基础设施的一部分,而不是“通用人工智能”。有时你需要特别快的模型,有时你需要便宜的,有时你需要高质量的。在价格、性能和延迟的三维矩阵里,总能找到合适的点。

最终,这会像数据库市场一样。真正构建应用的人,不需要会“写数据库”,只需要会“用数据库”。这两者是完全不同的技能。

在应用型 AI 里也是如此。构建 Agent 的人,未必需要会预训练模型;他们只需要知道如何在不同模型之间取舍和组合。

我的直觉是:随着上下文窗口变大、模型的规则遵循度提高,微调的重要性会逐渐下降。但“基于模型构建应用”这一技能,会成为普遍的能力,就像今天你问一个开发者“会不会用数据库”一样平常。

主持人:

但我们最近也看到 GPT-5 的发布。感觉模型还在进步,但不像早期那样带来“跨越式”的变化。也许未来会变快,但你是否同意这个观点:模型正在逐渐“商品化”,差异化越来越小

Bret Taylor:

我其实不同意,不过请先把你的问题说完,刚才有点打断你了。

主持人:

不,你不同意也没问题,你还是 OpenAI 的董事会成员嘛(笑)。但我想问的是,你是否认同这样一个假设:如果模型真的变成了“基础设施”,只要能即插即用,那差异化就会越来越小。真正的变化可能是“二阶效应”。你怎么看?

Bret Taylor:

我之所以不同意,并不是因为我是“OpenAI 的粉丝”(虽然我确实是,笑)。而是因为我觉得这取决于具体任务

比如:如果有人之前用 GPT-4.0 或 4.1 写代码,然后切换到 GPT-5,他们会发现性能有显著提升。在“编程代理”这个场景里,GPT-5 带来的就是一次跨越式变化

但如果你让我用 GPT-4 去规划一次旅行,然后换成 GPT-5,差别可能没那么大。我的假期已经很棒了,也许我没提出更高的要求。但对编程场景而言,性能差异就是立竿见影的

所以我的直觉是:未来大家对模型“跨越式变化”的感受,会越来越取决于你所解决问题的复杂性

如果是规划度假行程,可能感觉差异不大;但如果是新药研发、复杂软件开发,或者复杂的异步任务,差异就会非常明显。

Bret Taylor:

如果我们谈“人工通用智能”(AGI),那当然还需要继续提升。有趣的是,我看到过一位 OpenAI 研究员 [Sebastien Bubeck] 的实验:给模型一篇数学论文,它竟然提出了一种相对新颖的解法。那种创造力,几乎像是 AlphaGo 打出“神之一手”的时刻。

所以我的看法是:虽然对很多日常任务而言,模型已经“足够聪明”;但在更高层级的科学突破、药物发现、数学难题证明等领域,我们还有很长的路要走。

Bret Taylor 如何理解 AGI

主持人:

既然你提到了 AGI(人工通用智能),我越来越觉得其实没人真正清楚 AGI 到底是什么意思。但作为 OpenAI 的董事长,你的理解尤其重要。我很想知道,你觉得 AGI 的定义是什么?在过去这一年里,你的理解有没有变化?当你说“这是 AGI”时,你的标准是什么?

Bret Taylor:

首先回答你最后一个问题——是的,我的理解确实改变了

三年前,如果你问我 AGI 的定义,我会说:我们现在已经达到了。事实上,我觉得三年前世界上几乎所有人都会认为,我们已经到达了当时的 AGI 标准。

你可能听说过 图灵测试。虽然我不知道图灵最初在论文里的原始定义,但在我计算机科学学习中,它被讲解为:如果一台机器和人类对话,你无法分辨它是不是人类,那它就算通过了。

我们其实早就跨过了这道坎。我们已经远远超越了这个标准。所以我现在的观点是:忘掉图灵测试吧。那是历史上最聪明的计算机科学家提出的想法,但如今已经过时。

为什么说标准改变了?因为我们集体对 AI 的期望,一次又一次被模型超越。过去我们心目中的 AGI 标准,已经被“反复超车”四五次了。

所以,我现在的定义是:在数字世界和知识领域里,这些模型是否已经在几乎所有领域都达到或超过人类智能?

我特意强调“数字和知识的领域”,因为我认为这和物理世界的交互是两码事。比如,你可以发明一种新疗法,但临床试验是另一套完全独立的流程。能不能动手做实验,不等于智能本身。

换句话说,我关注的是“智能”维度,而不是“物理执行”维度

此外,AGI 里的 “G” 代表 Generalization(泛化)

有些研究者认为,如果一个模型在数学上表现卓越,那它在其他领域也会表现出色,因为数学是推理的基础。但另一些研究者怀疑,它未必能迁移到生物学等其他学科。

我的观点是:只要这些能力不是通过“专项训练”得来的,而是模型的自然副产品,它们就能泛化。我更乐观一些。我觉得未来几年我们会看到模型如何向其他科学领域泛化,甚至可能带来真正的科学突破

从 OpenAI 和其他研究机构近期的进展来看,我愈发乐观。我甚至相信:第一批真正由 AGI 推动的科学发现,可能在未来几年就会出现。

当然,这问题更该问 OpenAI 的研究员们。但从我看到的早期迹象来看,这种可能性越来越强。

主持人:

那为什么像你之前的老板 Mark Zuckerberg 现在都在谈“超级智能”(Superintelligence)呢?硅谷和旧金山很多人开始用这个词。这和 AGI 有什么区别?是不是因为大家觉得“图灵测试已经过关了”,所以干脆改叫“超级智能”?

Bret Taylor:

对,这某种程度上是一次“品牌重塑”。

主持人:

哈哈,换个说法?我坦白讲其实没太懂。

Bret Taylor:

所谓 超级智能(Superintelligence),字面意思就是:它的智能超过人类

区别在于:如果某个系统和你我一样聪明,能像人一样工作,那是不是已经算“平庸”了?(笑)不针对你啊,Alex,你对我来说已经够聪明了。

但“超级智能”设定了一个更高的门槛,意味着这种智能已经远超人类平均水平,甚至在某些方面完全不可比拟。

研究与安全的角度来看,讨论“超级智能”是有意义的。因为当一个系统的推理能力超过人类时,人类无法再直接监控它。你必须用技术去监控技术

这在非 AI 领域也有先例。比如飞机、汽车上都有传感器和自动化系统,监控那些人类无法实时感知或反应过来的问题。

所以,讨论“超级智能”并不是公关噱头,而是提醒研究人员:如果你无法理解一个系统,你怎么确保它是安全的、对齐的?需要不需要一个“监督 AI”来监控它?这是技术与哲学上的重大问题。

AI 泡沫与互联网的类比

主持人:

我最近和 Sam(Sam Altman)一起吃过一次晚餐。那顿饭后来上了不少新闻头条,因为 Sam 说他认为我们正处在一场 AI 泡沫里。他原话是:“一定会有人亏掉一大笔钱,但也会有人赚到一大笔钱。

这听起来像一句经典的营销语录。

Bret Taylor:

(笑)对,就像那句老话:

“我做的营销里,50% 是有用的。”

“是哪 50% 呢?”

“我不知道。”

主持人:

哈哈。那你同意 Sam 的说法吗?

Bret Taylor:

完全同意。

我以前也讲过类似的比喻——可能你听过,抱歉要重复一下。我认为现在的情况和 互联网泡沫有很多相似之处。

当人们谈到互联网泡沫时,通常想到的是 失败的案例,比如 Pets.com、Webvan。但如果你站在 30 年后的今天回头看,你会发现:亚马逊、谷歌这样如今全球市值最高的公司,正是泡沫时代的产物。

甚至微软今天的大部分市值,也来自于云计算这种“泡沫之后”的技术浪潮。

如果你从全球 GDP 的角度来看,互联网创造或影响的经济价值几乎无处不在。换句话说,1999 年那些人对互联网的乐观预期,从长期来看其实没错——互联网确实改变了一切。

即便是当年失败的商业模式,也在后来“卷土重来”。比如 Webvan,当时太超前了,但今天我们有了 Instacart、DoorDash 这些模式成熟、生态完善的公司。想法没错,只是早了二十年

所以,互联网泡沫时期,既有 Amazon 这样的长期大赢家,也有 Webvan 这样的失败者。两者并存。

我认为 AI 也是如此。现代大语言模型必然会对经济产生巨大影响。仅仅在软件工程和客户服务这两个领域,它们的潜在价值就足以撼动整个产业格局。

过去我们一直生活在软件工程师短缺的世界里。而随着编程 Agent 的发展,这个最稀缺、最昂贵的岗位正在被规模化生产。那会带来什么样的市场?我们还没法精确测量,因为几乎每一家公司都在不同程度上变成软件公司

所以我的结论是:一定会有巨大的赢家。机会实在太多,自然吸引了巨量投资。但与此同时,一定也会有人失败。

这和互联网早期建光纤的公司很像。很多铺设光纤的企业破产了,但光纤本身被保留下来,被下一代公司或私募基金接手,继续使用。

因此,我相信两件事会同时成立:

1. AI 会像互联网一样,重塑经济,创造巨大价值。

2. 我们也确实身处泡沫,很多人会亏掉很多钱。

这两者并不矛盾,历史上也多次发生过。

企业级 AI 市场与应用落地

主持人:

那你会不会担心,泡沫其实就在你们所在的 企业级 AI 领域?比如那份 MIT 的报告,现在很多人都在讨论,里面说企业在 AI 上投入了大量资金,却没有看到相应的回报。我知道你们有不同的定价模式,更强调结果导向。但如果真有很多企业砸了钱却没产出,当这个趋势反转时,会发生什么?

Bret Taylor:

这是个好问题。我想把两个层面分开讲:

第一,我确实担心企业级市场里的泡沫;

第二,但我不认同那份 MIT 报告的结论。

我先讲泡沫风险。

很多关于我早年的故事,比如“重写 Google Maps”的那段经历,外界传得神乎其神。说一个人周末写了很多代码,结果成了伟大的产品。这个故事基本是真的,但也有些夸张,就像很多传奇故事一样。

有趣的是,现在我们已经进入一个AI Agent 能在周末完成类似工作的时代。你如果用过 Codex 或者 Cloud Code,就会发现很多任务 AI 已经可以帮你搞定。三年前这还是科幻小说,如今却成了周末项目。

这意味着什么?意味着过去大家觉得“很了不起”的事,现在变得“理所当然”。未来几年,这种转变会越来越普遍。

但这也带来一个问题:软件市场的未来会是什么样?

很多人会问我:“还值得去学计算机科学吗?” 我的答案是:值得,但也复杂。

因为写代码的过程本身,正在逐渐变成一种“商品化能力”。但软件并不仅仅是代码生成。你买一个 ERP 系统,不是因为它的代码,而是因为它有成熟的账务逻辑、可靠的季度结账流程、完备的安全补丁、合规认证……这些看似“无聊但关键”的东西,才是企业真正愿意付钱的理由。

所以我相信:AI 会改变写代码的方式,但不会消灭企业软件市场。

写 ERP 系统的代码或许变得很容易,但运营、维护、合规、更新这些“长期投入”才是真正的挑战。就像修剪草坪一样,软件是一片“草地”,你写了它,你就得负责养护它

因此我认为,AI 会改变企业软件的生产方式,但不会彻底颠覆市场的存在。

至于那份 MIT 报告,我觉得它的问题在于:它把“企业自己用 AI 搭建系统”和“购买成熟 AI 解决方案”混为一谈。

这两者完全不同。

在 Sierra,我们的客户做概念验证(POC)之后,几乎 100% 都能顺利上线并落地。为什么?因为我们卖的不是“AI”,而是客户体验。企业买到我们的平台,直接开箱即用,不需要自己做复杂开发。

还有一些像 Harvey 这样的公司(法律领域的 AI Agent),我和很多律所聊过,几乎都部署成功了。但注意,他们买的不是“AI 技术”,而是更高效的反垄断审查流程

这就是区别:买“解决方案”,和自己“造 AI 项目”,完全不是一回事。

Bret Taylor:

今天的问题是:市面上还没有足够多的成熟供应商。很多企业要么等,要么自己试着去做。但自己做,就会遇到极高的复杂度,于是出现了所谓的“AI 旅游”现象:做个漂亮的 Demo,做个 PPT,做做样子,但要真正落地,却难之又难。

我相信解决方案会来自 应用型 AI 公司。比如:

想提升客户体验,就买 Sierra;

想做法律分析,就买 Harvey;

未来供应链优化、财务审计,每个领域都会有对应的 AI Agent 公司。

这些公司会像当年的 SaaS(软件即服务)一样,成为企业应用的新一代标准供应商

所以,我不认同 MIT 的悲观结论,但我认同“市场还不成熟”。我们正在等待足够多的应用公司出现。等到几年后,AI Agent 将像 SaaS 一样成为企业的标配。

主持人:

好的,Bret,我们时间差不多了,今天就先到这里。非常感谢你接受采访。

Bret Taylor:

谢谢邀请,我也很高兴能来分享。

来源:

[1] https://www.theverge.com/decoder-podcast-with-nilay-patel/773904/sierra-ceo-bret-taylor-ai-agents-openai-bubble-interview

来源:ZFinance

相关推荐