摘要:3月31日,微软CTO Kevin Scott接受海外播客20VC的访谈,深入探讨了AI 时代的价值定位、模型是否是产品、Scaling Law 的极限、AI Agent目前是否被高估等话题。
原创数字开物数字开物
3月31日,微软CTO Kevin Scott接受海外播客20VC的访谈,深入探讨了AI 时代的价值定位、模型是否是产品、Scaling Law 的极限、AI Agent目前是否被高估等话题。
Kevin Scott认为,模型本身不是产品,它们极具价值,但价值只有通过产品与用户需求联系起来时才能体现。绝大部分价值最终必须体现在产品上。
目前还没看到Scaling Law 的极限。当前最顶尖、能力最强的 AI 模型所具备的能力与实际落地应用之间的差距,非但没有缩小,反而比两年前更大了。
关于目前火热的 AI Agent ,Kevin Scott认为未来不存在一个 AI Agent 通吃所有场景,未来将涌现出大量的 AI Agents。 目前AI Agent一个显著的短板是缺乏记忆能力,这导致其交互模式非常事务化,侧重于单次任务处理,不过未来一年左右,AI Agent 的记忆能力将得到极大提升。未来,AI Agent的交互不会局限于一次性会话。
以下是本次访谈实录
经数字开物团队编译整理
01
在AI变革初期
价值最终体现在能满足用户需求的产品上
主持人提问:
1.在下一代AI发展中,可持续的价值在哪里?
2.在这种充满困惑的过渡时期,正确的行动是什么?是积极行动、迭代学习,即使会犯错?还是应该按兵不动,观察他人?
3.如果模型不是产品,这是否意味着它们没有价值?
4.从产品角度看,谁是最大的受益者?是初创公司还是像微软、谷歌这样的巨头?
Kevin Scott实录:事情突然之间不像以往那样清晰,这恰恰是每一次重大的技术范式转变以及由它驱动的每一个新周期开始时的典型现象。互联网发展的早期阶段非常令人困惑,移动互联网的早期阶段同样非常混乱。那时,每个人对于什么东西将会有价值都有各种各样的想法,但其中很少一部分想法是真正能够持久存在、并被一路验证下来的。
关于过渡期如何行动,绝对不应该选择按兵不动。如果你拥有创业精神,现在就是最好的时代。在这种时候,你必须做的是不要忘记从过往经验中学到的那些行之有效的方法。重点不在于要做某个具体的事情,而在于你如何着手进行探索。产品至关重要。过去几年我一直在说,模型不是产品,因为当时每个人都对基础设施本身如此着迷,这也是这些周期开始时的一个特点:技术人员完全沉醉于技术细节之中,有点忘记了唯一真正重要的事情是打造出好的产品。
这正是我们当前所处的阶段。你必须打造出好的产品,而且你必须有想法、有信念,然后你必须迅速地把事情搞定,这样你才能验证自己坚信的想法究竟是否可行。在周期开始时,几乎没有现成的模式可供你参考。你不能只是看着别人的成功说:‘好吧,我就做那个,但做得更好一点’。你是在试图探索全新的事物。而探索的唯一方法就是,你必须发布产品或服务,收集数据,进行迭代,并且对自己看到的结果要非常坦诚和严格。你不能因为太爱自己的想法而忽视来自数据和反馈中的真实情况。
关于模型的价值,它们极具价值,但它们的价值只有在你能通过产品将其与用户需求联系起来时才能体现。所以,归根结底,产品是最重要的。当然,如果你构建了好的模型,并围绕模型构建了好的基础设施,拥有良好且高效的算力,以及所有其他这些要素,你将拥有许多机会将所有这些要素变现,因为当人们打造那些产品时,他们需要使用你的平台和你的基础设施,这些本身都很有价值。但绝大部分价值最终必须体现在产品上。我们构建基础设施并非为了基础设施本身,而是为了让人们能够创造产品。
关于受益者,再次强调,如果你回顾过往的技术周期,你会发现价值创造在初创公司、新创企业和现有企业之间的分布是相当均匀的。所以,我认为实际上大家都在做类似的事情,都在试图探索未知。如果你是一家像微软这样的大公司,拥有悠久传统并且已在市场中拥有一系列成功的产品,那么你试图做的事情就是弄清楚,在你已经非常了解的业务领域,以及你已经服务得很好的客户群体中,如何利用这套新能力为他们提供更好的服务。
同时,以我负责的微软研究院为例,我有一项使命就是去探索未知的前沿领域,去发现那些可能带来颠覆性变革的全新事物。当然,这在很大程度上也正是初创公司生态系统的核心价值所在。我本人既是天使投资人,也为初创公司提供咨询,并且自己也有在初创公司工作的经历,所以我深切体会到,让更多人参与进来、共同寻觅和发掘那些有趣的新机会,是何等重要。在当前我们正经历的这场 AI 平台转型中,我对此更是深信不疑。因为任何单一组织,即便是微软这样的巨头,也不可能拥有足够的想象空间和全面的视角,去预见和把握每一个潜在的机会点。因此,拥有这样一个充满活力的生态系统,让许许多多的人去探索价值存在的可能性,我认为这是极其令人兴奋且必不可少的。而且,我认为当前的时机前所未有地成熟:相应的工具、基础设施和平台从未像今天这样,既价格低廉、唾手可得,又功能强大、简单易用。这一切都使得现在投身实践、获取资源变得异常容易。
02
Scaling Law的极限尚远
主持人提问:
1.当许多人认为我们接近Scaling Law的极限时,您为什么认为还没有到那个地步?
2.关于数据效率、质量与数量的权衡、合成数据与人类数据的使用,您最重要的观察是什么?
3.关于数据及其使用,目前有哪些关键未知问题,了解它们最有帮助?
4.在推理环节,有什么是我们讨论不足或忽视了,但需要投入更多精力思考的?
5.Deepseek R1发布时,公司内部的看法是怎样的?受关注程度如何?
6.从公众反应和那次发布中,您学到了什么可以应用于微软未来的产品发布?
Kevin Scott实录:我能非常清晰地看到我们现在正在做的事情以及下一步的计划,而且我看不到 Scaling Law 的极限。如果你仅仅考虑模型的原始能力,以及你能多好地引导它们对日益复杂的问题进行推理。我很确定,在某个时候可能会存在一个极限。
有些人不相信存在极限,他们认为人类智力的极限在于头骨容量和能量功耗,而AI没有这种限制,会持续扩展。我个人不太倾向也未必相信那种无限扩展的观点。我相信我们会达到某个点,触及一个 Scaling 的渐近线,那时只会出现边际回报递减,成本会变得极其高昂,以至于我们会决定,再多花钱让模型提升一点点智能已不再值得,因为我们还没搞清楚这点提升如何能转化成对用户有用的东西。我认为那个时刻终将到来,只是我现在还没看到它,它目前还不在我们的视野范围之内。
关于数据,数据的使用比例正在增加。高质量数据变得越来越有用,尤其是在模型生产流程的后训练阶段,其价值远超低质量数据。我们现在显然处于这样一个阶段:如果你拥有合适的基础设施,并且掌握了极高质量的数据和极高质量的专家人类反馈,你就可以利用这些高质量输入来生成用于训练更大模型的优质 Token 集合。而且,这些高质量的要素远比那些在网络上随处可见的、未经筛选的普通 Token 更有价值。
目前在数据评估方面,有一个非常有趣且我们尚未解决的问题。我们很难量化地知道,一个数据 Token 对于用它训练出来的模型质量,究竟能带来多少增量价值。换句话说,假如有人声称:‘我的数据非常有价值,如果用在模型里,模型会变得更好。’这类断言,大多数都没有任何科学依据,缺乏一套科学方法来证明。而我们现有的评估方法恰恰表明:许多人所认为的“有价值数据”,与这些数据能够赋予模型的实际应用能力之间,往往存在着巨大的鸿沟。
更重要的是,模型的绝大部分真正价值并非体现在充当某些人眼中的“事实信息存储库”上。将模型视为世界上性能最差、成本最高的数据库来使用,不仅是对其能力的极大误用,效率也极其低下。毕竟,对于信息检索这类任务,现有的搜索引擎索引和数据库已经非常成熟高效,完全能够胜任。人们真正期待模型所具备的核心能力,是对信息进行推理。因此,关键在于当模型获得信息访问权限后,它能在多大程度上基于这些信息进行有效推理,进而完成对用户有价值的任务。这就决定了,要训练模型使其擅长推理,所需的 Token 类型,与训练它仅仅作为“事实搬运工”(事实召回者)所需的 Token,必然是不同的。
关于推理,我认为大多数人忽视了一点,尽管 DeepSeek R1 在几周前的发布引起了广泛关注,但这背后其实反映了一个持续多年的趋势——那就是我们在优化模型性能方面,年复一年地取得了令人瞩目的成果记录和惊人进步,使得推理的性能表现越来越优异。因此,我们看到随着时间发展,模型规模日益增大,而 API 调用成本却在不断下降。这部分得益于硬件迭代带来的性价比提升(如果运气好的话,每一代硬件都能带来大约 2 倍的性价比提升) ,但更大幅度的性价比提升,源自我们在软件栈层面所做的全部优化工作。这方面确实投入了海量的工作。DeepSeek R1 本身的工作做得相当出色。我们应该这样理解它的意义:它更像是我们在这条持续提升性价比的道路上达到的一个新节点。这条进步路线或许未被大众普遍看见,但对于那些全情投入优化这些系统的人而言,它是清晰可见的。而且,这绝非终点,技术进步的脚步从未停歇。
关于 DeepSeek R1 的发布反响坦诚地说,我对公众对 DeepSeek R1 的反应感到有些惊讶。因为我们内部其实有一些比它更有意思的模型,但我们选择不发布。所以在看到大家觉得 DeepSeek R1 如此有趣时,我颇感意外。当然,他们确实做得很好,那的确是扎实、出色的技术工作。他们选择发布这个模型,并使其接近开源状态。观察公众对其成果的反应,确实是一件非常有意思的事情。
这次发布也让我们认识到,即便你已经竭尽所能,将一项功能做得极其便捷和经济,用户对于具体的实现“方式”或“途径”依然有着非常强烈的个人偏好。我们正密切关注这一点。这提醒我们,必须为开发者提供比以往更多的实现选项,因为我觉得开发者们确实渴望拥有大量不同的选项。
03
开源与闭源长期共存,未来交互将超越传统应用范式
主持人提问:
1.在过去12到24个月里,您有什么曾经坚信不疑但现在不再相信的观点?
2.展望未来,您如何看待开放与封闭模式的并存与发展?哪一种会更占主导?
3.聊天这种交互形式是下一个产品范式的正确用户界面吗?它在多大程度上是正确的默认选项?我们将如何看到它的演变?
Kevin Scott实录:我读研究生的时候,可以说是个彻底的开源拥护者。但随着阅历增长,我变得务实了许多。现在我认为,对我而言,更重要的或许是围绕“如何实际构建这些技术”来做出一系列符合现实的决策,而不是像过去那样,主要为了满足个人的探索欲而进行单一维度的优化。
关于开源与闭源的未来,我认为未来开源和闭源模式会大量共存。我们可以暂时不谈当前充满争议的 AI 话题。AI 这个领域的行业格局尚未最终形成,未来具体会怎样我们还无法完全看清。但不妨以搜索这个成熟领域为例:现在市面上有许多开源的搜索引擎项目。如果有人想实现搜索功能,比如在自己的应用里加入搜索框,或是从零开始构建一个搜索引擎,他们有多种选择:可以利用一个开源项目作为起点来搭建产品;也可以将数据加载到像 Azure Cognitive Search、Google 或 Amazon 提供的搜索即服务平台中,这些服务都相当成熟便捷。与此同时,像 Bing 和 Google 这样的大型搜索引擎依然存在。你看,各种模式是并存的。而在搜索领域,几乎所有的经济利益最终都流向了那些建立了超大规模基础设施、并围绕其运营整个搜索业务、拥有自身反馈闭环的公司。因此我推测,AI 领域很可能会出现相似的局面。在基础设施层面,会有丰富的开源产品供大家选用,应用方式也会多种多样。但同时,肯定也有大量用户不希望从头搭建或维护自己的基础设施,或者不愿意基于开源项目进行二次开发来补足所需功能。所以,能同时拥有这两种选择,处在这样一个多元化的生态中是件好事。
我认为聊天这种交互形式是朝着正确方向迈出的合理一步。我近几年一直在强调,AI 领域最有趣的变革之一在于:它正在打破一个沿袭了近两百年的计算设备使用范式(自从 Ada Lovelace 写下第一个程序以来)。过去,你想让计算机为你做事,要么你得是程序员(这对多数人是高门槛),要么你得依赖程序员预先设想并打包好的应用程序。这是仅有的两种方式,直到 AI 出现。AI 的根本性改变在于:它能理解你的意图,并自主找出执行任务的方法,而你无需具备编程能力。这是一个极其深刻的转变。其深远意味在于——虽然我不认为明年就能完全实现,但也可能无需十年,传统的软件开发模式将发生巨变。过去那种由产品团队预测细分用户需求、编写大量代码、设计用户界面、再通过反馈循环不断迭代优化的模式,其必要性会大大降低。未来,我们仍然需要应用程序提供的各种底层能力,但用户很可能不再直接操作这些功能,而是倾向于通过某种 AI Agent 来代为执行。这将有效解决当前用户实际期望与产品团队预设想象之间存在的“阻抗匹配”问题。
04
AI Agent将成为主流交互方式,价值在于持续提升能力与记忆
主持人提问:
1.现在的工程或产品团队中,是否存在某个角色会让20年后的人们感到惊讶?
2.您认为AI Agent近期的普及速度是否会被高估?或者微软等公司的推广能力会使这一波浪潮与以往不同?
3. AI Agent是否存在用户锁定效应?缺乏锁定是否会削弱产品价值?当我和人们聊起这些 AI Agent 时,你说得对,用户非常喜爱它们,但同时每个人都会说:“哦,但是这里没有锁定效应啊,我明天就能很轻松地换用别家的产品。” 这种缺乏锁定效应的情况,在多大程度上还能说明这个产品是有价值的?
4.展望未来五年,人类与AI Agent的交互模式将是怎样的?
5.关于AI Agent,是否存在您经常听到并认为是错误的普遍看法?
Kevin Scott实录:工程师的角色依然不可或缺,我们始终需要有人来构建底层的能力与基础设施。例如,将某项功能真正在现实世界中实现,或是提供对特定信息库的访问权限等等,这些都属于需要专业人士来打造的能力。然而,未来将这些能力呈现给用户的界面,很可能会转变为 AI Agents。谈到产品经理,我同样不认同所谓的“一个 AI Agent 通吃所有场景”的理论。我认为未来将涌现出大量的 AI Agents。原因在于,产品经理自身可能需要转变为特定领域的专家,比如对医学、药物研发、早期风险投资等某一领域有深度理解的人。他们必须洞悉该领域的细微差异和特殊要求,并负责建立有效的反馈机制,促使那些辅助人类专家工作的 AI Agent 能够持续学习、精进。因此,这更像是一个产品经理与 AI Agent 的使用者们携手合作,共同“训练”AI Agent,使其在目标任务上的表现日益精湛的过程。
关于 AI Agent 的普及速度,我认为使用规模永远是价值的体现。也就是说,只要你创造出真正有用的东西,自然会得到广泛应用。这一点在软件开发领域已十分明显:AI Agent 目前正被开发者们大规模采用。我们确实见证了一个快速的转变——从最初的普遍怀疑,到如今开发者们将其视为“不可或缺”的核心工具,甚至表示“谁也别想从我手里夺走它”。而且,AI Agent 的能力还在持续增强。
关于用户锁定效应,其实,搜索领域也没有所谓的“锁定效应”。理论上,用户随时可以将下一个查询发送给不同的搜索引擎,而非当前使用的那一个。但实际上,人们通常不会这样做。这背后有品牌因素,但更深层的原因在于:持续打造卓越的 AI Agent 本身就是我们的核心职责。我们需要日复一日地投入努力,精益求精,让 AI Agent 对用户而言变得越来越好用、越来越强大、越来越有价值。只要我们能坚持做好这一点,用户自然会用选择来回应。
关于未来五年,人类与AI Agent的交互模式,我认为 AI Agent 目前一个显著的短板是缺乏记忆能力,这导致其交互模式非常事务化,侧重于单次任务处理。即使在具备记忆功能的 AI Agent 中,记忆形式也非常有限。因此,我相信即将发生的一个重要变化,并且我知道许多团队正在攻克这个难题——是在未来一年左右,AI Agent 的记忆能力将得到极大提升。
这意味着,当你与一个 AI Agent 交互时,它能通过积累过往的交互记忆,更好地适应你的偏好。它将能做到我们人类习以为常的事情,比如,解决过一次的问题,记住方案后,下次无需再从头推演。记忆甚至能赋予这些 AI Agent 一定的抽象和组合能力。你可以利用这一点,让 AI Agent 随着时间的推移,在内部构建起处理事务的更强大方法论,因为它能记住过去的经验和所学。所以我确信,AI Agent 的交互模式一定会变得不那么“事务性”,不再局限于一次性会话。同时,我期望在未来 12 个月内看到更多异步操作的实现。
目前的情况是交互性很强。你找到你的AI Agent,输入一个提示,它会立刻执行并返回结果,告诉你:“是的,我完成了”。我认为未来一年,你会更多地将任务委托给 AI Agent,让它在你未加关注时自主工作。谈及我们对 AI Agent 的期待,不应忘记最终目标。第一代 AI Agent 或许擅长处理 5 秒钟的任务,下一代擅长 5 分钟的任务。而我们努力的方向,是让它们能逐步承担起日益复杂的任务和更长周期的工作,就像你将任务委托给人类同事一样。要实现这一点,就需要思考:为了迎接这个几乎必然到来的未来,我们该如何构建产品?需要为这些系统添加哪些功能,才能让它们更好地胜任我们最终期望它们完成的工作?你肯定不只想要一个只会总结邮件的工具,你想要的是能这样吩咐它的助手:“我每天早上 5 点起床。请在我起床时处理好所有隔夜邮件,为紧急邮件拟好回复草稿,在我喝咖啡时呈现给我看。” 这应该是一个完全可以实现的目标。
关于对 AI Agent 的错误看法,我常常觉得有些持怀疑态度的人会说:“哦,这太难了,或者根本不可能实现。” 我认为他们可能错了。当然,并非只有我这样想,业界有很多乐观主义者相信技术能力会持续进步。存在怀疑论者本身没什么问题。只是我不太理解他们在这其中有何利害关系。我有一位同事曾写过一本书,书名大意是《悲观主义没有奖赏》 (No Prizes for Pessimism) ,事实也确实如此。我不太明白,如果你对一件事仅仅持怀疑态度,却不打算为此付诸任何行动,你能赢得什么奖赏。
05
AI将生成绝大部分代码但不会取代软件工程师
主持人提问:
1.展望未来五年,新增代码中有多大比例将由AI生成而非人类编写?
2.在一个主要通过提示而非直接输入进行创造的世界里,“创作”意味着什么?
3.在一个可以通过提示创建网站的世界里,每个人都算程序员吗?
4.未来工程团队的结构会发生根本性改变吗?
5.有什么是您非常想做,但目前因规模、决策流程等原因无法实现的?
6.在哪些方面您感觉进展缓慢,而希望能更快?
7.过去一年运行这个(关于技术债务的)项目,您有哪些收获?
Kevin Scott实录:未来,95% 的新增代码将由 AI 生成。我认为,人类逐行编写的代码将大大减少。但这并不意味着 AI 会取代软件工程师的角色。在我看来,在核心创作环节中,那些更重要、更有趣的部分,仍将完全由人类主导。
关于创作的定义,这其实只是提升了抽象化的层次。实际上,在 AI 出现前的三四十年里,我们早已接受了类似的抽象提升,这在我小时候就开始了。我 12 岁编写第一个程序,如今 52 岁,从事这个行业已有 41 年。在 80 年代,我写的代码大多是高级语言。但真正在机器上运行的,并非高级语言,甚至不是汇编语言,而是汇编指令经过机器编码后,在硬件层面运行的指令。现在,没有人会因为自己不直接编写底层代码而感到困扰——当然,历史上确实有过那样一个阶段。在从汇编语言编程向高级语言编程过渡时期,一些老派人物会说:“如果你不懂怎么写汇编,就不是真正的程序员”,并认为那才是“正确的做事方式”。现在没人再提这些了。我认为 AI 带来的将是一个类似性质的转变。
同样地,像图形用户界面 (GUI) 构建器这类已存在 20 年的技术,当你在 Xcode (Apple 的开发工具) 里设计 iPhone 应用时,你无需编写所有代码,只需在屏幕上拖拽用户体验元素,系统便会为你生成大量样板代码。在我看来,这正是同一趋势的延续。我们正在不断提升抽象层次,改变程序员与机器沟通的接口,告诉机器:“这里有个问题需要解决”。而且,我确信一点:现在那些顶尖的程序员,即使他们使用的工具抽象层次很高,他们对从底层到高层的整个技术栈都非常了解。因此,一旦出现问题,他们就能深入到机器代码,查看开发环境生成的样板代码,动手排查,找出症结所在。当代码主要由 AI 生成时,情况几乎肯定也是如此:最顶尖的程序员将能够判断:“好的,AI 生成了这些代码,但似乎有些问题,让我深入到更低的抽象层去看看。”
关于人人都是程序员,是的,我认为是这样。但这并不意味着每个人都在应对相同类型的编程挑战。这更像是提升了每个人的基础能力水平。它让每个人在某种意义上都成为了程序员,因为你不再需要雇人来帮你建网站了。然而,如果你要解决的是世界上最复杂的计算难题,你仍然需要顶尖的计算机科学家。而这些科学家将能更高效地运用 AI 工具,去攻克那些过去难以解决、更为复杂的难题。
关于工程团队结构,我认为未来工程团队的结构会改变。但可能并非以人们普遍想象的方式。我猜测并希望,小团队将更容易成就大事。这一点之所以重要,是因为我认为小团队的行动速度天然快于大团队。依靠大约 10 位顶尖且充满活力的工程师,辅以极其强大的工具,能够完成许多重要的工作。
在科技公司,规模扩张通常会带来挑战,尤其是在行动速度方面。这意味着,有时候团队的行动会比预期的要慢。某些情况下慢是必要的,但另一些时候,慢仅仅是组织规模庞大的副作用。
我一直渴望更快。希望有更多的产品能够更快地问世。当然,有些事情的速度受物理定律限制,无法逾越。例如,过去两年半,自从 GPT-4 问世以来,我们一直在以极高的速度建设基础设施,确实是在以当前可能的最快速度推进。尽管如此,你还是会希望能够加速某些环节,比如混凝土浇筑的速度、电网升级的速度等等。我希望能再快一点。但在理想世界里,无论是在 Microsoft 还是其他地方,我最期望的是:工程师的雄心壮志——他们想要实现的目标、想要尝试的好点子——与他们将其付诸实践的能力之间,不应存在任何障碍。
因此,我们目前在内部大量运用 AI 的一个目的,就是设法为 Microsoft 的所有员工消除这些障碍。此外,管理过工程团队的人都了解一个令人头疼的问题,一个传统上非常“零和”的问题,那就是技术债务的累积。你几乎总会在某个时刻面临痛苦的权衡,比如:“我必须尽快上线这个功能,这意味着技术细节无法打磨到最理想的状态。所以我决定先发布,以后再回来修复。” 做出这种决定的瞬间,技术债务就产生了。技术债务类似金融债务,会产生利息,并且必须偿还。如果不连本带息地偿还,债务会越积越多,最终可能导致系统基础设施崩溃,让你陷入困境。因此,AI 最令我兴奋的一点在于,我认为它有潜力将这个极其“零和”的技术债务累积问题,转变为“非零和”的局面。也就是说,未来或许不必再像过去那样做出艰难的权衡。大约一年前,我们在 Microsoft Research 启动了一个大型研究项目,该实验室的核心使命就是利用这些新型 AI 工具,大规模地消除技术债务。这真是非常激动人心的探索。再说一次,我领导工程团队已有 20 年,技术债务简直是我的宿敌。
关于消除技术债务项目的收获,AI 工具的能力其实比人们想象的要强得多。这种情况其实很普遍。老实说,我认为目前最前沿、最强大的 AI 模型所具备的能力,与其在现实场景中的实际应用程度相比,两者间的差距甚至比两年前更大了。
06
快问快答:中国AI非常出色
主持人提问:
1.您最尊敬的竞争对手是哪家?Google、Anthropic 还是 Meta?为什么?
2.您收到过的最好的建议是什么?
3.对于您不擅长的事情,您是否有意识地决定不去强求达到平庸水平?
4.与Satya Nadella紧密共事,您学到的最重要的东西是什么?
5.我们是否低估了中国在AI领域的能力?
6.有没有哪个关于AI的预测,多数人觉得是科幻,但您深信会成为现实?
7.有没有哪个问题您觉得很重要,但却不常被问到?
Kevin Scott实录:
关于竞争对手,如果非要选一家的话,也许是 Anthropic。我觉得 Dario 做得挺不错的。
关于最好的建议,我曾经有位导师告诉我,你可以把个人或团队的能力想象成一个直方图。最左边的区间代表“笨拙”,最右边的区间代表“天才”,而中间的区间就是“平庸”或“普通”水平。他的观点是,你可以把你做的每件事都归入其中一个区间。人们常犯的错误是,他们花费巨大努力,试图把自己不擅长的事情在直方图上向右移动一个,最多两个区间。人们总是专注于改进自己最薄弱的环节。但如果你相信这个理论,那么对于你“笨拙”的事情,通过努力最多也就能达到“平庸”的水平。而你把所有时间都用来追求“平庸”时,就意味着你没有时间投入到那些你真正擅长或者达到“天才”水平的事情上。我认为这是非常好的建议,因为所有值得做的事情,你很可能都需要和团队一起完成。而组建一个能力互补的团队其实非常容易。
关于不擅长的事,我不擅长的事情可太多了。比如说,我讨厌预算、设施管理以及作为工程领导者需要处理的各种繁杂事务。那些按部就班的流程性事务让我特别头疼。如果我愿意投入精力,或许我能成为一个还算过得去的“事务处理者”,但我真的对此一窍不通。
从Satya身上学到的,我认为他最核心的领导理念在于:必须同时为团队注入活力并明确前进的方向。他在这方面做得非常出色。尽管他的工作极其艰巨,但他总是努力营造积极的沟通氛围,希望团队成员在参与评估、讨论或任何共同任务后,都能充满动力地离开,以便更好地迎接未来的挑战。同时,他也强调不能仅仅是鼓舞士气、喊口号,还必须清晰地指出最重要的目标是什么。这两方面需要齐头并进。
关于中国AI能力,我个人认为我没有低估。我希望我们都没有。我们真的应该尊重中国企业家、科学家和工程师的能力。他们非常出色。我们不应该低估他们。如果你正在低估,那就不应该了。不过我觉得可能确实有些人之前是低估了。关于 Deepseek 引发的反响,其中一个有趣现象就是,大家似乎都非常惊讶,会说:“天哪,这居然来自中国!” 这种惊讶其实本不应该出现。
关于AI的“科幻”预测,我认为现在的情况已经是这样了:顶尖的前沿模型在健康诊断方面,可能比一般的全科医生还要出色。这是一个值得我们尽快认识到并采取行动的积极进展。因为全世界有太多人无法获得足够的高质量医疗服务,包括我在弗吉尼亚州中部乡村的家人,那里的医疗条件确实不尽如人意。类似这样的例子还有很多。这些模型的能力已经非常强了。现在需要的是让全世界都认识到它们的优势,这样我们才能着手去部署这些技术。我们要积极部署,因为我们真正关心的是公共福祉,而不是试图维持某种现状。
不常被问到的问题或许是:我们的发展速度够快吗?我认为,不够快。我们有可能更快。我认为可以从很多不同方面入手。比如,我理想中的世界是,我们能在教育上进行极其巨大的投入。我非常希望看到每个孩子都感觉我们正在开发的这些新工具是为他们而生的,是他们能够轻松使用的,是专门为了帮助他们去实现自己认为最重要的事情而设计的。我希望看到数十亿人能够利用我们每个人都拥有的创造力,配备上可能获得的最好的工具,去成就最了不起的事情。我不希望任何人感到被束缚。此外,我也希望无论是在公共部门还是私营部门,我们都在创造一切可能的激励机制,去推动这些工具的应用,从而创造实实在在的好处,无论是在医疗、气候变化、教育,还是其他任何我们觉得资源稀缺的领域。每个人的思路都应该是:如果我有一项技术,能够在目前被认为是稀缺的领域创造出富足,那我们就应该去投资它。
来源:人工智能学家