深度|微软CTO最新访谈: 我不相信通用Agent,未来是成千上万Agent协作的时代,聊天界面只是过渡的交互模式

360影视 欧美动漫 2025-04-19 18:32 3

摘要:我不认同那种 “一个Agent搞定一切” 的理论,会出现大量Agent。因为产品经理很可能得成为某一个领域的专家。他们需要深入了解所在领域的特点,帮助建立反馈闭环,让协助人们完成任务的Agent能够更好地工作。

图片来源:20VC

编译:Dean Liu

原视频:Kevin Scott, CTO @ Microsoft:An Evaluation of Deepseek and How We Underestimate the Chinese

https://www.youtube.com/watch?v=KN7KYzpPfiU

Z Highlights

如果你有创业精神,那么当下就是最好的时代。

我能清晰地看到我们目前正在做的事情,也期待着接下来的工作,而且scaling law没有到达极限。

我不认同那种 “一个Agent搞定一切” 的理论,会出现大量Agent。因为产品经理很可能得成为某一个领域的专家。他们需要深入了解所在领域的特点,帮助建立反馈闭环,让协助人们完成任务的Agent能够更好地工作。

未来一年会出现更多这样的情况:你给Agent安排一个任务,它就会在你不关注的时候去执行。

从人们对DeepSeek的反应来看,大家似乎惊讶‘这竟来自中国’——这本不该让人意外。

20VC,全名The Twenty Minute VC,是全球最受欢迎的创业投资主题播客之一,Harry Stebbings是其创始人

Kevin Scott,现任微软CTO兼人工智能执行副总裁。下文是Harry和Kevin关于AI Agent的对话。

Al的可持续价值,谁将获益最大

Harry Stebbings:Kevin,我真的特别期待这次交流。我刚还跟你说,我跑步的时候听了你和Schrep的节目,我得把所有节目都听一遍。非常感谢你能来,我边跑步边听,一心二用,但还是被深深吸引了。我从来没这么快跑完10公里。我先问个特别简单的问题,作为风险投资人,我的工作是在不同时刻判断价值所在。看看如今的世界,很长时间以来,我第一次感到迷茫。我的问题是,在下一代AI领域,你认为可持续的价值在哪里?

Kevin Scott你刚才描述的情况,也就是突然之间事情变得没那么明朗了,这正是每次重大技术范式转变和由此驱动的新周期开始时都会出现的情况。在互联网发展初期,情况就非常混乱,移动互联网早期也是如此。那时候,每个人都对什么有价值有自己的想法,但实际上,能经得住时间考验的想法少之又少。

Harry Stebbings:在这种充满困惑的转型时刻,你认为正确的做法是什么?是积极行动、不断迭代并从中学习,即便会犯下许多让自己后悔的错误?还是静观其变,看着别人犯错?

Kevin Scott绝对不要选后者。所以说,如果你有创业精神,现在就是最好的时代。在这种时刻,你不能忘记从过去的经历中学到的成功经验。这不是说要去做某件具体的事,而是说要知道如何去探索。就像我过去几年一直说的,product matters,模型不是产品。

每个人都对基础架构本身太着迷了,而且这也是这类周期开始时的一个特点,技术人员往往会沉浸在技术细节中,却忘了真正重要的是打造出优秀的产品。我们现在就处于这样的阶段,必须打造出优秀的产品。你要有想法、有信念,然后迅速付诸行动,这样才能知道自己的信念到底有没有价值。在周期刚开始的时候,你没什么模式可以借鉴,不能看着别人成功了,就想着 “我照着做,再改进一点点就行”。你得去探索全新的东西,而唯一的方法就是推出产品、收集数据、不断迭代,并且要对自己看到的情况保持极度清醒,不能因为太喜欢自己的想法,就忽视了数据和反馈。

Harry Stebbings:你说模型不是产品,我刚请了Cerebras的Andrew上节目,也问了他这个问题。我问他,如果考虑算力或者说硬件、模型和应用程序这几个方面,价值天然地体现在哪里?他说是算力。但当你思考这三层价值体系,而且你又说模型不是产品,这是不是意味着模型没有价值呢?

Kevin Scott不不不,模型非常有价值,但只有通过产品把它们和用户需求联系起来,模型的价值才能体现出来。从根本上说,产品才是最重要的。如果你构建了优秀的模型,围绕模型搭建了良好的基础架构,拥有高效的计算能力,具备所有这些条件,你就有很多机会将这些进行货币化。因为人们在开发产品时,会需要使用你的平台和基础架构,这些都很好。但大部分价值还是体现在产品上,我们构建基础架构可不是为了基础架构本身,而是为了让人们开发产品。

Harry Stebbings:问一个引导性问题:再进一步想,如果考虑这些产品,谁受益最大呢?是那些能轻松从底层开始集成新技术、白手起家的初创公司,还是已经将AI融入强大分发渠道的微软,亦或是同样这么做的谷歌?从受益的角度来看,谁收获最多呢?

Kevin Scott回顾过去的周期,你会发现价值创造在初创公司、新创企业和现有企业中分布得很均衡。所以大家都在做类似的事情,如果你是像微软这样有悠久传统、在市场上已经有诸多成功产品的大公司,你要做的就是弄清楚,基于你现有的深厚知识储备,以及你一直服务得很好的客户群体,如何利用新的能力为他们创造更多价值。我负责微软研究院等事务,我的一项任务就是尝试探索那些无人涉足的领域,发现具有颠覆性的全新事物。但这也是初创企业生态系统的任务。

我也是一名天使投资人,会给初创公司提供建议,也在初创公司工作过。有众多人才去探寻那些有趣的新事物非常重要。在我们正在经历的AI平台转型过程中,我对此深信不疑。因为像微软或其他任何大公司,都不可能拥有足够的想象力和视野,去知晓所有有趣的事物。所以,有这样一个充满活力的生态系统,众多人去探索价值所在,既令人兴奋,又十分必要。而且如今的工具、基础架构和平台前所未有的廉价、易获取、易用。现在人们很容易就能上手并开启探索之旅。

Scaling Law有极限,但不是现在

Harry Stebbings:我之前听了你的节目,你反驳了 “即将达到scaling law的极限” 以及 “效率或效能的某种渐近线” 这类观点,很多人都认为我们很快就会触及scaling law的极限。你为什么觉得不会呢?

Kevin Scott这种说法太荒谬了。我能清楚地看到我们现在在做什么,也知道接下来要做什么,我没看到scaling law有什么极限。

就拿模型的原始能力来说,以及如何让它们更好地对越来越复杂的事物进行推理,我凭直觉感觉在某个时刻肯定会存在极限。不过有些人认为不存在极限。他们觉得人类的智力极限是由颅骨中的神经元数量和大约20瓦的能量消耗决定的,但AI没有这样的限制,AI的能力会不断拓展,进入不可思议的领域。

我不太认同这种观点,我们最终会达到一个scaling law渐近点,届时边际收益会递减,而且成本会高到让我们觉得,再花一美元让模型变得更智能一点并不值得,因为我们还没搞清楚这对使用工具的人有什么实际用处。那个点会到来,只是现在还没看到,目前还不在我们的视野范围内。

Harry Stebbings:当我们考虑构成这方面效率的三个核心要素,即数据、算力和算法时,深入研究数据,你对数据效率有什么重要发现?数据质量和数量哪个更重要?合成数据和人工数据又该如何看待?

Kevin Scott如今,合成数据的占比越来越高,高质量数据在模型生产流程的训练后环节变得更加有用,相比之下低质量数据就没那么重要了。可以说,现在如果具备合适的基础架构,拥有高质量数据和专业人员提供的高质量反馈,就能将其转化为训练更大模型所需的优质数据token,这些数据的价值远远超过那些在网络上随处可见、没有区分度的数据token。

Harry Stebbings:关于数据及其使用,我们有哪些想知道却还不清楚、但了解后会非常有帮助的问题呢?

Kevin Scott目前有个很有趣的现象,我们缺乏数据评估手段。很难从量化的角度判断某一数据token对使用它进行训练的模型质量有多大提升。也就是说,如果你觉得自己的数据非常有价值,认为它用于训练模型会让模型变得更好,大多数人做出的这类断言其实并没有科学依据。

现有的测量结果表明,一些人认为有价值的数据,与它实际对提升模型能力和实用性的贡献之间存在很大差距。很多人把模型当成事实信息的存储库,把它们当作世界上最糟糕、最昂贵的数据库来使用,但这并没有太大用处。我们有搜索引擎索引和数据库,这些在检索信息方面已经足够好用了。我们希望模型能够对信息进行推理,给它提供信息后,要看它能在多大程度上基于这些信息进行推理,从而做出对我们有用的事情。所以,为了让模型擅长推理,训练时所需的数据token和让它记忆事实时所需的数据token是不同的。

DeepSeek:推理or使用、开源or闭源

Harry Stebbings:你提到推理的时候太有意思了,这让我想到了 “推理”(inference)这个词,我特别不喜欢这个词,真希望我们能直接把它删掉,用 “使用” (usage)来代替。模型就两个环节,训练和使用。我想问你,你明确指出了过去几年重点从训练向推理转移,在推理方面,我们有哪些没有讨论或关注到、但需要进一步思考的问题呢?

Kevin Scott大多数人都忽略了一点,不过几周前DeepSeek R1的发布让大家有所察觉。在过去几年里,我们在优化模型性能方面取得了惊人的进步,而且这种进步是逐年持续的,模型推理的性能也因此变得越来越好。随着时间推移,模型越来越大,API调用的成本却越来越低。这一方面可能得益于每一代硬件在性价比上能带来2倍左右的提升,运气好的话会更多,但软件层面的优化带来的性价比提升要大得多,这方面有大量的工作在进行。DeepSeek R1的成果很不错,你可以把它看作是性价比提升曲线上的一个点,可能其他人没注意到,但那些深度参与系统优化的人肯定清楚。而且这不是终点,它还会继续向前发展。

Harry Stebbings:DeepSeek R1发布时,你们内部是什么看法?公众的反应有没有出乎你的意料?

Kevin Scott我们有比DeepSeek R1更有意思的模型,甚至都没选择发布。我很惊讶大家对DeepSeek R1这么感兴趣,他们的工作做得很好,别误会,这是扎实的技术成果,而且他们选择发布并开源,真的很有意思,看到公众对他们的成果反应这么热烈,感觉很奇妙。

Harry Stebbings:从这次发布后公众的反应中,你有没有学到什么,可以应用到自己产品发布上的经验呢?

Kevin Scott即便你已经竭尽全力让大家能轻松、低成本地去使用产品,但人们还是有很强的偏好。我们得更加注重产品的使用方式,因为开发者希望有更多选择。

Harry Stebbings:在过去12到24个月里,你有没有曾经坚信、现在却不再认同的观点,或者想法有了什么转变?

Kevin Scott我读研究生的时候,是个彻头彻尾的开源狂热者。但随着年龄增长,我变得更加务实。与其单纯为了满足好奇心做选择,不如从实际出发,考虑如何构建产品,这可能更重要。

Harry Stebbings:展望未来3到5年、3到10年,你怎么看待开源和闭源的发展趋势?哪种会占据主导地位呢?

Kevin Scott两者都会大量存在。先不说当下争议较大的AI领域,就拿行业结构来说,它还没有稳定下来,我们也不确定未来会怎样。就以搜索为例,有很多开源搜索引擎项目,想要在应用中添加搜索功能,或者自己开发搜索引擎的人有很多选择。他们可以选择开源项目作为起点,也可以使用像Azure认知搜索这样的搜索即服务平台,谷歌和亚马逊也有类似的平台,这些都很容易获取。同时,像必应和谷歌这样的搜索引擎也依然存在。搜索领域的经济效益都流向了那些搭建大规模基础架构、运营搜索业务并形成反馈闭环的公司。所以在AI领域可能也会出现类似的情况。在基础架构层面,会有很多开源产品,人们会以各种方式使用它们。但也有很多人不想从头搭建自己的基础架构,或者在开源项目无法满足需求时对其进行拓展。生活在一个两者兼备的环境中是很不错的。

Agent重构未来:产品范式、团队形式、交互模式

Harry Stebbings:你之前提到产品的核心地位,结合我们现在的讨论,聊天界面是不是未来产品领域下一个范式的正确选择呢?OpenAI和ChatGPT让聊天界面成了默认选项,你觉得这个默认选项有多正确,未来又会发生哪些变化呢?

Kevin Scott这是朝着正确方向迈出的合理一步。多年来我一直说,AI领域最有意思的一点是,自Ada Lovelace编写第一个程序以来,近200年里,我们使用计算设备的模式基本没有变过。如果想让计算设备为你做些什么,要么你自己是程序员,这对很多人来说门槛很高;要么就得依赖程序员提前预见到你的需求,把软件打包成应用程序供你使用。

但现在有了AI,情况就不一样了。它能理解你希望计算设备做的事情,还能找到实现的方法,而且你不需要成为程序员。这是一个意义深远的变化,虽然这不会在明年就实现,但也用不了10年。

以前那种模式,需要大量团队去细致地预测用户在某些狭窄领域的需求,然后编写大量代码,再想办法把代码融入用户体验中,他们还得寄希望于自己能准确预测需求、设计出合适的用户界面并且保证代码无误,然后不断打磨反馈闭环。这种模式将会改变,虽然不会完全消失,我们仍然需要这些应用程序提供的各种功能,但以后可能会通过某种Agent来实现这些功能,而不是像现在这样,在用户期望和产品团队的设想之间进行别扭的适配。

Harry Stebbings:在如今的工程或产品团队中,有没有哪些角色,你觉得20年后人们回顾时会感到不可思议?就像以前有秘书帮医生把语音记录的笔记打出来那样。

Kevin Scott工程师的角色以后还是需要有人构建功能基础架构,让这些在现实世界中得以实现,比如提供对某些特殊信息库的访问权限,这些都是人们需要构建的功能。但展示这些功能的用户界面很可能会是Agent。还有产品经理,我不认同那种 “一个Agent搞定一切” 的理论,会有很多Agent。原因是产品经理很可能得成为某个领域的专家,比如深入了解医学、药物研发、早期风险投资等领域,他们需要深入了解这些领域的特点,帮助建立反馈闭环,让协助人们完成任务的Agent能够更好地工作。有点像产品经理和用户共同教会Agent如何更好地协助人们完成任务。

Harry Stebbings:我常常觉得,我们在短期内高估了新技术的采用速度,而在长期内又低估了它。看到大家对Agent这么狂热,我也很兴奋,但我对短期内,甚至未来3年内一些大公司会采用Agent表示怀疑。你觉得我这种观点有几分道理,还是说你认为这波Agent浪潮有所不同,尤其是考虑到微软这样的公司的影响力?

Kevin Scott使用情况总是取决于实用性。如果产品有用,就会被广泛使用。以软件开发Agent为例,现在它的应用越来越广泛。以前开发者对这类工具还持怀疑态度,现在却爱不释手,觉得这是他们工具包里最重要的工具之一,绝对不会舍弃。Agent的功能也越来越强大。

Harry Stebbings:这里面存在用户锁定的情况吗?我和人们聊起Agent时,大家确实很喜欢,但都说没有用户锁定,随时愿意换用其他产品。这对Agent的价值有什么影响呢?

Kevin Scott搜索领域就不存在用户锁定,你随时可以换个搜索引擎进行下一次搜索,但你并没有这么做。我们开发Agent的人要不断努力,日复一日地让Agent变得更好,为用户创造更多价值。只要你做得足够好,用户就会继续选择你。

Harry Stebbings:5年后人类和Agent的交互模式会是什么样的吗?

Kevin Scott现在Agent明显的不足是缺乏记忆,这使得它们的事务性很强。即便有些Agent有记忆功能,也非常有限。

未来一年左右,Agent的记忆功能很可能会有很大提升。这意味着当你使用Agent时,它能记住越来越多你和它过去的交互信息,从而更好地适应你的偏好。它还能做到我们自然而然会做的事情,比如解决完一个问题后,把解决方案记录下来,下次就不用再从头开始解决。有了记忆功能,Agent就能进行某种抽象和组合,随着时间推移,它可以基于过去的行为和学习不断积累,从而拥有更强大的能力。

我相信未来Agent的事务性和会话导向性肯定会减弱。我希望未来12个月能看到更多异步操作。现在的交互方式非常即时,你给Agent发送一个提示,它会立即做出反应,然后给你回复,好像在说 “我完成了”。未来一年会出现更多这样的情况:你给Agent安排一个任务,它就会在你不关注的时候去执行。我们不能忽视Agent的发展方向,第一代Agent擅长处理5分钟以内的任务,下一代可能擅长处理5分钟以上的任务。我们希望未来能把越来越复杂、越来越重要的工作交给Agent,就像交给同事一样。这就是我对未来的设想,这也是大家的期望,是Agent能力的发展方向。

那么,如何围绕这个几乎确定的未来方向开发产品呢?需要给这些系统增加哪些功能,才能让它们更好地实现我们最终想要的效果呢?你肯定不希望Agent只是个优秀的邮件摘要工具,你可能希望告诉它 “我每天早上5点起床,请在每天早上5点整理好昨晚收到的所有邮件,起草紧急邮件的回复,在我喝咖啡的时候展示给我”,这应该是完全可以实现的。

Harry Stebbings:关于Agent,你经常听到人们有哪些错误的看法呢?

Kevin Scott我经常听到一些怀疑论者说这很难或者不可能实现。他们可能错了,但也不是只有我这么认为,很多乐观主义者都相信技术会越来越强大。有怀疑论者很正常,但我不知道他们这么质疑有什么实际意义。我有个同事写了本书,叫《悲观主义没有奖赏》,确实是这样。如果你只是怀疑某件事,却不采取任何行动,我不知道这样能得到什么。

Harry Stebbings:我记得是谁说过 “悲观主义者往往是对的,但乐观主义者才能赚钱”。我们提到软件开发是目前应用最广泛的领域之一,展望未来5年,你认为新增代码中有多少会由AI生成,多少会由人类编写呢?

Kevin Scott95%的新增代码将由AI生成,很少会有人逐行编写代码。但这并不意味着AI就能取代软件工程的工作,在创作方面,更重要、更有意思的部分仍然要由人类完成。

Harry Stebbings:在一个你不是输入大师,而是提示词大师的世界里,创作意味着什么呢?

Kevin Scott这其实是提高了抽象层次。以前,在AI出现之前的35到40年里,情况大多是这样的。我12岁开始写程序,从事编程已经41年了。

我12岁的时候,也就是80年代,大家大多用高级语言编写代码,但在机器上运行的并不是高级语言,甚至也不是汇编语言,而是汇编语言指令经过机器编码后的指令集,这些指令在电路中运行。其实没人会抱怨说“我不是……”,当然,在从汇编语言编程过渡到高级语言编程的阶段,确实有过这样的情况。有些守旧的人会说,如果你不会用汇编语言编程,那你就不是真正的程序员,只有用汇编语言才是真正的编程,这才是正确的做事方式。但现在没人再这么说了。

这和当下的情况类似。就像近20年来出现的图形用户界面构建工具,当你在Xcode里设计iPhone应用程序时,你不用编写所有代码,只需在屏幕上拖动各种用户体验元素,系统就会为你生成大量模板代码。在我看来,这是同样的趋势,我们在提高抽象层次,改变程序员与机器沟通的界面,让他们能表达 “这里有个问题需要解决”。我还认为,现在那些极其优秀的程序员,即便使用的是高度抽象的工具,他们也能深入理解底层原理。如果程序出了问题,他们可以深入到机器代码层面,查看开发环境生成的模板代码,捣鼓一番就能找出问题所在。当大部分代码由AI生成时,情况很可能也是如此。最优秀的程序员肯定能做到,即便代码是由AI生成的,但如果感觉哪里不对劲,他们也能深入到较低的抽象层次去排查问题。

Harry Stebbings:在一个能用纯提示词创建简单网站的世界里,每个人都是程序员吗?

Kevin Scott是的,但这并不意味着每个人都在解决同样的编程难题。这其实提升了每个人的能力水平,让每个人都能成为程序员,你不再需要找人帮你做网站。但如果你想解决世界上最难的计算问题,还是需要计算机科学家。他们能熟练运用这些工具,去攻克以往难以解决的难题。

Harry Stebbings:未来工程团队的结构会发生根本性变化吗?

Kevin Scott会的,但可能和人们想象的方式不太一样。我猜,也希望小团队能更容易做出大事情。这很重要,因为小团队比大团队行动更快。10个充满激情的优秀工程师,配上强大的工具,就能发挥出巨大能量。

AI能力超预期,有望消除技术债务

Harry Stebbings:你有什么最想做,但受规模、决策流程等因素的限制无论如何都无法做到的?

Kevin Scott规模问题通常会给科技公司带来两个麻烦,这确实意味着有时候你会比预期的速度慢。有时候慢是必要的,但有时候慢只是规模大带来的副作用。

Harry Stebbings:你哪里想慢哪里想快?

Kevin Scott我一直都希望能更快,我希望能有更多产品问世。有些事情受物理规律限制,没办法加快速度。

自GPT 4发布后的两年半时间里,我们一直在飞速构建基础设施,已经达到了极限速度。但有时候还是会希望,比如混凝土浇筑的速度能再快一点,电网扩容的速度能再快点等等。

在理想情况下,我希望在微软以及其他地方,工程师们的雄心壮志、他们想尝试的好点子,都能立刻付诸实践。目前我们在微软内部大量使用AI,就是想探索如何为所有员工创造这样的条件。还有一点,如果你管理过任何规模的工程团队,就会知道一个非常棘手的问题,传统上这是个零和问题,那就是技术债务的积累。在某些时候,你几乎总会面临一个痛苦的权衡:我得赶紧推出这个产品,这就意味着我没办法把技术细节做到尽善尽美,所以我只能先发布,之后再去修复问题。但从你这么做的那一刻起,就产生了技术债务。技术债务和金融债务类似,它会产生利息,你得偿还利息。如果你不偿还技术债务和利息,迟早会遇到麻烦,因为债务会越积越多,最终导致系统出现故障。

所以,我对AI最期待的一点,就是它能把技术债务积累这个零和问题,转变为非零和问题,让我们不用再像过去那样做出艰难的权衡。大约一年前,微软研究院启动了一项重大研究计划,这个实验室的全部使命就是利用新的AI工具,大规模消除技术债务。这真的是非常令人兴奋的事情。我领导工程团队已经20年了,技术债务一直是我的死对头。

Harry Stebbings:在过去一年实施这个项目的过程中,你有什么收获?

Kevin Scott我发现AI工具的能力比人们想象的更强。总的来说,现在最前沿、能力最强的模型,它们的实际表现和人们对它们的应用之间的差距,比两年前更大了。

快问快答:从未低估中国AI

Harry Stebbings:Kevin,我感觉能和你聊一整天。如果可以的话,我想进入快速问答环节。好呀,那开始吧。第一个难题,在谷歌、Anthropic和Mattera中,你最尊敬哪个竞争对手?为什么?

Kevin Scott如果非要选一个的话,可能是Anthropic,Dario做得不错。

Harry Stebbings:你收到过的最好的建议是什么?

Kevin Scott我曾经有个导师告诉我,可以把个人或团队的能力用直方图来表示,最左边的区间代表“白痴”,最右边的区间代表“天才”,中间的区间表示“平庸”或“一般”。他的观点是,你可以把做的每件事都对应到其中一个区间。人们常犯的错误是,费了很大力气,最多只能把一件事在直方图上向右移动一两个区间。而且人们总是专注于提升自己最不擅长的事情。

按照这个理论,如果你在某件事上一开始表现很差,就算努力也最多只能达到平庸水平。而你花在提升弱项上的时间,本可以用来做自己擅长的、能发挥天赋的事情。这个建议非常好,因为任何值得做的事情,往往都需要团队协作。组建团队时,很容易做到成员之间优势互补。

Harry Stebbings:那你有意识地选择不去提升、并且确实不擅长的事情是什么呢?

Kevin Scott我不擅长的事情太多了。我对官僚主义的事情超级没耐心,我讨厌做预算、处理设施管理这类机械性的工作。作为工程团队的领导,这些官僚事务真的很让我头疼。如果我想的话,或许能成为一个平庸的官僚,但我真的很不擅长。

Harry Stebbings:我懂,授权是生活的秘诀。Satya(微软CEO)是我们这个时代最了不起的领导者之一。和他密切合作、观察他的工作方式,你最大的收获是什么?

Kevin Scott他核心的领导原则是,要同时为团队成员创造动力,并且让工作目标清晰明确。他在这方面做得非常好,他的工作很艰巨,但他总是确保交流过程中充满积极的能量,让人们在结束评审、会议或其他工作交流后,能带着满满的动力去迎接接下来的挑战。同时,他也不会只喊口号,而是会向大家明确最重要的事情是什么。

Harry Stebbings:我们之前提到了DeepSeek,我们是否低估了中国在AI领域的能力?

Kevin Scott我没有。我们真的应该充分尊重中国企业家、科学家和工程师的能力,他们非常优秀。如果有人低估了这一点,那真的不应该。从人们对DeepSeek的反应来看,很有意思的一点是,大家似乎都很惊讶,“天哪,这竟然来自中国”,但这本不该让人感到意外。

Harry Stebbings:你认为哪个AI领域的疯狂预测,虽然现在很多人觉得像科幻小说,但你坚信会成为现实?

Kevin Scott前沿模型在健康诊断方面可能已经比普通全科医生更出色了,这是我们应该尽快意识到并加以利用的事情。因为全球有很多人无法获得高质量的医疗服务,包括我在弗吉尼亚州中部农村的家人,那里的医疗条件就不太好。其实有很多类似的情况,模型的能力已经很强了,我们需要让全世界都意识到这一点,然后进行应用部署。因为我们真正关心的是公众利益,而不是维持某种现状。

Harry Stebbings:很多人都向你提过各种各样的问题,团队成员、记者等等。有没有什么问题,你觉得很重要,但却很少有人问到?

Kevin Scott“我们的发展速度够快吗?”

Harry Stebbings:你觉得我们的发展速度够快吗?

Kevin Scott不够。

Harry Stebbings:有可能更快吗?

Kevin Scott可以。

Harry Stebbings:那怎样才能更快呢?

Kevin Scott有很多方法。在我理想的世界里,我们应该大力投资教育。我希望每个孩子都觉得我们现在开发的这些新工具是为他们准备的,是他们能够使用的,专门用来帮助他们实现自己认为最重要的目标。我希望数十亿人都能利用这些工具,释放自己的创造力,做出最了不起的事情。我不希望任何人受到限制。同时,我希望在公共部门和私营部门,我们能创造一切可能的激励措施,推动这些工具的应用,解决实际问题,比如医疗保健、气候变化、教育等等。大家都认为,如果有一种技术能在当前资源稀缺的领域创造富足,那我们就应该投资发展这种技术。

Harry Stebbings:Kevin,和你聊天我真的特别开心。非常感谢你耐心回答这么多不同类型的问题,对未来进行各种探讨,你真的太棒了。感谢你在我跑步时陪伴我,这次交流太棒了。

Kevin Scott不客气,也感谢你邀请我。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料欢迎扫描二维码或访问进入。

牛津未来研究院 《将人工智能安全视为全球公共产品的影响、挑战与研究重点》

麦肯锡:超级智能机构:赋能人们释放人工智能的全部潜力

AAAI 2025 关于人工智能研究未来研究报告

斯坦福:2025 斯坦福新兴技术评论:十项关键技术及其政策影响分析报告(191 页)

壳牌:2025 能源安全远景报告:能源与人工智能(57 页)

盖洛普 & 牛津幸福研究中心:2025 年世界幸福报告(260 页)

Schwab :2025 未来共生:以集体社会创新破解重大社会挑战研究报告(36 页)

IMD:2024 年全球数字竞争力排名报告:跨越数字鸿沟人才培养与数字法治是关键(214 页)

DS 系列专题:DeepSeek 技术溯源及前沿探索,50 页 ppt

联合国人居署:2024 全球城市负责任人工智能评估报告:利用 AI 构建以人为本的智慧城市(86 页)

TechUK:2025 全球复杂多变背景下的英国科技产业:战略韧性与增长路径研究报告(52 页)

NAVEX Global:2024 年十大风险与合规趋势报告(42 页)

《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页

2025 - 2035 年人形机器人发展趋势报告 53 页

Evaluate Pharma:2024 年全球生物制药行业展望报告:增长驱动力分析(29 页)

【AAAI2025 教程】基础模型与具身智能体的交汇,350 页 ppt

Tracxn:2025 全球飞行汽车行业市场研究报告(45 页)

谷歌:2024 人工智能短跑选手(AI Sprinters):捕捉新兴市场 AI 经济机遇报告(39 页)

【斯坦福博士论文】构建类人化具身智能体:从人类行为中学习

《基于传感器的机器学习车辆分类》最新 170 页

美国安全与新兴技术中心:2025 CSET 对美国人工智能行动计划的建议(18 页)

罗兰贝格:2024 人形机器人的崛起:从科幻到现实:如何参与潜在变革研究报告(11 页)

兰德公司:2025 从研究到现实:NHS 的研究和创新是实现十年计划的关键报告(209 页)

康桥汇世(Cambridge Associates):2025 年全球经济展望报告(44 页)

国际能源署:2025 迈向核能新时代

麦肯锡:人工智能现状,组织如何重塑自身以获取价值

威立(Wiley):2025 全球科研人员人工智能研究报告(38 页)

牛津经济研究院:2025 TikTok 对美国就业的量化影响研究报告:470 万岗位(14 页)

国际能源署(IEA):能效 2024 研究报告(127 页)

Workday :2025 发挥人类潜能:人工智能(AI)技能革命研究报告(20 页)

CertiK:Hack3D:2024 年 Web3.0 安全报告(28 页)

世界经济论坛:工业制造中的前沿技术:人工智能代理的崛起》报告

迈向推理时代:大型语言模型的长链推理研究综述

波士顿咨询:2025 亚太地区生成式 AI 的崛起研究报告:从技术追赶者到全球领导者的跨越(15 页)

安联(Allianz):2025 新势力崛起:全球芯片战争与半导体产业格局重构研究报告(33 页)

IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)

IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)

CCAV:2025 当 AI 接管方向盘:自动驾驶场景下的人机交互认知重构、变革及对策研究报告(124 页)

《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页

《面向科学发现的智能体人工智能:进展、挑战与未来方向综述》

全国机器人标准化技术委员会:人形机器人标准化白皮书(2024 版)(96 页)

美国国家科学委员会(NSB):2024 年研究与发展 - 美国趋势及国际比较(51 页)

艾昆纬(IQVIA):2025 骨科手术机器人技术的崛起白皮书:创新及未来方向(17 页)

NPL&Beauhurst:2025 英国量子产业洞察报告:私人和公共投资的作用(25 页)

IEA PVPS:2024 光伏系统经济与技术关键绩效指标(KPI)使用最佳实践指南(65 页)

AGI 智能时代:2025 让 DeepSeek 更有趣更有深度的思考研究分析报告(24 页)

2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告(37 页)

华为:2025 鸿蒙生态应用开发白皮书(133 页

《超级智能战略研究报告》

中美技术差距分析报告 2025

欧洲量子产业联盟(QuIC):2024 年全球量子技术专利态势分析白皮书(34 页)

美国能源部:2021 超级高铁技术(Hyperloop)对电网和交通能源的影响研究报告(60 页)

罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)

兰德公司:2025 灾难性网络风险保险研究报告:市场趋势与政策选择(93 页)

GTI:2024 先进感知技术白皮书(36 页)

AAAI:2025 人工智能研究的未来报告:17 大关键议题(88 页)

安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告

威达信:2025 全球洪水风险研究报告:现状、趋势及应对措施(22 页)

兰德公司:迈向人工智能治理研究报告:2024EqualAI 峰会洞察及建议(19 页)

哈佛商业评论:2025 人工智能时代下的现代软件开发实践报告(12 页)

德安华:全球航空航天、国防及政府服务研究报告:2024 年回顾及 2025 年展望(27 页)

奥雅纳:2024 塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28 页)

HSOAC:2025 美国新兴技术与风险评估报告:太空领域和关键基础设施(24 页)

Dealroom:2025 欧洲经济与科技创新发展态势、挑战及策略研究报告(76 页)

《无人机辅助的天空地一体化网络:学习算法技术综述》

谷歌云(Google Cloud):2025 年 AI 商业趋势白皮书(49 页)

《新兴技术与风险分析:太空领域与关键基础设施》最新报告

150 页!《DeepSeek 大模型生态报告》

军事人工智能行业研究报告:技术奇点驱动应用加速智能化重塑现代战争形态 - 250309(40 页)

真格基金:2024 美国独角兽观察报告(56 页)

璞跃(Plug and Play):2025 未来商业研究报告:六大趋势分析(67 页)

国际电工委员会(IEC):2025 智能水电技术与市场展望报告(90 页)

RWS:2025 智驭 AI 冲击波:人机协作的未来研究报告(39 页)

未来今日研究所 2025 年科技趋势报告第 18 版 1000 页

模拟真实世界:多模态生成模型的统一综述

中国信息协会低空经济分会:低空经济发展报告(2024 - 2025)(117 页)

浙江大学:2025 语言解码双生花:人类经验与 AI 算法的镜像之旅(42 页)

人形机器人行业:由 “外” 到 “内” 智能革命 - 250306(51 页)

大成:2025 年全球人工智能趋势报告:关键法律问题(28 页)

北京大学:2025 年 DeepSeek 原理和落地应用报告(57 页)

欧盟委员会 人工智能与未来工作研究报告

加州大学伯克利分校:面向科学发现的多模态基础模型:在化学、材料和生物学中的应用

电子行业:从柔性传感到人形机器人触觉革命 - 250226(35 页)

RT 轨道交通:2024 年中国城市轨道交通市场数据报告(188 页)

FastMoss:2024 年度 TikTok 生态发展白皮书(122 页)

Check Point:2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议(57 页)

【AAAI2025 教程】评估大型语言模型:挑战与方法,199 页 ppt

《21 世纪美国的主导地位:核聚变》最新报告

沃尔特基金会(Volta Foundation):2024 年全球电池行业年度报告(518 页)

国际科学理事会:2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告(英文版)(118 页)

光子盒:2025 全球量子计算产业发展展望报告(184 页)

奥纬论坛:2025 塑造未来的城市研究报告:全球 1500 个城市的商业吸引力指数排名(124 页)

Future Matters:2024 新兴技术与经济韧性:日本未来发展路径前瞻报告(17 页)

《人类与人工智能协作的科学与艺术》284 页博士论文

《论多智能体决策的复杂性:从博弈学习到部分监控》115 页

《2025 年技术展望》56 页 slides

大语言模型在多智能体自动驾驶系统中的应用:近期进展综述

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

皮尤研究中心:2024 美国民众对气候变化及应对政策的态度调研报告:气候政策对美国经济影响的多元观点审视(28 页)

空间计算行业深度:发展趋势、关键技术、行业应用及相关公司深度梳理 - 250224(33 页)

Gartner:2025 网络安全中的 AI:明确战略方向研究报告(16 页)

北京大学:2025 年 DeepSeek 系列报告 - 提示词工程和落地场景(86 页)

北京大学:2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用(99 页)

CIC 工信安全:2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告(42 页)

中科闻歌:2025 年人工智能技术发展与应用探索报告(61 页)

AGI 智能时代:2025 年 Grok - 3 大模型:技术突破与未来展望报告(28 页)

上下滑动查看更多

来源:人工智能学家

相关推荐