李飞飞：我不知道AGI是什么，我们应该尊重人类的能动性

摘要：近日，“AI 教母”、斯坦福大学首位红杉讲席教授李飞飞做客由美国知名风险投资家、LinkedIn 联合创始人Reid Hoffman主持的播客频道Possible，逐一回答了上述问题，并分享了她从 2009 年创建 ImageNet（AI 行业第一个大型图像识

我们如何利用人工智能（AI）放大人类潜能，创造更美好的未来？AI 为何要“以人为本”？通用人工智能（AGI）究竟意味着什么？未来 15 年可能会发生什么？

近日，“AI 教母”、斯坦福大学首位红杉讲席教授李飞飞做客由美国知名风险投资家、LinkedIn 联合创始人 Reid Hoffman 主持的播客频道 Possible，逐一回答了上述问题，并分享了她从 2009 年创建 ImageNet（AI 行业第一个大型图像识别数据库），到目前担任空间智能初创公司 World Labs 联合创始人兼首席执行官的历程。

在采访中，李飞飞还解释了为什么空间智能对 AI 的发展如此重要，以及它如何能在医学、气候和教育等领域带来突破，进而导致现实与数字之间的界限将开始变得模糊。

对于 AI 将会为人类带来怎样的未来这一议题，李飞飞从 AI 治理、政策制定与 AI 应用层面给出了具有建设性的观点。从宏观层面来说，她认为 AI 不只属于部分技术精英，而应该属于所有人，这也是她创立非营利性组织 AI4ALL 的出发点，即通过教育培养下一代 AI 技术专家、思想家和领军人物，并提高 AI 领域多样性和包容性。

在李飞飞看来，AI 的发展应该以提升人的能动性（agency）为目标，通过人与 AI 的合作赋能人类，为所有人打造一个积极的、以人为本的 AI 未来：

“人类能够创造近似‘上帝一样’的技术，从而改进我们所处的‘中世纪’式制度，并超越、或引导我们那‘旧石器时代’的情感，让它们变成创造力、生产力和善意。”

学术头条在不改变原文大意的情况下，对整体内容做了精编，如下：

Reid：很高兴见到你。欢迎来到 Possible。

李飞飞：我也是。很高兴见到你和 Aria。

Reid：是什么让你有了开发 ImageNet 的想法？比如说，“啊，我们需要这么做。”

李飞飞：我很难给出一个非常明确的时刻，但差不多是在 2006 年，当时我正在深入研究如何使用机器学习算法来理解物体和图像。无论我把目光投向哪里，我都无法回避这样一个事实，即机器学习模型存在一个数学概念，叫做“过拟合”。这是指模型的复杂性与模型所使用的数据并不完全匹配，尤其是当数据--不仅仅是数据量，而是数据的复杂性和数据量--并不能真正有效地驱动模型时。当然，并不是所有模型都是一样的。我们现在知道，神经网络模型具有更高的容量和表征能力。抛开这些术语不谈，数据与模型之间肯定存在相互作用，而我（当时）看到，在每个地方，人们都不关注数据。

我们（那时）只关注模型。就在那一刻，我突然意识到：“我认为我们不应该只关注模型，或者说，我们关注的方式是错误的。我们需要关注数据，用数据来驱动模型”。当然，就在那时，我转到了普林斯顿大学任教。我接触到了一项名为 WordNet 的工作。WordNet 与计算机视觉毫无关系但它是组织世界上各种概念的绝妙方法。而且，我也喜欢这个名字。然后顺理成章，ImageNet 也问世了。我非常强烈地相信大数据和视觉世界多元化表征的需求。

Reid：我是在你 AI 职业生涯的中点，从令人惊叹的 ImageNet 开始聊的，现在我们来谈谈 World Labs，从 ImageNet 转到 World Labs 上。World Labs 的理念是什么？你们正在构建的东西有什么是我们的未来方向、以及理解 World Labs 本身和 AI 趋势的关键部分？

李飞飞：是的，Reid，我们谈论过这个，对吧？我们最喜欢的话题——技术发展的方向。老实说，在我的职业生涯中，尤其是在 ImageNet 之后，我一直痴迷地思考一件事，那就是什么是智能，以及我们如何在机器上实现智能。在我看来，如果从人类智能的角度来看，这其实可以归结为两件简单的事情。

一是我们会说话。我们使用语言交流作为工具来交谈，组织起我们的知识并传递信息。另一个是——也是对我们意义深远的那一半智能是——我们会做事。比如，我们做蛋饼，我们徒步，我们和朋友玩乐，享受彼此的存在，这远远超出了我们所说的任何一句话，而这只需要我们能舒适地坐在对方面前。

还有，拿着一个啤酒罐，所有这些事情，这是智能的一部分，而这部分智能的真正基础，在于我们能够理解我们所生活的三维世界，感知它，并将它转化为一整套理解、推理和预测，这样我们就能在这个世界中做事。在我看来，这种能力被称为“空间智能”，是人类等智慧动物所具备的最基本的天赋能力，也就是处理三维空间的能力。

所以，ImageNet 的出现是因为我一直在探索如何给二维图像中的像素贴标签，而对人类来说，二维图像是三维世界的投影。因此你可以看到，这就是一个婴儿朝着理解我们生活的更完整世界--视觉世界迈出的第一步。而这个婴儿迈出的一小步至关重要，因为无论是对于人类、动物还是机器来说，理解这些物体和图像，给它们贴上标签都是关键的第一步。

但现在，天哪，14 年、15 年过去了，我认为我们已经准备好进行一场更大的探索，几乎是一场全垒打探索，以解开智能最重要的另一半——也就是空间智能问题。空间智能之所以有趣，是因为它实际上包含两个方面：一个是物理三维世界，另一个是数字三维世界。我们从未真正能生活在这两者之间。但现在，空间智能可以成为一种统一的技术，让三维接地世界和数字三维世界都变得有意义。

Aria：所以，当我思考空间智能的前景时，你知道，如果你回到 1880 年——马车、未铺设的道路——你会觉得，这是一个完全不同的世界。但如果你回到 1980 年--好吧，就像人们开不同的车，但他们仍然住在同样的建筑里，仍然开着车。某种程度上来说，这个现实世界的机制是基本一样的。你认为在未来几十年里，你说的另一半智能会改变这一切吗？我们是否会看到现实世界的巨大转变，就像过去几年我们在数字世界看到的那样？

李飞飞：我认为会的，我认为现实与数字之间的界限将开始变得模糊。举个例子，我在高速公路上开车，如果车胎爆了，尽管我是个技术专家，我有种预感，这会给我带来很大的麻烦。但如果我能戴着一副眼镜，或者把我的手机对准汽车，对于爆胎这个问题，我只需要与装在里面的应用合作，引导我进行换胎，无论是通过视觉引导，还是通过对话或混合方式。

我认为这是一个非常普通的日常生活例子，它真正打破了物理三维世界和数字三维世界的界限。无论是更换爆胎还是做心脏手术，这样的技术都能为人们赋能，这对我来说是一个非常令人兴奋的想象。

Aria：所以你说，用大语言模型（LLM）来教自己一些东西，这个我一直认为是非常鼓舞人心的。就像我的孩子们总是说，“哦，我不学了，我数学很好，不需要再学了。”而我可以说，“不，不，李飞飞都在用 LLM 学习。我觉得你还需要继续学”。但是，当你谈论大世界模型（LWM）与 LLM 时，你是怎么看待这两者的？你如何向人们解释他们的差异，以及你认为未来会如何发展？

李飞飞：从根本上说，就像我说过的，一个是关于说的，另一种则是看和做。所以，从根本上说，它们是不同的模态。LLM 的基本单位是词库——无论是字母还是单词。而在我们所说的“世界模型”中，基本单位则是像素或体素。因此，它们是截然不同的语言。我几乎觉得语言是人类的语言，三维是自然的语言。我们真的希望AI算法能够让人们与像素世界进行互动，无论是虚拟世界，还是物理世界。

Reid：你的回答让我想起你引用过的一句话，社会生物学家 Edward O. Wilson 曾说 “我们有旧石器时代的情感，中世纪的制度，上帝一般的技术，这是极度危险的。”所以，在这样一个拥有自然语言思维、又需要教育大众的情况下，你觉得要怎样“反转”这个说法？或者说，在 AI 时代，人类有哪些机遇？

李飞飞：我仍然相信 Wilson 的那句话，也正因为如此，你和我以及我们的朋友们才一起创办了以人为本人工智能研究院（HAI）。如果我要反转那句话，我可能会这么讲：人类能够创造近似“上帝一样”的技术，从而改进我们所处的‘中世纪’式制度，并超越、或引导我们那‘旧石器时代’的情感，让它们变成创造力、生产力和善意。

Reid：那你认为要帮助人类实现这些理想，我们构建这种技术的关键是什么？重点是放在“同情心”上吗？还是说这是一个以人为本和人与技术交互共生的问题？如果想让科技和 AI 帮助我们实现更好的自我，你觉得下一步最该做的是什么？

李飞飞：我知道你为什么主修哲学跨学科专业（Sym-Sys）了，你的思考体现了哲学和技术的结合。我同意你的观点，就像前面引用的，我们几乎把“旧石器时代”当作一个负面的词，但它其实并不是一个负面的词，它是一个非常中性的词。人类的情感或者说人类的自我形象认知深深植根于进化，植根于我们的 DNA，这是不会改变的。我们的世界也正因为如此而既美丽又混乱。

因此，在思考技术以及未来人类与技术的关系时，我认为我们需要尊重这一点。我们需要尊重人类最根本的、根源于“旧石器时代”的自我。科技发展中，有一些事情真的需要尊重，我们越尊重它，越能成为更好的我们。一是尊重人的能动性。我认为其中一个关于 AI 的公共沟通问题就是我们经常在句子中将 AI 作为主语，而人类的能动性被拿掉了，比如“AI 能够治愈癌症”这样的句子。

我有时甚至也会不小心这样说。事实应该是人类将利用 AI 治愈癌症，而不是 AI 治愈癌症。还有说“AI 将解决核聚变问题”，事实是人类科学家和工程师将把 AI 作为解决核聚变的工具。更危险的说法是“AI 会夺走你的工作”，我认为我们真的需要认识到，这项技术有更多的概率来创造机会和工作来增强人类的能动性，这是我在意的非常重要的第一个基本原则。

第二个基本原则是尊重人类。每个人都希望身体健康、有生产力、在社会受人尊重。无论我们如何发展或使用 AI，我们都不能忽视这一点。忽视这一点是危险的，会适得其反。我认为，仅这两点就对指导我们发展这项技术至关重要。

Reid：我很喜欢你对人类能动性的深入思考。你能再多谈谈能动性以及让 AI 以人为本的重要性吗？以人为本的 AI 意味着什么？技术专家和技术公司应该如何思考这个问题？

李飞飞：对这个问题的讨论根植于这样一个坚定的信念：任何技术、任何创新都应是让人类向善的。这也是人类文明的弧光——每当我们创造出一种工具，我们都希望用这种工具带来更好的世界。当然，这也是一把双刃剑，我们可能会误用工具，会有不良的行动者使用工具。因此，即使看到技术和工具的阴暗面，也会促使我们加倍努力，让它们变得更好。至于如何让 AI 以人为本， HAI 的基本原则，以及我们一起在斯坦福创办它的根本原因就是，我们把 AI 视为一种强大的工具——一种文明性工具。我们最好尽早建立起一个将人类和人类利益置于核心的框架，我认为以人为本的 AI 最关键的一点，以及它应该如何指导每一家公司、每一位开发者，就是为人类赋能。

Aria：你已经在 AI 领域工作了很长时间，涉及过许多不同的方面。而一些人现在才刚刚了解 AI。你如何看待现在的 AI 创新——无论是从我们所处的位置，还是从开发者所面临的问题来看。你觉得要想解决这些问题、再上一个台阶，我们当下该做些什么？

李飞飞：我们正处于一个现象级的时刻。这是一个革命性的拐点，因为 AI 现在可以进入个人和企业的日常使用中。如今，我们这些早期的 AI 探索者在职业生涯初期的许多梦想都已经实现或即将实现。例如，公众常常说起“图灵测试”，而如今这几乎已经被解决的问题。虽然图灵测试本身不会是衡量智能的终极标准，但它曾经被视为一个极难攻克的标准，如今也已经被突破了。汽车能自动驾驶了，对吧？虽然还没有完全解决，但已经比 2006 年解决得多了。

所以，随着这些模型真正用于生产环境，被普通人和企业使用，我认为这是 AI 革命的一个非凡阶段。不过我也清楚地知道，我们身处硅谷泡沫中，我仍然认为放眼全球，很多人还没有跟上 AI 的发展速度。但我们确实看到了未来，看到了未来的走向。

Aria：我感觉很多听众会对你说的产生共鸣，AI 可能极大地提升人类能力，也可能带来巨大的积极影响，但我们确实需要担心那些负面后果，并希望能在正确的轨道上引导 AI。那从开发的角度看，你觉得我们需要怎么做才能确保 AI 走向积极的方向？如果你认为政府或者跨行业的合作是必要的，也可以谈谈这方面的想法。

李飞飞：说实话我认为有很多我们能做的，而且我们就应该尽快去做，早就该做了，但现在开始也不算晚，只要我真正投入去做。第一点，应该基于“科学”而不是“科幻”。过去有很多炒作的言论，比如 AI 会导致人类灭绝或者 AI 会带来世界和平——两种说法都更像科幻而非科学。所以，当考虑如何制定 AI 政策、对 AI 进行治理时，我们以数据、科学事实、科学方法为基础，这是非常重要的。

第二点，就像许多其他技术和工具一样，我们要在对人类产生影响的地方为 AI 的应用加上“护栏”，即把治理的精力集中在正确的地方，而不是阻止上游的发展。想想早期的汽车，它并不安全，没有安全带、车门，也没有限速。后来我们也确实付出了一些代价，比如人员伤亡。但我们并没有对福特或者通用汽车说“关停工厂”，而是建立了包括安全带、限速等的监管框架。今天的 AI 也是类似的，它是一项具有深远影响的技术，但也会伴随着风险。因此，我们应该关注的是，当 AI 应用于医疗领域时，我们该如何更新食品药品监督管理局（FDA）的监管条例？当 AI 应用于金融领域时，我们该如何设置监管护栏？所以，应用层面才是应该集中精力治理的地方。

最后一点，我们需要明白，要让 AI 有一个积极的未来，就要有一个积极的生态系统。这个生态系统需要私营部门的参与，无论是大公司还是初创企业都非常重要。同样，也需要公共部门，因为公共部门生产公共产品。

在我看来，公共产品有两种形式。一是由好奇心驱动的创新和新知识。比如用 AI 做聚变研究、用 AI 治疗疾病、用 AI 赋能教师等等。很多这些想法都来自公共部门，就像 ImageNet 当初就来自于公共部门。二是人，我们需要让教育更多年轻人、更多公众了解这项技术，而公共部门在从 K12（基础教育）到高等教育的领域承担着主要的社会教育责任。

这些就是我在 AI 治理与政策制定层面非常关心的内容。

Reid：你刚才的谈话其实已经有所涉及，不过我觉得可以再重点谈一下 AI4All ，因为你一直在做的另一件事就是确保 AI 不仅仅关乎斯坦福大学的教授、加州理工学院的博士和物理学家等技术精英，而是关乎所有人的。请你讲讲 AI4All 这个项目，以及它的使命和贡献。

李飞飞：AI4ALL 是一个非营利性组织，由我和我以前的学生、同事共同创立。它的任务其实是通过大学的暑期项目和实习，为来自不同背景的 K-12 学生提供接触 AI 的机会。我们的理念是努力实现公共利益。在 AI 的教育层面，我们知道 AI 将改变世界，但谁来改变 AI 呢？我们希望有更多元背景的人来使用这项技术，为各种伟大的事业开发这项技术，并从中受到启发。

因此，我们的项目一直面向女性，以及来自农村、城市贫困地区、历史上代表性不足的社区和背景的学生，让他们参加这些暑期项目。看到这些年轻人使用 AI 或研究 AI 、改进救护车调度算法，使用 AI 评估乡村社区的水质，真的令人倍感鼓舞。这仍然是一项小规模的工作，但我希望它能不断发展壮大，因为让更多不同的人参与到 AI 领域是一个非常重要的目标。

Reid：你也在医疗健康领域做了很多工作。AI 在医疗健康领域能做些什么？能谈谈你在医疗领域的工作，以及你对 AI 在这方面未来发展的期望吗？

李飞飞：正如我在我的书中写到，我对 AI 在医疗健康领域的应用充满热情，原因有很多。医疗健康领域绝对是以人为本的核心，这是一个非常庞大的行业，涵盖从药物研发、体外诊断的基础生物科学一直到临床诊断与治疗、医疗服务和公共卫生的很多节点。因此，令人兴奋的是，在这个系统的每一个节点上，我们会发现 AI 都能提供很大帮助。

我自己喜欢并关注的领域是医疗保健服务，关乎人类之间的互相帮助。在美国，护士的数量远远低于病患的需求量。这份工作非常辛苦，护士流失率很高，这方面有一些惊人的统计数据，比如在一个轮班中，有些护士光是取药、拿设备等平均就要走超过 4 英里路，或者是一个轮班中就要完成多达 150、180 项不同的任务。与此同时，还有病患因为缺乏足够的照顾而从病床上摔下来。分流重症病人和非重症病人方面也存在很多问题，更不用说那些独自在家生活的老人了，他们面临着独居、痴呆症恶化等风险。

因此，医疗保健服务领域需要大量帮助。我在过去十多年的工作中一直在研究使用智能摄像头，即非侵入式和非接触式摄像头，来帮助我们的护理人员关注病人的情况。如果他们躺在医院的病床上，可以关注他们的动向，防止跌倒；如果在家，要关注他们的行为、孤独感或营养摄入情况；如果在手术室，可以监测手术器械的使用情况，让护士不用不断清点器械来保证把物品不会遗留在病人体内。要关注护士每分钟都要清点的器械，这样我们就不会把它们遗失在病人体内。这种智能摄像技术我们称之为“环境智能”（ambient intelligence），目的是帮助医生和医护人员提升对病人的整体护理质量。

Reid：AGI 现在是一个经常被讨论的术语。我记得你好像曾经说过，你不确定 AGI 到底指什么，因为不同人给它的定义都不一样，像是各自的“罗夏墨迹测验”（Rorschach Test）。能否谈你对于 AGI 讨论的看法，让对于话题的讨论能更加理性而不是过于分散、众说纷纭。

李飞飞：这是一个既有趣又令人沮丧的对话。我真的不知道 AGI 意味着什么，因为我认为这个词是 10 年前从商业角度提出的，当时 AI 逐渐成熟，人们对它产生了很大的商业兴趣。最初这个术语提出的意图——我尊重这个意图——是在“AI”中加入“G”，即“general”，以强调 AI 的未来需要更具通用性的能力，而不是狭窄的能力。例如，今天的自动驾驶汽车就比仅仅能探测树木的摄像头更具有通用性，对吗？狭窄的 AI 只能完成一个非常特定的任务，而更通用的 AI 能应对多种任务，这的确是个实实在在的区别。

我之所以觉得自己一直没有完全搞清楚，是因为如果我回溯历史，AI 早期奠基人 John McCarthy 和 Marvin Minsky 从 1956 年那场夏季研讨会开始，所怀抱的梦想一直都是“让机器能思考，能帮助人类决策，甚至能自己做事”。没有人说过，“我们梦想的是仅用于检测树木的极其狭窄的 AI ”。标志 AI 这一领域诞生的就是“会思考的机器”这一提法。所以从这个角度来看，我们有着同样的梦想、同样的科学好奇心、同样的追求，那就是让机器能够执行极其智能的任务。从这个角度来看，我不知道应该称其为 AI 还是 AGI ，对我来说这是一码事。

Aria：对于你说的在 AI 能自己做事这方面，随着语音和对话式 AI 的进步，我感觉我们正在逐渐接近这样一种状态，和 AI 进行日常对话、让它帮我们做事。你觉得现在在生活中使用智能体（Agent）的方式，哪些是特别有用的，或者说可能让 AI 和语音技术在未来几年改变生活？

李飞飞：我很肯定地认为，通过自然语言分享知识，无论是搜索、构思还是学习，是一个非常强大的方式。我自己也会使用 LLM 来理解一个概念，理解一篇论文，提出一些我不知道的问题。最让我兴奋的是，我看到人们和孩子们把它作为一种工具来提高自己的学习能力。我想强调的是，无论如何，我们都要确保人的自我能动性，为人们提供良好的学习工具、为人赋能。我认为，随着这类强大工具能力的不断深化——我本人也在为此而努力——我们会越来越多地看到，协作能力让人类能够利用这些工具更精确地做事。我很期待看到这一切发生。

Aria：我认为你强调的这点很重要，这当然是正确的事情，但我们也会听到这样的说法：“这些 AI 开发者试图取代人类。我可不想每天对着屏幕 10 个小时”。我认为人与人之间的互动是非常关键的，对教学、社区、同理心等一切都很重要。在你的那本书《我所看到的世界》（The Worlds I See）中，有一个故事是关于一位数学老师的。你讲到了你的高中数学老师萨贝拉先生，说明了人与人之间的交流是非常重要的。那么，你能就这个话题再分享一下吗？他给了你哪些让你难忘的建议？

李飞飞：我在这本书里记录了我早年作为一个移民小孩的经历。我 15 岁来到新泽西，进入一所公立高中，也不会讲英语，这就是我人生旅程的开始。我很幸运，很快我就遇到了一位叫 Bob Sabella 的数学老师，他对我充满了尊重和无条件的支持。他不仅是我的数学老师，还成为了我的朋友，帮助我度过了我作为新移民的艰难的青少年时期，作为朋友陪伴着我，直到他去世。但他不是通过言语教给我东西。他从未坐下来和我说：“嘿，飞飞。AI 将主宰世界。让我告诉你，AI 要以人为本”。当时甚至没有这个说法。

他只是通过行动告诉我，归根结底，我们的社会、我们的生活的意义在于我们为彼此所做的积极的事情，我们所坚持的信念、所追逐的灯塔。在他的行动中，我体会到尊重和托举他人是一件美好的事情，即使那只是一个懵懂的、不会说英语的移民小孩。所以，我认为这种慷慨、善良和同情心是做人的核心。我从他身上学到的最大东西就是以人为本。

Aria：说得真好。那么，你希望人们经常问你的问题是什么？

李飞飞：我希望人们能多问我一些关于如何利用 AI 帮助人的问题。我可以就这个问题谈上几个小时，我在斯坦福和世界各地的许多了不起的同事都在致力于这一事业，我不清楚他们具体正在做什么，因为他们都是各自领域的专家，但至少我可以给人们指出他们的工作方向。

Reid：你自己所处的行业之外，你有没有从哪些地方看到了进步或者发展势头，并对你有所启发？

李飞飞：人文学科对能源的关注确实给了我很大启发。我想我还是不能完全脱离 AI 来讲，我觉得即使是 AI 的发展，也在推动非常现实的能源问题，例如电力。我认为环境的变化以及全球能源民主化是非常重要的，我们不能总是依赖化石燃料。因此，能源领域的许多进步和全球运动都是令人激动的。

Aria：最后一个问题，你认为如果一切会向着利于人类的福祉发展，未来 15 年可能发生什么？实现这些可能的第一步是什么？

李飞飞：我希望看到全球在知识、福祉和生产力上迎来增长，特别是对于共同繁荣、共享成果的强调。我之所以要强调这一点，是因为在技术方面，我是一个乐观主义者。我知道技术可以帮助人们。我知道，如果我们使用得当，它可以发现新知识，帮助我们创新，提高我们的福祉。但我认为重要的是，我们要吸取之前反复尝到的教训，那就是我们需要共享这些繁荣，需要使这种利益成果惠及所有人。

来源：学术头条

标签： llm agi 旧石器时代

本文地址：https://news.43u.com.cn/a/486443.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!