当人工智能开始提问时会发生什么?

360影视 动漫周边 2025-05-07 18:36 2

摘要:当马里奥·克伦(打开新标签页)在维也纳大学学习量子物理学时,他接受过一种设计新实验的特殊训练:“你走到黑板前,然后努力思考,”他说。2014年,克伦试图想出一种观察特定量子态的方法。典型的装置是将激光束穿过一个由透镜、晶体和镜子组成的精细校准阵列。但具体的安排

本文来源:科技世代千高原

格雷戈里·巴伯2025年4月30日

技术一直以来都是科学的工具箱。但如今,人工智能也被用于研究问题和方法,一些科学家开始思考它们的角色将会如何演变。

马里奥·克伦(打开新标签页)在维也纳大学学习量子物理学时,他接受过一种设计新实验的特殊训练:“你走到黑板前,然后努力思考,”他说。2014年,克伦试图想出一种观察特定量子态的方法。典型的装置是将激光束穿过一个由透镜、晶体和镜子组成的精细校准阵列。但具体的安排取决于物理学家。“通常情况下,答案就会出现,”克伦说。人类的推理是可靠的、巧妙的魔法。

但这一次,答案并非如此。克伦和他的博士生同学们花了几个月的时间聚集在黑板前,画着各种方案,并就这个理论展开辩论。然而,答案却迟迟没有出现。

但深夜时分,克伦开始研究一种不同的头脑风暴方法。几个月前,他读了IBM研究人员的一篇论文,介绍了一个可以编写食谱的人工智能系统。这篇论文旨在练习作者所说的“计算创造力”。论文中,他们提出了“开曼大蕉甜点”等食谱,将木瓜沙拉与青柠奶油和椰子奶冻搭配在一起,旨在探究人们通常所说的“创意”——“创意”——究竟意味着什么——这个词通常被定义为新颖性和价值。

克伦和大多数人一样,大多认为创造力是一种魔法——一种无法触及的抽象概念。但IBM的研究人员声称,创造力是可以量化的。因此,它可以被计算机操控,甚至优化。这个想法让他兴奋不已。克伦决定创造物理学的新配方——将基本的实验室材料转化为新的实验。他设计了一个程序来帮他实现这个目标,并将其命名为“梅尔文”(Melvin)。

一天晚上,克伦把他那棘手的量子问题输入梅尔文计算机,让它运行了一整夜。第二天早上,机器吐出了一份方案后,他通过电子邮件将其发送给了他的导师安东·泽林格(Anton Zeilinger)。泽林格后来因其在量子物理学领域的贡献而获得了诺贝尔奖。他很快就收到了回复:他很喜欢这个方案。

泽林格观察到,实验设计违反直觉。它是不对称的,而他们想要的量子态却恰恰相反。“他解释我们(自己)没能找到它,是因为我们在某种程度上存在偏见,”克伦说。显然,人类的推理起了作用。

量子科学极其复杂,梅尔文设计的实验又过了四年才取得成果。(它成功了。)从那时起,克伦的同事们大多又回到了黑板前。罗伯特·菲克勒(打开新标签页)与克伦一起参与实验的他,现在是芬兰坦佩雷大学的物理学教授,很高兴实验能够顺利进行,但他告诉我,他认为梅尔文的进步更多的是速度而非创造性的洞察力。“我觉得这很棒,但我觉得我们也能做到,”他说。“但我们没有。”

马里奥·克伦 (Mario Krenn) 负责管理所谓的人工智能科学家实验室。斯蒂芬·施潘根伯格

另一方面,克伦决定是时候彻底抛弃传统的实验室了。“我更喜欢我的程序,”他说。他最初在一个材料研究实验室工作,那里人工智能发现工具的使用频率比在量子物理领域更高。之后,在2021年,他在马克斯·普朗克光科学研究所创立了所谓的“人工智能科学家实验室”。(克伦很快将把它搬到图宾根大学。)

多年来,他一直致力于将梅尔文算法从量子实验扩展到其他物理学领域,寻找人们忽略的洞见和联系。“所有物理实验都有其适用的空间,在某个随机的地方,总有一台出色的新型显微镜或引力波探测器,”他告诉我。克伦心想,将这些领域的专业知识与ChatGPT这样的大型通用语言模型结合起来,你就走上了实现实验室承诺的道路。

像克伦这样的学者,以及那些以“科学超级智能”为目标筹集资金的科技巨头和初创公司,所追逐的梦想是将人工智能融入科学的创造性领域。例如,克伦希望创建一个系统,将专业的科学系统(例如他的物理模拟器)与大型语言模型相结合,从而筛选全球所有知识,提出新的想法并找到测试方法。或许,届时机器人可以继续进行这些实验。

多年来,研究人员一直在使用机器学习等人工智能相关技术作为数据处理工具,并取得了显著的成果。此外,科学家们现在经常报告使用生成式人工智能筛选论文、进行高速文献综述、处理繁琐的代码片段或协助撰写电子邮件。

如今,情况已然改变。像 Melvin 及其后续产品这样的程序,以及谷歌等公司开发的高级推理模型,不仅能帮助人们撰写电子邮件,还能帮助他们开发新的研究线索。人工智能正在从数据分析工具转变为创造力工具。在此过程中,它正在融入科学研究的核心,其影响深远且难以预测。如果我们不仅要求机器提供学习事物的最佳方法,还要求机器提供学习的最佳内容,会发生什么?

痛苦与效率

2022年,麻省理工学院经济学博士生艾丹·托纳-罗杰斯(Aidan Toner-Rodgers)获得了一个难得的机会,研究人工智能如何塑造科学家的职业意义。一家从事材料研发的公司开始为其1000多名研究人员配备一款新的生成式人工智能工具。他们希望该工具能够帮助研究人员开发出新的测试材料。托纳-罗杰斯很幸运,这项工具的推广将分批进行,因此一些科学家可以使用该工具,而另一些则无法使用。因此,他们设置了测试组和对照组。

实验结果(打开新标签页)令人震惊。在配备AI的小组中,生产力飙升。与对照组相比,这些科学家发现的材料多44%,获得的专利多39%,创造的产品多17%。那些成就卓著的科学家——那些已经获得最多材料专利的科学家——提出新想法的速度更快,排名靠前的十分之一的科学家的产出提高了81%,这可能是因为他们拥有直觉,能够抛弃AI最糟糕的想法,只测试好的想法。

然而,人工智能在提高效率的同时,也带来了痛苦。超过80%使用人工智能的科学家表示,他们的工作满意度下降了。根据对受试者的采访,托纳-罗杰斯推测,这是因为研究人员失去了工作中最有创造力的部分。“我不禁感到,我所受的教育现在变得毫无价值了,”一位科学家告诉他。“这不是我受过训练要做的事情。”

对于杜克大学蛋白质工程师菲利普·罗梅罗来说,这些工业界研究人员的经历让他回想起早年自己所在领域关于人工智能的争论。罗梅罗读研究生的时候,人们会嘲笑人工智能工具,认为它们掩盖了结构生物学最重要的任务——即通过了解蛋白质的折叠方式来理解其功能——比如,它是否会与某种抗体结合,或者发出绿色荧光。

后来有一天,一个人工智能——DeepMind 的 AlphaFold——有效地解决了蛋白质折叠问题。或许有些科学家会觉得他们的职业生涯已经过时了,他们的目标被改写了。但大多数情况下,科学——以及科学家——只是继续前进。快速解答蛋白质如何折叠的问题,实际上并不能直接回答蛋白质如何运作的深层问题。它只是蛋白质研究人员武器库中的一个新工具,以及一种让他们工作速度更快的方法。

现在,罗梅罗可以构思出一种蛋白质,掌握了它如何折叠的知识,并抢先着手分析其含义的艰苦工作。“我觉得满意度大大提升了,”他说。

专注于研究生物学问题的计算机科学家詹妮弗·利斯特加滕 (Jennifer Listgarten) 想要弄清楚是什么让人工智能在某些有限的情况下变得与众不同。Jennifer Listgarten 供图

加州大学伯克利分校的计算机科学家詹妮弗·利斯特加滕(Jennifer Listgarten)认为,这种满足感或许更多地与自主性有关。她与罗梅罗等人密切合作,致力于将人工智能应用于生物学问题。工业界的科学家们最终感觉自己更像是技术人员或实验室助理,在执行机器的创造性梦想,而不是自己的梦想。“大家都知道,让研究生去实现一个想法的办法就是让他们觉得这是他们的想法,”她笑着说。而人工智能则不会受到这样的奉承。

理论上,学者应该拥有更大的操作自由。利斯特加滕认为,他们有点像艺术家——当新想法和新工具出现时,他们可以自由地进行实验,提出新的问题,并观察“它如何释放新的创造力”,她说。但强迫他们使用它呢?如果企业研究人员的经验告诉我们什么的话,那就是做得更多、做得更快并不意味着一切。

人工智能创意机器

虽然像 AlphaFold 这样的工具为人工智能带来了最显著的科学成就,但对一些人来说,人工智能的全部潜力远不止掌握一些狭隘的任务。研究人员正在将人工智能想象成科学研究过程的参与者,为新的研究方向提供建议或验证旧的研究方向——介于工具和同事之间。

这就是谷歌宣布的“人工智能联合科学家”计划背后的想法(打开新标签页)今年早些时候,该平台启动了一项名为“人工智能”(AI)的平台,旨在为科学谜题提出新的假设,并找到验证这些假设的方法。该平台的特色是人工智能代理,它们会针对特定的研究问题提出潜在的答案。然后,这些代理会就各自的理论展开辩论,并对各自的实力进行排名,从而不断完善这些想法。

在宣布这一消息之前,谷歌曾邀请伦敦帝国理工学院弗莱明计划的两位微生物学家何塞·佩纳德斯(José Penadés)和蒂亚戈·迪亚斯·达科斯塔(Tiago Dias da Costa)测试该平台。两人决定向这位合作科学家提出一个他们在实验室中已经解答过但尚未发表的问题:一种病毒如何传播其遗传信息。他们把问题发给了这位合作科学家,结果让他们震惊的是,在一堆不太靠谱的想法中,这位合作科学家给出了与他们最近测试过并被证明正确的假设完全相同的答案。

佩纳德斯告诉我,他感到惊讶的原因之一是,生成式人工智能工具的推理能力仍然相当薄弱。正因如此,尽管它们知识渊博、语言流利,却常常难以掌握基础数学,或难以处理训练数据中未出现的假设情况。这也是为什么人们完全有理由对任何声称能够进行科学推理的机器持怀疑态度。

对佩纳德斯来说,人工智能本质上就是多年来收集不同发现的碎片,将它们拼凑起来,并确定下一个碎片的位置。令他印象深刻的是,它能够通过翻阅科学文献找到相关的见解,从而建立起下一个逻辑联系。这有点像在沙发垫里找到最后一块拼图。佩纳德斯和科斯塔花了很长时间才得出相同的答案。科斯塔认为,这是他们自身思维被“格式化”或陷入窠臼的一个例子。与克伦未能找到正确的量子设置类似,科斯塔长期以来一直让自己的直觉阻碍了对一个事后看来相当显而易见的想法的理解。而人工智能却能够实现飞跃。

研究人员在体验结束后认为,谷歌所展示的本质上是一个超级强大的搜索引擎。除此之外,它的能力尚不明确。“首先,你需要提出一个问题,这是最有价值的,”佩纳德斯说。“机器能提出一个非常好的问题吗?我不知道。机器能否以一种忘记已发表内容的方式解读事物,并开辟一条新的研究途径?我不知道。”

但与此同时,他认为,一个能够找到缺失拼图碎片的人工智能将带来诸多益处。“它是一个非常聪明的合作者,”佩纳德斯说道。他们心中的问题是,通过这种机器创造力,我们能发现多少新东西。测试期结束后,他们要求博士生和博士后担任人工智能输出的评审员,仔细研究它提出的问题。在层出不穷的新想法中,或许存在值得检验的新假设。

教训与局限

去年,克伦设计了自己的实验来测试人工智能假设的质量:他将用数百万篇涵盖各种学科的研究论文训练一个人工智能,并指示它生成个性化的研究思路和潜在的合作机会。然后,他会请普朗克学会的同事们告诉他,这个人工智能的想法到底有多好。

其中一位同事是Ana Bastos(打开新标签页)莱比锡大学地球系统科学家。她简短地回复了他。“在当今科学面临的诸多问题中,我看不出人工智能驱动的研究成果如何能够解决这些问题,”她写道。“事实上,我认为它反而会加剧科学的颠覆性、人性化和多样性的趋势。”她拒绝参与。

Ana Bastos 担心人工智能的广泛应用对科学意味着什么。安特耶·吉尔德迈斯特

对巴斯托斯来说,这份邀请只是人工智能对她学术生涯诸多不受欢迎的干扰中的最新一次。她回忆起最近的一次会议,一位同事评论了改进的人工智能天气预报,这些预报最近在某些任务上的表现已开始超越传统的基于物理的模型。这位同事预测,他们将在五年内利用人工智能解决气候建模问题,并很快“把物理学扔进垃圾桶”。

这个想法让经常在研究中使用机器学习的巴斯托斯感到震惊。她表示,即使是优秀的人工智能天气预测模型,也往往会低估最极端的事件。随着气候模式的变化,以及关于大气的基本假设(隐含在用于创建这些模型的数据中)变得过时,这些模型也可能会陷入困境。不仅如此,基于人工智能的预测最适合于拥有大量数据集的短期天气模型。而长期气候建模则依赖于更加稀缺和不确定的数据。

她的同事那种不加掩饰的乐观——一种对人工智能力量的宿命论——让巴斯托斯怀疑,学术界是否真的像他们自认为的那样,拥有自主权来采用人工智能。这种工具被强加于艺术家身上。她注意到,使用人工智能的研究更容易获得资助和期刊发表。她不禁思考:哪些研究因此得不到资助?哪些作品无法发表?

她发现,人们越来越依赖人工智能驱动的文献综述,却不去核实具体的引用。未来,什么可能会阻止人们使用人工智能来评估论文的发表水平,或决定谁能获得资助?“我只是觉得这种曲线加速会让一切变得更糟,”巴斯托斯告诉我。

对于伯克利大学计算机科学家利斯特加滕来说,效率是人工智能的一大潜力。它能够以其他方式无法实现的方式加速科学发展。她将人工智能比作互联网或显微镜。“关键在于产生结果,”她说道。

但在一个周日的早上,一系列重叠的担忧让她疯狂地写作。她收到了很多关于 AlphaFold 和 ChatGPT 如何“解决”各个领域的科学问题的咨询。那天下午,她完成了一篇草稿,这篇论文后来刊登在《自然·生物技术》杂志上,题为《人工智能生成数据的永动机以及 ChatGPT 作为“科学家”的干扰》。(打开新标签页)“这几乎是《自然》杂志发表论战文章的一次最接近的尝试。

她观察到,包括科学领袖在内的许多人,都没有意识到人工智能在某些有限情况下的特殊之处,例如AlphaFold。该项目需要大量精心标记的数据。在那里,人工智能能够利用数十年来已发表的蛋白质结构实验研究成果,而这些研究的研发成本约为200亿美元。

并非所有领域都拥有蛋白质折叠那样的数据,或涉及如此适合人工智能训练的问题。在缺乏任何一项数据的情况下,人们正在寻找捷径,例如利用人工智能创建的合成数据来训练其他人工智能系统。或者,他们希望大型语言模型能够在他们并非精通的领域展现出强大的理解力,甚至产生新颖的见解。

利斯特加滕认为,这种方法注定会令人失望。在寻找万能机器、寻找能够理解人类尚无法理解的事物的“神谕”的过程中,数据是必不可少的。“我们只需要回到实验台上,做更多的实验,”她说。

下一次飞跃

克伦开发梅尔文十年后,参与该项目的研究生每隔几周就会在 Zoom 上开会,了解和谈论量子物理学。

菲克勒是克伦针对人工智能研究创意开展的调查的一百多名实验对象之一。调查结果出来后,大多数创意都获得了1分(满分5分)。但大约有四分之一的创意被评为4分或5分——也就是“有趣”或“非常有趣”。对克伦来说,25%是一个相当不错的起点。“我不确定我能想出这么多有趣的创意,”他说。

这完全是一场实验,一个想法被评价高并不意味着每个人都必须去追求它——毕竟,这就是科学的魅力所在,探索的选择。这些想法只是被扔进一堆堆想法而已。但克伦说,这表明,在目前这条探索跨科学的惊人联系的道路上,还有更多富有创造性的洞见等待挖掘。

视频:马里奥·克伦利用人工智能提出个性化的研究问题和想法。艾米丽·布德

这种联系能否转化为一个极具创意的理念,既能解释所有实验证据,又能挑战我们已知的认知?即便对克伦来说,这个问题也依然扑朔迷离。“很难想象这样的程序如何能够带来范式转变”,就像阿尔伯特·爱因斯坦凭借其极具创造性的引力理论所实现的那样,”他说道。但他又认为,我们也无法完全理解人类是如何获得天才洞见的。如果创造力最终更像是机械而非魔法,那么科学创造力机器并非不可能。“我非常乐观地认为我们能够做到这一点,”他说道。

这个想法至今仍让菲克勒既印象深刻,又感到担忧。他经常利用视频通话,对朋友的工作提出批评和疑问。“也许我不希望人工智能变得那么强大,”他告诉我,“但马里奥经常证明我错了。”

目前,他和大多数科学家一样,都在努力弄清楚这一切是如何运作的。由于英语并非他的母语,菲克勒偶尔会使用 ChatGPT 来帮助他编写代码,并润色他的拨款提案。他很不情愿地接受了这个平台;他认为,当其他人都拥有这种优势时,他会感到压力,要求自己行动更快、表达更好。他说,人工智能产生的“听起来太好了”。“我喜欢犯错;我喜欢它的个性。”但他发现,一旦开始使用,就很难放弃。

来源:人工智能学家

相关推荐