当 AI 开始提出问题时会发生什么?

360影视 日韩动漫 2025-05-02 20:34 3

摘要:马里奥·克伦在维也纳大学学习量子物理学时,他接受了一种设计新实验的特殊方式的培训:“你走到黑板前,你会非常努力地思考,”他说。2014 年,Krenn 试图想出一种观察特定量子态的方法。一个典型的设置包括通过精细校准的透镜、晶体和镜子阵列发送激光束。但具体安排

马里奥·克伦在维也纳大学学习量子物理学时,他接受了一种设计新实验的特殊方式的培训:“你走到黑板前,你会非常努力地思考,”他说。2014 年,Krenn 试图想出一种观察特定量子态的方法。一个典型的设置包括通过精细校准的透镜、晶体和镜子阵列发送激光束。但具体安排取决于物理学家。“通常,答案会出现,”Krenn 说。人类推理是可靠的聪明魔法。

只不过这一次,情况并非如此。Krenn 和他的博士生们花了几个月的时间围着黑板,涂鸦各种设置并辩论理论。没有答案。

但到了深夜,Krenn 开始研究一种不同的头脑风暴方法。几个月前,他读了一篇来自 IBM 研究人员的论文,该论文介绍了一种编写食谱的人工智能系统。这是作者所说的“计算创造力”的练习。通过“开曼车前草甜点”等食谱,将木瓜沙拉与酸橙奶油和椰子奶冻搭配,旨在探索人们说“创意”时通常意味着什么——这个词通常用新奇和价值来定义。

和大多数人一样,Krenn 大多认为创造力是一种魔法——一种不可触及的抽象形式。但 IBM 的研究人员声称创造力是可以量化的。因此,它可以由计算机纵甚至优化。这个想法让他兴奋不已。Krenn 决定要在物理学中创造新的配方——将基本的实验室成分转化为新的实验。他为他设计了一个程序来做到这一点,他将其命名为梅尔文(打开新标签页).

一天晚上,Krenn 将他顽固的量子问题插入 Melvin,让它运行了一夜。第二天早上,在机器吐出一个提案后,他通过电子邮件将其发送给了他的顾问 Anton Zeilinger,后者后来因其在量子物理学方面的工作而获得诺贝尔奖。回复立即来了:他喜欢它。

Zeilinger 观察到,实验设计是违反直觉的。它是不对称的,而他们想要的量子态恰恰相反。“他对我们为什么没有找到 [自己] 的解释是,我们在某种程度上存在偏见,”Krenn 说。人类的推理显然阻碍了我们。

量子科学很挑剔,梅尔文设计的实验还需要四年时间才能取得成果。(它奏效了。)从那时起,克伦的同事们大多又回到了黑板前。罗伯特·菲克勒(打开新标签页)曾与克伦一起参与实验的 Krenn 现在是芬兰坦佩雷大学 (Tampere University) 的物理学教授,他很高兴实验能够顺利进行,但他告诉我,他认为 Melvin 的进步更多地是关于速度,而不是创造性的洞察力。“我觉得这很好,但我觉得我们也可以想出它,”他说。“但我们没有。”

另一方面,Krenn 决定是时候完全放弃传统实验室了。“我更喜欢我的程序,”他说。他首先在一个材料研究实验室工作,那里的 AI 发现工具比量子物理学更经常使用。然后在 2021 年,他在马克斯普朗克光科学研究所创立了他所谓的人工科学家实验室。(Krenn 很快将把它搬到图宾根大学。

多年来,他一直致力于将 Melvin 扩展到量子实验之外,扩展到物理学的其他领域,寻找人们错过的见解和联系。“所有物理实验都有一个空间,在某个随机位置有一个很棒的新显微镜或引力波探测器,”他告诉我。Krenn 认为,将这些专家领域知识与 ChatGPT 等大型通用语言模型相结合,你就在路上了,实现了他实验室名称所承诺的。

像 Krenn 这样的学者,以及利用“科学超级智能”前景筹集资金的科技巨头和初创公司所追求的梦想,包括将 AI 融入科学的创造性方面。例如,Krenn 希望创建一个系统,将专家科学系统(例如他的物理模拟器)与大型语言模型相结合,这些模型可以筛选世界上所有的知识并提出新的想法以及如何测试它们。也许机器人可以继续进行实验。

多年来,研究人员一直在使用机器学习等与 AI 相关的技术作为数据处理工具,通常取得了出色的结果。此外,科学家们现在经常报告使用生成式 AI 筛选论文以进行高速文献综述、处理烦人的代码或帮助编写电子邮件。

现在,这个提议已经发生了变化。像 Melvin 及其继任者这样的程序,以及来自 Google 等公司的高级推理模型,不仅有助于撰写电子邮件,还有助于开发新的研究线索。人工智能正在从数据分析工具转变为创造力工具。在此过程中,它正在将自己整合到科学过程的核心中,其影响既深远又难以预测。当我们不仅要求机器寻找最好的学习方式,而且询问最好的学习方式时,会发生什么?

2022 年,麻省理工学院 (Massachusetts Institute of Technology) 经济学博士生艾丹·托纳-罗杰斯 (Aidan Toner-Rodgers) 获得了一个难得的机会,研究了人工智能如何塑造科学家的意义。一家从事材料发现的公司开始为其 1,000 多名研究人员分配一种新的生成式 AI 工具。希望该工具能够帮助研究人员想出要测试的新材料。幸运的是,对于 Toner-Rodgers 来说,推广将分批进行,因此一些科学家可以使用该工具,而另一些科学家则不能。因此,有内置的测试和对照组。

这实验结果(打开新标签页)令人震惊。在配备 AI 的组中,生产力飙升。与对照组相比,这些科学家发现的材料增加了 44%,获得的专利增加了 39%,创造了的产品增加了 17%。成就斐然的科学家——那些已经为材料申请了最多专利的科学家——想出新想法的速度甚至更快,排名前的十分之一将他们的产出提高了 81%,这可能是因为他们有直觉,可以抛弃 AI 最糟糕的想法,只测试好的想法。

但人工智能在提高效率的同时也带来了痛苦。超过 80% 使用人工智能的科学家表示,他们的工作满意度下降了。根据对他的研究对象的采访,托纳-罗杰斯假设这是因为研究人员失去了他们工作中最具创造性的部分。“我不禁觉得我现在的大部分教育都毫无价值,”其中一位科学家告诉他。“这不是我受过的训练。”

对于杜克大学(Duke University)的蛋白质工程师菲利普·罗梅罗(Philip Romero)来说,这些工业研究人员的经历让人想起了他所在领域早期关于人工智能的辩论。当罗梅罗还在读研究生时,人们会嘲笑人工智能工具,他们觉得这些工具掩盖了结构生物学最重要的任务,即通过了解特定蛋白质是如何折叠的来了解给定蛋白质的功能——比如说,它是否会与特定抗体结合,或者发出荧光绿色。

然后有一天,一个人工智能——DeepMind 的 AlphaFold——有效地解决了蛋白质折叠问题。也许一些科学家觉得他们的职业生涯已经过时了,他们的目标被改写了。但大多数情况下,科学和科学家只是继续前进。事实上,快速回答蛋白质是如何折叠的并不能直接回答蛋白质实际如何运作的更深层次问题。它只是蛋白质研究人员武器库中的一种新工具,也是他们工作得更快的一种方式。

现在,罗梅罗可以构想出一种蛋白质,掌握了它如何折叠的知识,并在分析其含义的艰苦工作中抢占先机。“我认为满意度会大大提高,”他说。

詹妮弗·利斯特加滕 (Jennifer Listgarten) 是一位专注于生物学问题的计算机科学家,她希望弄清楚是什么让 AI 在某些有限的情况下与众不同。

由 Jennifer Listgarten 提供

加州大学伯克利分校(University of California, Berkeley)的计算机科学家詹妮弗·利斯特加滕(Jennifer Listgarten)表示,也许这种满足感更多地与自主性有关,她与罗梅罗等人密切合作,将人工智能应用于生物学问题。工业科学家最终感觉更像是技术人员或实验室助理,实现机器的创造性梦想,而不是他们自己的梦想。“每个人都知道,让研究生研究一个想法的方法是让他们认为这是他们的想法,”她笑着说。人工智能没有这种奉承。

理论上,学者们应该有更多的自由来作。利斯特加滕认为,他们有点像艺术家——当新的想法和工具出现时,他们可以自由地进行实验,开始提出新的问题,看看“它如何释放出新形式的创造力,”她说。但强迫他们使用它呢?如果说企业研究人员的经验告诉我们什么,那就是做得更多、做得更快并不是一切。

虽然 AlphaFold 等工具为 AI 提供了最明显的科学成就,但对一些人来说,AI 的全部承诺不仅仅是掌握狭窄的任务。研究人员将 AI 想象成科学过程的参与者,为新的研究方向提供建议或验证旧的研究方向——介于工具和同事之间。

这就是“AI 联合科学家”背后的想法,谷歌宣布(打开新标签页)今年早些时候,希望为科学之谜提出新的假设,以及测试它们的方法。该平台以 AI 代理为特色,可以为特定研究问题提出潜在答案。然后,这些代理会辩论他们的理论,并对他们认为每个理论的强度进行排名,在此过程中完善想法。

在宣布之前,谷歌曾要求伦敦帝国理工学院弗莱明计划的两位微生物学家何塞·佩纳德斯 (José Penadés) 和蒂亚戈·迪亚斯·达科斯塔 (Tiago Dias da Costa) 测试该平台。两人决定向合作科学家询问一个他们在实验室中已经回答但尚未发表的问题,关于一种病毒传播其遗传信息的方式。他们将问题发送给合作科学家,让他们感到震惊的是,在一系列不太好的想法中,它给了他们最近测试并发现正确的相同假设。

佩纳德斯告诉我,他感到惊讶的一个原因是,生成式 AI 工具的推理技能仍然相当薄弱。这就是为什么尽管他们知识渊博且语言流利,但他们经常在基本数学或处理训练数据中没有出现的假设情况方面遇到困难。这也是为什么人们完全有权对任何声称用科学推理的机器持怀疑态度的原因。

对 Penadés 来说,AI 基本上已经拾取了多年来不同发现的拼图,将它们放在适当的位置,并确定了下一块应该去哪里。对他来说,令人印象深刻的是,它可以通过翻阅科学文献并找到相关的见解来建立下一个逻辑联系。这有点像找到藏在沙发垫里的最后一块拼图。佩纳德斯和科斯塔花了很长时间才得出相同的答案。科斯塔认为,这是一个他们自己的想法被“格式化”或陷入困境的情况。就像 Krenn 未能找到正确的量子设置一样,Costa 长期以来一直让自己的直觉阻碍了他看到一个回想起来相当明显的想法。AI 实现了飞跃。

研究人员从这次经历中得出结论,认为 Google 所展示的本质上是一个超能力的搜索引擎。除此之外,它的能力尚不清楚。“首先,你需要问一个问题,这是最有价值的事情,”Penadés 说。“机器能问出一个非常好的问题吗?我不知道。机器能否以忘记已发布内容的方式解释事物并开辟一种新的研究方式?我不知道。

但与此同时,他认为,能够找到缺失拼图的 AI 可以带来很多好处。“这是一个非常聪明的合作者,”Penadés 说。在他们心中,问题是通过这种形式的机器创造力可以发现多少。在测试期结束后,他们要求博士生和博士后担任 AI 输出的审阅者,仔细研究它产生的问题。在新想法的洪流中的某个地方,可能会有值得测试的新假设。

去年,Krenn 设计了自己的实验来测试 AI 假设的质量:他将在涉及各种主题的数百万篇研究论文中训练 AI,并指示它生成个性化的研究想法和潜在的合作。然后,他会让普朗克学会的同事告诉他 AI 的想法到底有多好。

这些同事包括安娜·巴斯托斯(打开新标签页),莱比锡大学(Leipzig University)的地球系统科学家。她给他发了一封简短的回复。她写道:“在当前科学今天面临的许多问题中,我看不出由人工智能驱动的研究思路的加速产出将如何解决这些问题。事实上,我认为这反而有助于科学变得不那么具有破坏性、不那么人性化和不那么多样化。她拒绝参加。

Ana Bastos 担心 AI 的广泛实施对科学意味着什么。

Antje Gildemeister

对 Bastos 来说,这次邀请是 AI 对她学术生活的许多不受欢迎的入侵中的最新一次。她回忆起最近的一次会议,一位同事对改进的 AI 天气预报发表了评论,这些预报最近开始在某些任务上优于传统的基于物理的模型。这位同事预测,他们将在五年内使用 AI 解决气候建模问题,并且很快就会“将物理学扔进垃圾桶”。

这个想法让 Bastos 感到震惊,她经常在研究中使用机器学习。她说,即使是出色的 AI 天气预报模型也往往会淡化最极端的事件。随着气候模式的变化和关于大气的基本假设(隐含在用于创建这些模型的数据中)过时,它们也可能会陷入困境。不仅如此,基于 AI 的预报最适合具有大量数据集的近期天气模型。长期气候建模依赖于更稀缺且更具不确定性的数据。

她的同事不受约束的乐观——一种对人工智能力量的宿命论——让巴斯托斯怀疑,学者们是否像他们所认为的那样自主地采用人工智能。这个工具是强加给艺术家的。她注意到,使用人工智能的工作更容易获得资助和期刊出版物。她想知道:哪些研究没有因此而获得资助?哪些研究没有发表?

她看到人们依赖人工智能驱动的文献综述而不检查单个引文的方式发生了微妙的变化。未来,什么可能会阻止人们使用 AI 对发表的论文进行评分,或决定谁获得资助?“我只是认为曲线的加速会让一切变得更糟,”巴斯托斯告诉我。

对于伯克利计算机科学家 Listgarten 来说,效率是 AI 的巨大承诺之一。它可以以一种原本不可能的方式加速科学。她将其与互联网或显微镜进行了比较。“关键是要产生结果,”她说。

但一系列重叠的担忧使她在一个星期天的早上疯狂写作。她一直收到很多关于 AlphaFold 和 ChatGPT 将如何“解决”各种领域的科学的询问。到那天下午,她已经完成了一份草稿,该草稿后来成为《自然生物技术》上的一篇文章,名为”AI 生成数据的永动机和 ChatGPT 作为“科学家”的注意力。(打开新标签页)“这差不多是一本《自然》杂志发表一场辩论。

AlphaFold3 预测分子复合物的结构,例如在植物损伤真菌中发现的这种酶。在这个模型结构中,蛋白质(蓝色)与单糖(黄色)和离子(黄色球体)相连。

她观察到,许多人,包括科学领袖,都没有意识到是什么让 AI 在某些有限的情况下(例如 AlphaFold)与众不同。该项目需要大量精心标记的数据。在那里,AI 能够利用几十年来已发表的关于蛋白质结构的实验研究,这些研究生产成本约为 200 亿美元(打开新标签页).

并非每个领域都有蛋白质折叠所包含的数据,或者涉及非常适合 AI 训练的问题。在没有任何一个的情况下,人们正在寻找捷径,例如 AI 创建的合成数据来训练其他 AI 系统。或者,他们希望大型语言模型能够在他们绝不擅长的领域中展示出强大的理解力,甚至产生新的见解。

Listgarten 认为,这种方法注定会令人失望。在寻找万能机器的过程中,即理解人们尚无法理解的事物的预言机,对数据的需求是无法回避的。“我们只需要回到工作台上,做更多的实验,”她说。

在 Krenn 开发 Melvin 十年后,参与该项目的研究生每隔几周就会在 Zoom 上开会,了解量子物理学并八卦。

Fickler 是 Krenn 对 AI 生成的研究想法进行调查的 100 多只豚鼠之一。当调查结果出来时,大多数想法在 1 到 5 的范围内都得到了 1 分。但大约四分之一的分数是 4 或 5 分,即“有趣”或“非常有趣”。对 Krenn 来说,25% 是一个很好的起点。“我不确定我能不能产生这么多有趣的想法,”他说。

这一切都在很大程度上是一个实验,仅仅因为一个想法的评价很高,并不意味着任何人都必须追求它——毕竟,这就是科学的美妙之处,就是探究的选择。它们只是更多的想法可以扔进去。但 Krenn 说,这是一个迹象,表明在当前这条跨越科学之间建立令人惊讶的联系的道路上,有更多的创造性见解可供挖掘。

点击观看此视频,即表示您同意我们的隐私政策。

视频:Mario Krenn 使用人工智能提出个性化的研究问题和想法。

艾米丽·布德

这样的联系能否变成一个极具创意的想法,既能理解所有实验证据,又能挑战我们所知道的?即使对 Krenn 来说,这也不清楚。他说,“很难看出这样的程序是如何产生范式转变的”,就像阿尔伯特·爱因斯坦(Albert Einstein)对他极具创造性的引力理论所做的那样。但话又说回来,他想,我们也不能完全理解人类是如何得出天才的见解的。如果创造力最终更机械而不是魔法,那么科学的创造力机器也不是不可能的。“我非常乐观地认为我们可以想出它,”他说。

这个想法仍然让 Fickler 既印象深刻又担心,他经常利用他们的视频通话来刺激他朋友的工作,提出批评和问题。“也许我不想让 AI 变得那么强大,”他告诉我。“但很多时候,马里奥证明我错了。”

目前,他和大多数科学家处于同一条船上:试图弄清楚这一切是如何运作的。Fickler 偶尔使用 ChatGPT 来帮忙编码和清理资助提案,因为英语不是他的第一语言。这是一个不情愿的拥抱;他认为,当其他人都有这种优势时,就会有压力,要走得更快一点,听起来也好一点。人工智能产生的东西“听起来太好了,”他说。“我喜欢错误;我喜欢个性。但他发现,一旦你开始使用它,它就很难被抛弃。

来源:人工智能学家

相关推荐