陶哲轩警告AI数学陷阱:当目标被误解,灵魂就被吞噬了

360影视 欧美动漫 2025-09-17 11:11 1

摘要:陶哲轩最近发了一篇短博客,语气不重,但字字如锤。他说,AI已经悄悄改变了数学研究的底色。表面看,它帮我们爬上了一座又一座数学高峰,实际上,却可能在一路上摧毁了原本最宝贵的东西。

陶哲轩最近发了一篇短博客,语气不重,但字字如锤。他说,AI已经悄悄改变了数学研究的底色。表面看,它帮我们爬上了一座又一座数学高峰,实际上,却可能在一路上摧毁了原本最宝贵的东西。

这不是危言耸听。作为世界顶尖的数学家,陶哲轩的担忧,来自他对数学研究本质的深刻体会——那些看不见的“隐性目标”,才是真正塑造一代学者、构建知识体系、推动社区成长的基石。而AI,一不小心就会踩碎它们。

在传统的人类主导的数学研究中,一个项目的“目标”从来不只是那个最终定理的证明。它还包括提高团队水平、沉淀可复用的工具、促进社区成长、训练新人,甚至碰撞出一些意料之外的数学洞见。

过去,我们不需要特意强调这些“隐性目标”,因为它们天然地嵌在研究过程中。但现在,AI来了,它只认一个指令:“完成任务”。于是,为了实现这个唯一的“显性目标”,AI可能会:

用极其复杂却不可读的方式完成证明;跳过所有常规引理,直接“走捷径”抵达终点;生成一堆没人能维护的代码;完全绕过团队协作、知识传播这些“副产品”。

结果是:项目完成了,但人类什么都没学会。甚至连“这条路为什么能走通”都说不清楚。AI像个听话但不懂人情世故的“工兵”,它能挖通隧道,却不知道这一挖可能震塌整座山。

“当一个指标变成目标,它就不再是好指标。”

陶哲轩在文中提到了一个经济学法则:Goodhart定律。意思是:当你把某项衡量指标当作行为目标时,这项指标就会变得不再可靠,甚至起反作用。

比如你设定一个KPI:客服通话越短越好。结果员工为了追KPI,不解决问题、反而催客户快挂电话,最终用户体验一塌糊涂。

AI就是Goodhart定律的完美执行器。你告诉它“解决定理”,它就只管“完成任务”,不管用什么方法、有没有复用性、是否对人类有意义。

数学研究的“灵魂”——那些无形的标准、经验、美感和共同成长——就这样被忽略了。

好消息是,陶哲轩的担忧并非无人回应。

一群来自伯克利、加州理工、斯坦福、香港大学的数学家和AI专家,最近发布了一个新项目——GAUSS(General Assessment of Underlying Structured Skills in Mathematics)。

这是目前最系统、最专业的数学AI评估框架之一。它不止考“AI能不能答对题”,而是把数学能力拆成三大领域、十二项技能,逐个维度评估:

知识与理解:基础记忆、理论掌握分析与表达:逻辑推理、解题策略、书写表达元技能与创造力:学习能力、直觉、泛化、建模、创新

GAUSS还特别注意“防题熟”“防泄漏”,专挑模型没见过的新题、难题来测。它要测的是:AI有没有真正的数学能力,而不仅仅是“刷了多少题”。

GAUSS还强调**“协同价值”**:你解出题了,那代码能不能复用?能不能带动新人成长?有没有构建起可读、可维护的知识结构?这,才是一个完整数学项目的应有之义。

陶哲轩的提醒很简单——AI不是问题,我们人为它设定的目标才是关键。如果我们只盯着“答对没有”,那AI就会只关心“答对就行”,而不是“怎么答”“对谁有用”“能否传承”。

GAUSS提供了一个新思路:与其盲目追求高分,不如回到本质,看看AI有没有在“像一个真正的数学家那样思考”。

科学研究的终极意义,从来不是登顶一个个数学高峰,而是在过程中建起一座座通向智慧的桥梁。

来源:老闫侃史视频

相关推荐