摘要:就在5月,前有DeepSeek Prover V2发布,后有陶哲轩的AI数学直播,还有谷歌最新发布的AlphaEvolve。
林樾 发自 凹非寺
量子位|公众号 QbitAI
就在5月,前有DeepSeek Prover V2发布,后有陶哲轩的AI数学直播,还有谷歌最新发布的AlphaEvolve。
大模型“解数学题”的能力已经是衡量AI「智能天花板」的一种方式,正吸引着无数团队争相挑战。
为了更好地评估AI完成数学推理的能力,近期发布的FormalMATH基准测试也备受关注。
现在,AI完成自动定理证明的表现与挑战究竟如何?主流的技术路径是什么?AI完成形式化证明的能力,又将对大模型应用带来怎样的影响?
为了回答这些问题,5月29日20:00,我们与2077AI开源基金会共同邀请到了来自DeepSeek Prover、FormalMath、Kinima等项目团队的成员,一同来讨论大语言模型形式化证明前沿探索。
本周四晚20:00,一起来聊聊AI数学吧~
来源:量子位一点号