摘要:一张图和寥寥数语的题干就能构成一道令人头疼的几何题,它看似简单,可实际做起来,画辅助线却让人画到崩溃,为证明两个角相等而到灵感枯竭。如今,一种既熟悉又陌生的力量——人工智能,正悄悄地学会做这些几何题,甚至它的解题速度比人类更快,准确率更高。
撰文/石爽爽(中国科协科学技术传播中心) 王杰(中国科学院数学与系统科学研究院)
一张图和寥寥数语的题干就能构成一道令人头疼的几何题,它看似简单,可实际做起来,画辅助线却让人画到崩溃,为证明两个角相等而到灵感枯竭。如今,一种既熟悉又陌生的力量——人工智能,正悄悄地学会做这些几何题,甚至它的解题速度比人类更快,准确率更高。
解几何题:
人工智能的新挑战
你或许会心生疑惑:人工智能可以下棋、写诗、与人类“交谈”,但它可以解数学题,尤其是平面几何这种既要看图分析,又要拼脑洞、讲推理的题目吗?没错,它不仅能做到,而且还做得越来越好。今天,就让我们一同走进人工智能解几何题的神奇世界,探究这个没有手、没有眼的“数字大脑”是如何做到的。
为何解平面几何题如此困难?从人类的角度来看,这需要3种能力的协同配合:
图形感知能力:能看懂图,理解点、线、角的位置关系。
逻辑推理能力:依据已知条件推导出结论,层层推进。
空间想象能力:在头脑中搭建几何模型,添加合适的辅助线,构建新的几何关系。
解几何题不仅考验思维的严谨性,更考验思维的创造性,而创造性恰恰是人工智能曾经的薄弱环节。以往的人工智能,最擅长的是处理过程明确的计算型问题,例如解方程——给它一个一元二次方程“x2-3X=7”,它不费吹灰之力就能算出答案。但要是给它一个画着三角形、圆,还写着“已知AB=AC,证明∠ABC=∠ACB”的图文题,它就无从入手了。因为此时人工智能需要的不再是计算能力,而是理解与推理能力——它要先看懂图,再看懂题,还要进一步演绎推导,最终才能给出答案。这听起来和人类的思维过程很相似吧?实际上,人工智能解几何题,就是在尝试模仿人类的数学思维模式。
第一步:
看图识图 理解图形
想象一下,当你拿到一道几何题的第一反应,是不是先看图?人工智能也是如此。然而对人工智能来说,图像不过是像素点的组合,它要如何理解“这是一个三角形”“这里是垂直关系”“这个点叫”呢?这就需要借助计算机视觉技术了。
图像识别:人工智能要先识别图形中的点、线、角等元素,就如同它在区分猫和狗时,会先识别耳朵和鼻子等特征一样。
几何元素提取:将识别出的这些元素整理为“线段AB” “∠ABC” “圆O”等具体的几何元素。
几何关系建模:分析这些元素之间的几何关系,例如“AB=AC” “∠ABC=30° ”等。
这一过程,就像人工智能在“读图”。它要把抽象的图形转化为几何数据结构,记录点线之间的关系、角度大小、是否垂直或平行等信息。
第二步:
读懂文字 领会题意
几何题并不只是一张图,题干中的几句话,往往隐藏着关键信息。例如“已知AB=AC,∠ABC=30°,求∠ACB的度数”,这句话对人类而言一目了然,但对人工智能来说却是另一个挑战,它需要借助自然语言处理技术,去理解语言中的逻辑关系。这一过程包括:
特征识别:识别出“AB”“AC” “∠ABC”等几何对象。
条件与问题提取:理解哪些是已知条件,哪些是要解决的问题。
几何关系分析:理解几何对象之间的关系,例如等长、共点、共圆等。
到这一步,人工智能就完成了“读图”和“看题”的前置工作。此时它的“脑海”中已经形成了一张结构化图谱,涵盖了所有的图形、几何关系和解题任务。下一步,就是“动脑筋”了。
第三步:
逻辑推理 寻找答案
这一步,是整个过程最神奇也最关键的环节。人类解几何题的传统方法,是应用各种已知的几何公理或定理,如平行公理、角平分线定理、勾股定理等,一步步推理直至推出想要的结论。人工智能要做的事情与之类似。目前,人工智能在这一环节主要有两种不同的思路:
基于代数算法的计算推理
这是人工智能解几何题的传统方式,也叫作几何定理的机器证明,由我国数学家吴文俊开创。其核心思路是将几何命题转化为代数方程组之间的蕴含关系,而代数方程组的变形与化简可通过数学算法完成,进而可在计算机上实现几何命题的自动化证明。这种方法的优势在于有严格的理论保障为支撑,缺点是代数计算的过程缺乏可读性和几何直观性。此外,数学家张景中提出的面积法生成证明的步骤更贴近人类思维,可读性更强。
基于神经网络的符号推理
另一种更聪明的策略,是让人工智能自己“学”会几何题的解题规律。通过海量训练数据,人工智能使用深度学习模型——尤其是图神经网络与Transformer架构——来预测如何添加辅助线和可能的定理应用序列,以此模拟人类直觉。同时,人工智能内置符号推理引擎可确保推理步骤的准确性。这种方法的优点是泛化能力强,能解答各种复杂的非标准几何题;缺点是推理过程不容易解释,更像是某种“黑箱”。
你可能会问:人工智能能解决现实中的几何题吗?还是仅限于处理一些简单题?答案是:真的可以,甚至已经应用到了真实教育场景。举两个真实例子:
在微软开发的MathSolver平台,用户上传几何题,它可以识别图形,自动解答,并生成解答步骤;
在国际奥林匹克数学竞赛中,谷歌开发的人工智能系统能够解答84%的几何题,超过金牌得主平均水平。
这些案例表明,人工智能解几何题已经从理论概念转化为一项实用工具。其实,除了帮中学生“写作业”,人工智能解几何题还有更广阔的应用前景,例如:
教学辅助——人工智能可以成为“几何导师”,随时解释题目、自动画图、动态演示,让抽象的几何变得生动直观。
研究助手——在数学研究中,人工智能正被用于自动发现几何定理或数学命题,辅助科学研究,提高科研效率。
通用人工智能测试平台——几何题综合语言、图像、逻辑推理,是检验人工智能是否具备“通用智能”的理想任务。
虽然人工智能在解几何题方面取得了显著进展,但它依然有一些短板,例如:对手绘图或模糊图识别不稳定,对抽象或隐含条件的理解仍有障碍,推理过程有时缺乏可解释性,并且缺乏“灵感跳跃”的能力。可以说,人工智能解题在规则稳定、逻辑清晰的题目上表现出色,但在需要灵活发散思维的题目上仍难以超越人类。
未来,随着多模态大模型的进一步发展,我们有望看到更智能的“几何人工智能”出现,它不但能解题,还能讲解,甚至可以设计新的题目。或许在未来的数学课堂上,坐在你旁边的“学霸”,就是一个安静又聪明的人工智能助手。
来源:知识就是力量杂志一点号