做数学题,人工智能和人类大师是相当的
研发家 | 2025-05-05 21

一年前,谷歌Depmind开发的人工智能问题解决方案Alphageometry在国际数学奥林匹克竞赛中(IMO)达到银牌选手的水平,震惊了世界。IMO是为有才华的高中生设置的难度极高的数学竞赛。

Depmind团队现在表示,系统升级后的Alphageometry2的性能已经超过了IMO金牌玩家的水平。2月5日,相关研究成果在预印服务器arxiv上公布。

伦敦帝国理工学院的数学家Kevin Buzzard说:“我想用不了多久,计算机就能在IMO中获得满分。”

欧几里得几何问题是IMO的四个主题之一,其他主题包括数论、代数和组合学的分支。几何学对人工智能有特殊的要求,因为参与者必须为解释平面几何学对象提供严格的确认。去年7月,Alphageometry2与新推出的Alphaprof系统公开亮相,Deepmind开发解决IMO非几何问题。

Alphageometry由包括特殊语言模型和“神经符号”系统在内的多个部分组成。“神经符号”系统不像神经网络在学习中训练数据,而是由人类编码抽象推理。团队训练特殊语言模型使用形式化的数学语言,使其能够自动检查其输出逻辑的严谨性,去除人工智能聊天机器人容易产生的“幻觉”,即不连贯或错误的阐述。

对于Alphageometry2,该团队进行了几项改进,例如集成了谷歌最先进的大型语言模型gemini。此外,它还引入了移动平面上几何对象进行推理的能力,例如沿直线移动一个点来改变三角形的高度,并解决线性方程。

该系统可以解决过去25年IMO中84%的几何问题,而第一代AlphaGeometry只能解决54%。

Depmind的研究人员表示,Alphageometry未来的改进将包括处理涉及不等式和非线性方程的数学问题,这将需要“完全解决几何问题”。

第一个在整体测试中获得金牌分数的人工智能系统可能会获得500万美元的“人工智能数学奥林匹克奖”。然而,比赛要求系统是开源的,而Deepmind则不是。

Buzzard说,虽然这些问题很困难,但这门课程的概念仍然很简单。在人工智能能够解决数学研究问题之前,还有许多挑战需要克服。

人工智能研究人员热切期待着今年7月在澳大利亚阳光海岸举行的下一个IMO。一旦问题向参赛者披露,人工智能系统也有机会解决这个问题。然而,人工智能不能参加比赛,所以它没有资格获得奖牌。

赞一个

分享:
打开微信扫一扫
15
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版支持
翻译服务
润色服务
自助查重
排版校对