做数学题,人工智能和人类大师是相当的

研发家 | 2025-05-05 21

一年前,谷歌Depmind开发的人工智能问题解决方案Alphageometry在国际数学奥林匹克竞赛中(IMO)达到银牌选手的水平,震惊了世界。IMO是为有才华的高中生设置的难度极高的数学竞赛。

Depmind团队现在表示,系统升级后的Alphageometry2的性能已经超过了IMO金牌玩家的水平。2月5日,相关研究成果在预印服务器arxiv上公布。

伦敦帝国理工学院的数学家Kevin Buzzard说:“我想用不了多久,计算机就能在IMO中获得满分。”

欧几里得几何问题是IMO的四个主题之一,其他主题包括数论、代数和组合学的分支。几何学对人工智能有特殊的要求,因为参与者必须为解释平面几何学对象提供严格的确认。去年7月,Alphageometry2与新推出的Alphaprof系统公开亮相,Deepmind开发解决IMO非几何问题。

Alphageometry由包括特殊语言模型和“神经符号”系统在内的多个部分组成。“神经符号”系统不像神经网络在学习中训练数据,而是由人类编码抽象推理。团队训练特殊语言模型使用形式化的数学语言,使其能够自动检查其输出逻辑的严谨性,去除人工智能聊天机器人容易产生的“幻觉”,即不连贯或错误的阐述。

对于Alphageometry2,该团队进行了几项改进,例如集成了谷歌最先进的大型语言模型gemini。此外,它还引入了移动平面上几何对象进行推理的能力,例如沿直线移动一个点来改变三角形的高度,并解决线性方程。

该系统可以解决过去25年IMO中84%的几何问题,而第一代AlphaGeometry只能解决54%。

Depmind的研究人员表示,Alphageometry未来的改进将包括处理涉及不等式和非线性方程的数学问题,这将需要“完全解决几何问题”。

第一个在整体测试中获得金牌分数的人工智能系统可能会获得500万美元的“人工智能数学奥林匹克奖”。然而,比赛要求系统是开源的,而Deepmind则不是。

Buzzard说,虽然这些问题很困难,但这门课程的概念仍然很简单。在人工智能能够解决数学研究问题之前,还有许多挑战需要克服。

人工智能研究人员热切期待着今年7月在澳大利亚阳光海岸举行的下一个IMO。一旦问题向参赛者披露,人工智能系统也有机会解决这个问题。然而,人工智能不能参加比赛,所以它没有资格获得奖牌。

赞一个

分享:
打开微信扫一扫
15
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版无忧
投稿无忧
翻译服务
润色服务
自助查重
排版校对
科研绘图