一年前,谷歌Depmind开发的人工智能问题解决方案Alphageometry在国际数学奥林匹克竞赛中(IMO)达到银牌选手的水平,震惊了世界。IMO是为有才华的高中生设置的难度极高的数学竞赛。
Depmind团队现在表示,系统升级后的Alphageometry2的性能已经超过了IMO金牌玩家的水平。2月5日,相关研究成果在预印服务器arxiv上公布。
伦敦帝国理工学院的数学家Kevin Buzzard说:“我想用不了多久,计算机就能在IMO中获得满分。”
欧几里得几何问题是IMO的四个主题之一,其他主题包括数论、代数和组合学的分支。几何学对人工智能有特殊的要求,因为参与者必须为解释平面几何学对象提供严格的确认。去年7月,Alphageometry2与新推出的Alphaprof系统公开亮相,Deepmind开发解决IMO非几何问题。
Alphageometry由包括特殊语言模型和“神经符号”系统在内的多个部分组成。“神经符号”系统不像神经网络在学习中训练数据,而是由人类编码抽象推理。团队训练特殊语言模型使用形式化的数学语言,使其能够自动检查其输出逻辑的严谨性,去除人工智能聊天机器人容易产生的“幻觉”,即不连贯或错误的阐述。
对于Alphageometry2,该团队进行了几项改进,例如集成了谷歌最先进的大型语言模型gemini。此外,它还引入了移动平面上几何对象进行推理的能力,例如沿直线移动一个点来改变三角形的高度,并解决线性方程。
该系统可以解决过去25年IMO中84%的几何问题,而第一代AlphaGeometry只能解决54%。
Depmind的研究人员表示,Alphageometry未来的改进将包括处理涉及不等式和非线性方程的数学问题,这将需要“完全解决几何问题”。
第一个在整体测试中获得金牌分数的人工智能系统可能会获得500万美元的“人工智能数学奥林匹克奖”。然而,比赛要求系统是开源的,而Deepmind则不是。
Buzzard说,虽然这些问题很困难,但这门课程的概念仍然很简单。在人工智能能够解决数学研究问题之前,还有许多挑战需要克服。
人工智能研究人员热切期待着今年7月在澳大利亚阳光海岸举行的下一个IMO。一旦问题向参赛者披露,人工智能系统也有机会解决这个问题。然而,人工智能不能参加比赛,所以它没有资格获得奖牌。
赞一个