日前,谷歌DeepMind展示了一种基于强化学习的新型形式数学推理系统AlphaProof以及几何求解系统的改进版本AlphaGeometry 2。这两个新AI模型共同解决了今年国际数学奥林匹克竞赛(IMO)六个问题中的四个,首次达到了与比赛中银牌得主相同的水平。
图源:谷歌
据悉,IMO是历史最悠久、规模最大、最负盛名的青年数学家竞赛,自1959年以来每年举行一次。近年来,IMO也被广泛认为是机器学习领域的重大挑战,也是衡量人工智能系统高级数学推理能力的理想基准。
在今年的IMO中,AlphaProof在将比赛问题手动翻译成正式的数学语言供系统理解后,成功解决了两个代数问题和一个数论问题,这是比赛中最难的问题,在今年的IMO上只有五名参赛者成功解决,而AlphaGeometry 2证明了几何问题。
据悉,比赛总分为42分,每个问题为7分。AlphaProof和AlphaGeometry 2最终得分为28分,相当于模型能够解决的四个问题都获得了满分,而这已经达到了银牌类别的水准。相对的,比赛金牌门槛为29分,609名参赛者中只有58人能够达到。
图源:谷歌
DeepMind对此则表示,“我们对未来感到兴奋,数学家使用人工智能工具是一种大胆尝试,能够帮助解决数学领域长期存在的问题并快速完成耗时的证明过程。AI系统在数学和更广泛的推理方面开始变得更有能力。”