某机构研究团队在《自然》杂志发表论文,介绍能够解决复杂几何问题的AI系统AlphaGeometry,其表现接近人类奥林匹克数学竞赛金牌得主水平。在包含2000年至2022年奥赛题目的30道几何问题测试集(IMO-AG-30)中,该系统在竞赛时间限制内解决了25道题,而此前最先进的方法(吴方法)仅能解决10道题。
AlphaGeometry采用神经符号架构,包含神经语言模型和符号推理引擎。语言模型擅长识别数据中的模式关系,可快速预测潜在有用的几何构造(如点、线、圆),符号引擎则基于形式逻辑进行严格推理。两者协同工作类似于"快慢思考"机制:语言模型提供直觉性构想,符号引擎进行理性决策。
当遇到奥赛几何问题时,系统首先通过符号引擎推导图表关系。若无法求解,语言模型会从无限可能中预测最有效的补充构造,这些构造为符号引擎开辟新的推理路径,通过循环迭代直至找到解决方案。
通过高度并行化计算,系统首先生成10亿个随机几何图表,穷举点线间所有关系,采用"符号推导与回溯"方法自动发现证明过程所需的所有构造。经过滤去重后,最终获得1亿个独特训练样本,其中900万个包含补充构造。这种合成数据生成方法突破了传统训练数据匮乏的瓶颈。
所有解决方案均经过计算机验证,并与传统AI方法及人类表现进行对比。前奥赛金牌得主评价称:"解决方案既具备机器可验证的结构,又保持人类可读性,使用经典几何规则如角度和相似三角形,而非暴力坐标计算方式。"
虽然当前系统仅能处理奥赛中占比1/3的几何问题,但其已达到2000年和2015年IMO铜牌门槛要求。该研究展示了使用大规模合成数据训练AI系统的潜力,为下一代AI系统的知识发现机制提供了新范式。团队已开源AlphaGeometry代码和模型,期待推动数学、科学和AI领域的创新发展。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。