谷歌人工智能研发实验室DeepMind认为,更强大的人工智能系统的关键可能在于发现解决具有挑战性的几何问题的新方法。
为此,DeepMind今天发布了AlphaGeometry——该实验室声称,该系统可以解决与国际数学奥林匹克金牌得主一样多的几何问题。AlphaGeometry的代码今天早上被公开,它在标准时间内解决了25个奥林匹克几何问题,超过了之前最先进的系统的10个。
谷歌人工智能研究科学家Trieu Trinh和Thang Luong在今天上午发表的一篇博客文章中写道:“解决奥林匹克级别的几何问题,是在通往更先进、更通用的人工智能系统的道路上发展深度数学推理的一个重要里程碑。”“(我们)希望……AlphaGeometry有助于在数学、科学和人工智能领域开辟新的可能性。”
为什么要关注几何?DeepMind断言,证明数学定理,或从逻辑上解释为什么一个定理(例如毕达哥拉斯定理)是正确的,既需要推理,也需要从一系列可能的解决方案中进行选择的能力。如果DeepMind是对的,这种解决问题的方法有一天可能会在通用人工智能系统中发挥作用。
DeepMind在TechCrunch上分享的新闻稿中写道:“即使是当今最先进的人工智能系统,也很难证明一个特定猜想的真假。”“为了实现这一目标,能够证明数学定理……是一个重要的里程碑,因为它展示了对逻辑推理的掌握和发现新知识的能力。”
但训练人工智能系统解决几何问题带来了独特的挑战。
由于将证明转换成机器可以理解的格式很复杂,因此缺乏可用的几何训练数据。如今,许多尖端的生成式人工智能模型虽然在识别数据中的模式和关系方面表现出色,但缺乏通过定理进行逻辑推理的能力。
DeepMind的解决方案是双重的。
图片来源:DeepMind
在设计AlphaGeometry时,实验室将一个“神经语言”模型——一个在架构上与ChatGPT类似的模型——与一个“符号演绎引擎”配对,一个利用规则(例如数学规则)推断问题解决方案的引擎。符号引擎可能不够灵活和缓慢,特别是在处理大型或复杂的数据集时。但DeepMind通过神经模型“引导”演绎引擎找出给定几何问题的可能答案,缓解了这些问题。
代替训练数据,DeepMind创建了自己的合成数据,生成了1亿个“合成定理”和不同复杂性的证明。然后,实验室在合成数据上从头开始训练AlphaGeometry,并在奥林匹克几何问题上对其进行评估
奥林匹克几何问题是基于图形的,在解决这些图形之前需要添加“结构”,比如点、线或圆。应用于这些问题,AlphaGeometry的神经模型预测哪些结构可能对添加有用——AlphaGeometry的符号引擎使用这些预测对图表进行演绎,以识别类似的解决方案。
Trinh和Luong写道:“有这么多关于这些结构如何导致证明的例子,AlphaGeometry的语言模型能够在面对奥林匹克几何问题时为新的结构提供很好的建议。”“一种系统提供快速、‘直观’的想法,另一种系统提供更深思熟虑、更理性的决策。”
本周发表在《自然》(Nature)杂志上的一项研究中,AlphaGeometry解决问题的结果可能会引发一场旷日持久的辩论,即人工智能系统应该建立在符号操作(即使用规则操纵代表知识的符号)还是表面上更像大脑的神经网络的基础上。
神经网络方法的支持者认为,智能行为——从语音识别到图像生成——可以从大量的数据和计算中产生。符号系统通过定义一组专用于特定工作(如在文字处理软件中编辑一行)的符号操作规则来解决任务,而神经网络则试图通过统计近似和从示例中学习来解决任务。
神经网络是OpenAI的DALL-E 3和GPT-4等强大人工智能系统的基石。但是,符号人工智能的支持者声称,它们并不是最终的一切;这些支持者认为,符号人工智能可能更适合有效地对世界的知识进行编码,在复杂的场景中进行推理,并“解释”它们是如何得出答案的。
作为一个类似于DeepMind的AlphaFold 2和AlphaGo的混合符号-神经网络系统,AlphaGeometry可能表明,符号操作和神经网络这两种方法相结合是搜索可泛化人工智能的最佳途径。也许。
Trinh和Luong写道:“我们的长期目标仍然是建立能够在数学领域进行推广的人工智能系统,开发通用人工智能系统所依赖的复杂问题解决和推理能力,同时扩展人类知识的前沿。”“这种方法可以塑造未来的人工智能系统如何在数学和其他领域发现新知识。”