现在,为了帮助解决世界上最棘手的数学问题,研究人员开发了一种新的人工智能模型,可以找到需要数千到数百万步的复杂解决方案。
他们表示,他们为这项任务构建的新算法有朝一日可能有助于检测飓风和金融危机等罕见但一旦发生就会造成灾难性影响的事件。
科学家们越来越多地探索人工智能解决数学问题的能力。例如,谷歌DeepMind的 AlphaProof 在 2024 年国际数学奥林匹克竞赛(一项高中数学竞赛)中表现出色,获得银牌,而 OpenAI 的 o3 系统最近首次亮相,在数学、科学和计算机编程的基准问题上表现出色。
在一项尚未经过同行评审的新研究中,加州理工学院的研究人员及其同事解决了更具挑战性的数学问题,这类问题几十年来一直困扰着专业数学家。
「说到你可能在数学奥林匹克中遇到的那种问题,它们的证明通常涉及 30 或 40 个步骤,与普通的国际象棋比赛的难度相同币游虚拟社区建设。」加州理工学院理论物理和数学教授 Sergei Gukov 说,「我们专注于复杂的研究级数学问题,其解决方案涉及数千、数百万甚至数十亿个步骤。」
最终,「我希望我们能够利用人工智能解决千禧年大奖难题。」Gukov 表示,他指的是一项涉及世界上最困难的数学问题的竞赛,「这可能对我来说过于乐观,但有北极星总是好的。目前,我们正试图将重点放在低一级的问题上,即那些多年来一直悬而未决的问题。」
在这项新研究中,Gukov 团队专注于 Andrews-Curtis 猜想,这是 60 年前首次提出的组合群论问题。
「组合群论是关于物体的变换的。」Gukov说,「想想魔方。这是一个非常简单的群,具有基本的操作和变换——你可以垂直和水平旋转魔方的不同平面。安德鲁斯-柯蒂斯猜想就像一个强化版的魔方——它不是一个 3 x 3 x 3 的群,而更像是一个 100 x 100 x 100 的群。」
尽管研究人员未能证明主要猜想,但他们的新系统反驳了被称为潜在反例的相关问题,这些问题已经悬而未决了大约 25 年。这些反例本质上是可以反驳猜想的数学案例。排除这些反例会增加猜想成立的可能性。
「如果你要求 DeepSeek 或 o3 或 ChatGPT 或类似模型解决我们研究的任何问题,它们都无法找到答案。」他说,「它们擅长产生预期或典型的解决方案,擅长重复以前看到的内容。它们旨在成为通用模型。我们正在研究很难找到的长序列步骤,它们是解决方案统计分布中的异常值。」
为了开发这些研究人员称之为「超级动作」的策略,Gukov 团队采用了强化学习的方法。他们首先给人工智能一些简单的问题让其解决,然后逐渐给它更困难的问题。科学家们寻找不需要大量计算能力的策略;Gukov 说,所有的训练都是在单个 GPU 上完成的。
Gukov 指出,在强化学习研究中,人们通常使用相同的 10 到 15 种算法。「我发现最令人兴奋的是,通过以非常长的眼光思考解决这些问题,我们为人工智能开发了新的算法。」他说。
Gukov 说,这些新算法「除了纯数学之外,可能还有很多应用……它们可以发现异常值、异常现象、黑天鹅事件——这些事件非常非常罕见,但如果真的发生,代价将非常高昂。」
这些事件非常罕见,因此人工智能很难准确预测它们——它们的不寻常性质意味着预测模型几乎没有历史数据可供借鉴。预测这些最有可能和最灾难性的情景的能力可以帮助社会制定最佳的缓解策略。
Gukov 的团队目前正在研究其他长期存在的数学问题,以帮助他们开发算法。2 月 13 日,他们在 ArXiv 预印平台上的一项研究中详细介绍了他们的研究结果。