谷歌DeepMind用AI解决超级数学难题,相关AI论文获大师级数学家陶哲轩点赞(2016年谷歌公司人工智能)

谷歌 DeepMind 利用强大的语言模型成功解决了一个在纯数学领域一直悬而未决的问题。在发表在 Nature 杂志上的一篇研究论文中,研究人员表示这是首次利用大型语言模型发现一个长期存在的科学难题的解决方案,从而产生了前所未有的可验证且有价值的新信息。

“它不在训练数据中,甚至不为人所知。” 论文合著者、谷歌DeepMind研究副总裁普什梅特·科利(Pushmet Kohli)表示。

大型语言模型以生成虚构内容而闻名,而不是提供新的事实。谷歌 DeepMind 最新推出的工具 FunSearch 可能会改变这一现状。这表明它们确实可以产生新的发现,前提是它们经过特殊设计,并且筛选掉了大部分无用的内容。

FunSearch 这个名字的起源并不是因为它很有趣,而是因为它被用于搜索数学函数(Function)。FunSearch 延续了 DeepMind 在基础数学和计算机科学方面使用人工智能进行的一系列研究。

举例来说,AlphaTensor发现了一种更加高效的矩阵乘法算法,打破了过去50年来的记录。AlphaDev则发现了一种全新的数据排序算法,使得这种每天被使用数万亿次的关键算法的运行速度更快。

然而,这些工具并没有使用大型语言模型。两者都建立在 DeepMind 的游戏AI AlphaZero 之上,通过将数学问题视为围棋或国际象棋中的谜题来解决它们。

该公司的研究员贝尔纳迪诺·罗梅拉·帕雷德斯(Bernardino Romera Paredes)表示,AlphaTensor和FunSearch的研究人员面临的问题是他们在自己的领域中受限:“AlphaTensor在矩阵乘法方面表现出色,但在其他方面相对较弱。”

谷歌 DeepMind 的研究科学家阿尔侯赛因·法齐(Alhussein Fawzi)表示:“实际上,尽管我们有假设,但我们对于其有效性的原因一无所知。在项目开始时,我们完全不确定它是否可行。”

研究人员首先使用Python编写了问题的框架,但在代码中留下了解决问题的部分空白。这就是FunSearch发挥作用的地方。他们让Codey填写空白部分,也就是提供能够解决问题的代码。

接下来,第二个算法会对Codey的结果进行检查并给出评分。即使结果不正确,也会将其保存并返回给Codey,让Codey再次尝试完成该程序。

科利表示:“很多建议都是荒谬的,有些是可以接受的,还有一小部分非常有启发性。你可以选择那些真正有启发性的建议,然后再次强调它们,说‘拿着这些,然后再重复一遍。’”

想象一下在图表纸上绘制点的过程,”帽子集”问题类似于尝试计算在不形成一条直线的情况下可以放置多少个点。

陶哲轩(Terence Tao),美国加州大学洛杉矶分校的菲尔兹奖获得者,在2007年的一篇博客文章中将这个问题描述为“也许是自己最喜欢的未解之谜”。他对FunSearch的能力非常感兴趣,称其为“一种有前途的范例,一种利用大型语言模型的有趣方式。”

与 AlphaTensor 相比,FunSearch 的一个重要优势是,理论上它可用于寻找各种问题的解决方案。这是因为它可以通过生成代码的方式来找到解决方案的一部分(配方),而不是费力地寻找整个解决方案。

不同的编码将解决不同的问题。FunSearch 的结果也更易于理解。法齐说,公式通常比它产生的奇怪的数学解决方案更清晰。

为了验证其多功能性,研究人员使用FunSearch来解决数学中的另一个难题:装箱问题,即试图以最少的箱子来装载物品。

这对于计算机科学的一系列应用非常关键,涵盖了从数据中心管理到电子商务的各个领域。FunSearch 也提出了一种比人类设计的更高效的解决方案来解决这个问题。

陶哲轩指出,数学家们仍在努力寻找将大型语言模型纳入他们的研究工作流程的最佳方法,以充分利用它们的优势,同时避免它们的缺点。这无疑展示了一种可能的前进方向。

作者简介:威尔·道格拉斯·海文(Will Douglas Heaven)是《麻省理工科技评论》人工智能栏目的高级编辑,他在这里报道新的研究、新兴趋势及其背后的人。此前,他是英国广播公司(BBC)科技与地缘政治网站 Future Now 的创始编辑,也是 New Scientist 杂志的首席技术编辑。他拥有英国伦敦帝国理工学院计算机科学博士学位,对与机器人合作的体验非常熟悉。

0
分享到:
没有账号? 忘记密码?