DeepMind 推出“壮观的”通用科学 AI



Google DeepMind 使用聊天机器人模型为数学和计算机科学中的主要问题提出了解决方案。
该系统名为 AlphaEvolve,它将大型语言模型 (LLM) 的创造力与算法相结合,这些算法可以仔细检查模型的建议以过滤和改进解决方案。该公司在 5 月 14 日发布的一份白皮书中对此进行了描述。
“这篇论文非常壮观,”德国埃尔朗根马克斯普朗克光科学研究所人工科学家实验室的负责人 Mario Krenn 说。“我认为 AlphaEvolve 是基于通用 LLM 的新发现的首次成功演示。”
DeepMind 伦敦公司的科学主管 Pushmeet Kohli 说,除了使用该系统来发现开放数学问题的解决方案外,该公司还已经将人工智能 (AI) 技术应用于自己的实际挑战。
AlphaEvolve 帮助改进了该公司下一代张量处理单元(专为 AI 开发的计算芯片)的设计,并找到了一种更有效地利用 Google 全球计算能力的方法,节省了 0.7% 的总资源。“它产生了重大影响,”Kohli 说。
通用 AI
Krenn 说,迄今为止,人工智能在科学领域的大多数成功应用(包括蛋白质设计工具 AlphaFold)都涉及为其任务手工制作的学习算法。但 AlphaEvolve 是通用的,它利用 LLM 的能力来生成代码来解决广泛领域中的问题。
DeepMind 将 AlphaEvolve 描述为“代理”,因为它涉及使用交互的 AI 模型。但它针对科学过程中的某个点与许多其他“代理”AI 科学系统不同,后者已被用于审查文献和提出假设。
AlphaEvolve 基于该公司的 Gemini 系列 LLM。每项任务都从用户输入问题、评估标准和建议的解决方案开始,LLM 为此提出了数百或数千次修改。然后,“评估器”算法根据指标评估修改,以获得一个好的解决方案(例如,在分配 Google 的计算任务中,研究人员希望浪费更少的资源)。
DeepMind 的 AI 科学家 Matej Balog 说,根据哪些解决方案被认为是最好的,LLM 会提出新的想法,随着时间的推移,该系统会发展出一系列更强大的算法。“我们探索了如何解决问题的多种可能性,”他说。
AlphaEvolve 建立在该公司的 FunSearch 系统之上,该系统在 2023 年被证明使用类似的进化方法在数学1 中未解决的问题上超越人类。Balog 说,与 FunSearch 相比,AlphaEvolve 可以处理更大的代码片段,并在广泛的科学领域处理更复杂的算法。
DeepMind 表示,AlphaEvolve 已经想出了一种执行计算的方法,称为矩阵乘法,在某些情况下,该方法比德国数学家沃尔克·斯特拉森 (Volker Strassen) 于 1969 年开发的已知最快方法更快2。这种计算涉及网格中的数字相乘,用于训练神经网络。尽管是通用的,但 AlphaEvolve 的性能优于 AlphaTensor,后者是该公司在 2022 年描述的一种 AI 工具,专为矩阵力学3 设计。
Krenn 说,这种方法可用于解决优化问题,或者科学中任何有具体指标或模拟的地方,以评估什么是好的解决方案。他补充说,这可能包括设计新的显微镜、望远镜甚至材料。
应用范围
在数学方面,AlphaEvolve 似乎可以显著加快解决某些问题的速度,英国牛津大学的数学家和 AI 研究员 Simon Frieder 说。但他说,它可能只适用于“一小部分”任务,这些任务可以呈现为需要通过代码解决的问题。
其他研究人员对该工具的有用性保留判断,直到在 DeepMind 之外进行试验。“在系统被更广泛的社区测试之前,我会保持怀疑态度,并对报告的结果持保留态度,”哥伦布俄亥俄州立大学的人工智能研究员孙欢说。弗里德说,他会等到研究人员重新创建开源版本,而不是依赖 DeepMind 的专有系统,该系统可能会被撤销或更改。
Kohli 说,尽管 AlphaEvolve 需要的计算能力比 AlphaTensor 少,但它仍然过于耗费资源,无法在 DeepMind 的服务器上免费提供。
但该公司希望宣布该系统能够鼓励研究人员提出应用 AlphaEvolve 的科学领域。“我们绝对致力于确保科学界的大多数人都能使用它,”Kohli 说。