“Google 最新的 AI Agent 通过融合大语言模型创造力与自动评估器 推动数学与计算领域算法进化。”
大语言模型(LLMs)具有惊人的多功能性。它们能够总结文档、生成代码,甚至构思创新理念。如今,Google 进一步扩展这些能力,将其应用于解决数学基础领域和现代计算中高度复杂的难题。
AlphaEvolve 是一款由大语言模型驱动的进化式编程代理,致力于通用算法的发现与优化。该平台将 Gemini 模型的创造性问题解决能力与验证答案的自动评估系统相结合,并通过进化框架持续优化最具潜力的解决方案。
AlphaEvolve 已成功提升谷歌数据中心运营效率、芯片设计流程及 AI 训练系统性能,包括支撑 AlphaEvolve 本身的大语言模型训练。该平台还助力开发更高效的矩阵乘法算法,并为数学开放性问题提供创新解法,展现出跨领域应用的非凡潜力。
使用 LLM 设计更好的算法
2023年,Google 首次证实大语言模型能够生成计算机代码函数,助力在开放性科学问题上发现可验证的新知识。AlphaEvolve 作为智能代理,其能力已突破单一函数发现的局限,能够实现完整代码库的进化,并开发复杂度显著提升的算法体系。
AlphaEvolve整合了多款尖端大语言模型:速度最快、效率最优的 Gemini Flash 模型负责最大限度拓展创意探索的广度,而性能最强的 Gemini Pro 模型则通过深度洞察提供关键优化建议。两大模型协同工作,共同生成实现算法解决方案的计算机程序。
提示采样器首先为语言模型构建提示指令,随后模型生成新程序。这些程序经评估器验证后存入程序数据库。该数据库运行进化算法,决定哪些程序将用于后续提示生成
AlphaEvolve 通过自动化评估指标对建议程序进行验证、运行与评分。这些指标为每个解决方案的准确性与质量提供客观可量化的评估。这种特性使其在数学、计算机科学等能够进行清晰系统化衡量进展的领域展现独特优势。
优化计算生态
过去一年间,Google 在 AlphaEvolve 平台发现的新型算法整合部署于谷歌计算生态的各个环节,涵盖数据中心、硬件架构与软件开发。每一项改进的效能通过我们的AI与计算基础设施进行指数级放大,旨在为全球用户构建更强效且可持续发展的数字化生态系统。
示意图展示AlphaEvolve如何助力谷歌实现更高效的数字化生态,包括数据中心调度优化、硬件系统设计革新及AI模型训练升级。
数据中心调度优化
AlphaEvolve 发现了一种简洁高效的启发式算法,助力 Borg 系统更高效协调谷歌超大规模数据中心集群。该方案已稳定运行逾一年,平均持续回收谷歌全球计算资源的 0.7%。这种持久的效率提升意味着在同等算力规模下,系统可完成更多任务。该方案不仅性能卓越,更具备人类可读代码的核心运维优势:良好的可解释性、易调试性、可预测性及便捷部署特性。
助力硬件设计(Verilog)
在矩阵乘法核心优化电路设计中,AlphaEvolve 提出 Verilog 重写方案,成功剔除冗余逻辑单元。关键突破在于,该方案通过了严格的验证流程,确保修改后电路功能完整性。这项创新已被集成至新一代张量处理单元(TPU):谷歌自主研发的AI加速芯片。通过使用芯片设计标准语言提出优化建议,AlphaEvolve 开创了 AI 与硬件工程师协同创新的新模式,有力推进专用芯片研发进程。
强化AI训练与推理
AlphaEvolve 显著提升 AI 性能与研发效率。通过智能划分大型矩阵运算为可管理子问题,该平台将 Gemini 架构核心运算速度提升23%,对应缩短1%模型训练时间。鉴于生成式 AI 训练所需庞大算力,每项效率突破都将转化为显著成本节约。除性能提升外,AlphaEvolve 将核心优化所需工程时间从专家数周工作量压缩至自动化实验数日周期,大幅加速研究迭代速度。
在 GPU 底层指令优化层面,AlphaEvolve 展现出突破性能力。该领域通常由编译器深度优化,工程师鲜少直接修改。通过优化 Transformer 架构中 FlashAttention 核心实现,AlphaEvolve 取得高达 32.5% 的速度提升。此类优化不仅帮助专家定位性能瓶颈,更便于将改进方案集成至代码库,有效提升开发效率并实现算力与能源的持续优化。
数学前沿与算法发现突破
AlphaEvolve 在复杂数学问题上展现出创新求解能力。基于给定的程序代码框架,该平台自主设计了新型梯度优化流程的多个组件,成功发现计算机科学基础问题:矩阵乘法的多个新算法。这种创新范式为算法发现领域开辟了崭新路径。
列表展示AlphaEvolve为加速矩阵乘法算法提出的多维度改进方案。该案例中,平台针对优化器与权重初始化模块、损失函数及超参数扫描机制提出系统性改造方案,涉及15项关键进化步骤的深度调整。
AlphaEvolve 成功开发出 4×4 复值矩阵乘法新算法,仅需 48 次标量乘法运算,超越 1969 年 Strassen 算法在此领域的长期最优纪录。这一突破标志着相较于专攻矩阵乘法的前代系统 AlphaTensor 的重大进步:后者在 4×4 矩阵领域仅实现二进制算术的局部优化。
为评估系统普适性,我们在数学分析、几何学、组合数学与数论领域选取 50 余个开放性问题进行验证。得益于平台的高度灵活性,多数实验配置可在数小时内完成。经测试,约 75% 案例成功复现当前学界最优解(基于现有公开知识体系)。
约 20% 案例实现已知最优解的超越,推动相关开放问题研究进程。典型案例如"接吻数问题",这个困扰数学家三百余年的几何难题,探讨单位球体周围可容纳的最大非重叠外围球体数量。AlphaEvolve 成功构建含 593个 外围球体的空间配置,在 11 维空间中确立新的下限纪录。
发展路径展望
AlphaEvolve 展现了从特定领域算法发现到应对复杂现实挑战的系统进化能力。随着大语言模型编码能力的持续突破,特别是代码生成水平的提升,我们预期该平台将实现更显著的性能跃升。
与人机协作研究团队(PAIR)合作,我们正构建直观的 AlphaEvolve 交互界面。计划启动精选学术用户的早期体验计划,同时探索更广泛的应用场景。
虽然当前主要应用于数学与计算领域,但其通用架构支持所有算法化解决方案的自动化验证场景。我们预见 AlphaEvolve 将在材料科学、药物研发、可持续发展等更多领域引发革命性突破,拓展技术与商业创新的边界。
关注
0文章
62浏览量
7824关注
23文章
4693浏览量
94546免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com