5月20日,2026阿里云峰会正式拉开帷幕。在这场备受瞩目的年度盛会上,阿里云重磅发布了基于平头哥新一代AI芯片真武M890打造的128卡超节点服务器,搭载自研互联芯片ICN Switch 1.0,将128张AI芯片聚合成一台超级计算机,通信时延低至百纳秒级。这一发布标志着阿里云面向Agentic时代完成了一次全面而深刻的技术升级,当天阿里云正式推出了全新的"芯-云-模型-推理"技术体系。
从一颗芯片到一台超级计算机
此次发布的核心亮点,在于128卡超节点服务器的问世。这台服务器以平头哥自研的新一代AI芯片真武M890为算力底座,单节点即可集成128张AI芯片,通过自研互联芯片ICN Switch 1.0实现芯片间的高速互联。通信时延被压低至百纳秒级别,这意味着128张芯片之间的数据交换几乎可以做到无感延迟,真正让128张AI芯片像一台计算机一样协同工作。
在传统架构中,多卡多节点之间的通信瓶颈一直是制约大模型训练和推理效率的关键因素。而阿里云通过自研芯片加自研互联的双重自研路线,从底层彻底打通了这一堵点。ICN Switch 1.0的加入,让超节点内部的通信效率实现了质的飞跃,为大规模并行计算提供了坚实的硬件基础。
为Agentic时代而生
阿里云将此次发布定义为面向Agentic时代的全面升级。随着AI应用从单一的问答交互走向多Agent并发协作,系统对算力的需求发生了根本性变化。海量Agent同时运行、频繁进行推理调用,这对底层算力架构提出了前所未有的挑战。传统的单机单卡甚至多卡分散部署的方式,已经难以满足这种高并发、低延迟的推理需求。
128卡超节点服务器正是为解决这一痛点而来。它能够支撑海量Agent的并发推理任务,同时也能满足大模型训练过程中对超高带宽和超低时延的严苛要求。一台超节点,既是训练引擎,也是推理引擎,真正实现了算力资源的高效聚合与弹性调度。
"芯-云-模型-推理"全新技术体系亮相
与超节点服务器同步发布的,还有阿里云全新构建的"芯-云-模型-推理"技术体系。这一体系将自研芯片、云计算基础设施、大模型能力与推理引擎打通为一个有机整体,形成了从底层硬件到上层应用的完整技术闭环。
在"芯"的层面,平头哥真武M890和ICN Switch 1.0提供了自研算力与互联的双重保障。在"云"的层面,阿里云将超节点服务器深度融入云基础设施,用户可以像调用云服务一样调用超级算力。在"模型"层面,阿里云持续迭代通义大模型家族,为Agentic应用提供强大的模型基座。在"推理"层面,全新的推理架构充分利用超节点的百纳秒级通信能力,让Agent的并发推理效率大幅提升。
四个环节环环相扣,每一层都经过深度优化与协同设计。这不是简单的技术堆叠,而是一次面向未来AI应用形态的系统性重构。
阿里云的深层布局
回顾阿里云近几年的技术路线,从倚天处理器到含光加速器,从通义千问到如今的Agentic时代全面升级,每一步都指向同一个方向:用全栈自研的能力,构建面向下一个时代的AI基础设施。
128卡超节点服务器的发布,让阿里云在AI算力赛道上再次迈出了关键一步。当整个行业都在探索如何让AI从"能用"走向"好用"、从单点能力走向大规模协作时,阿里云已经拿出了自己的答案。百纳秒级的通信时延、128卡合一的超节点架构、自研芯片与自研互联的深度耦合,这些技术指标的背后,是阿里云对Agentic时代算力需求的深刻理解和提前布局。
5月20日的阿里云峰会,不仅发布了一款产品,更宣告了一个全新技术体系的诞生。在Agentic时代的大幕徐徐拉开之际,阿里云已经做好了准备。
关注
14文章
10431浏览量
91839关注
2文章
485浏览量
43520免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com