/ ai资讯

摩尔定律赶不上模型进化?业界首款超以太网和UALink IP带来“算力扩容”新解法

发布时间:2025-07-16 15:46:31

本站报道(文 / 吴子鹏)时至 2025 年,在专项政策扶持、旺盛算力需求以及跨行业多元应用的共同推动下,AI(人工智能)技术展现出前所未有的增长潜力。根据市场调研机构 IDC 的统计数据,2024 年全球 AI IT 总投资已达 3158 亿美元,预计到 2028 年将进一步增长至 8159 亿美元,期间年复合增长率高达 32.9%。

AI 算力集群作为 AI IT 投资中的关键组成部分,正通过 Scale Up(纵向扩展)和 Scale Out(水平 / 横向扩展)两种方式不断扩大规模。为满足万亿甚至十万亿参数规模的 AI 大模型训练需求,万卡级、十万卡级别的 AI 算力集群已成为行业主流配置。然而,在构建大规模 AI 算力集群的过程中,行业面临着诸多典型挑战。比如,英伟达公司NVLink 和 InfiniBand 技术虽然在 Scale Up和 Scale Out方面具有一定的性能优势,但其作为专有协议也构建起了生态壁垒,将算力卡与扩展技术深度绑定,显著提高了算力布局的准入门槛。

为进一步释放大规模 AI 算力集群的发展潜能,打破专有技术的封闭生态已迫在眉睫,同时还需兼顾高性能、低功耗与可扩展性等关键指标。超以太网联盟(UEC)和 UALink 联盟(UAC)通过制定开放规范,将碎片化的互连技术整合为统一框架。这种标准化举措不仅减少了重复研发投入,更有效提升了行业整体运营效率。在此背景下,新思科技(Synopsys)推出的业界首款超以太网和 UALink IP 解决方案,凭借开放标准、高性能设计以及生态协同优势,为大规模 AI 集群提供了可扩展、高可靠的互连基础,有望成为下一代 AI 基础设施的核心技术。

开放标准:提升 AI 算力集群效率的关键

对于 AI 算力集群而言,算力芯片是最基本的计算单元。然而,算力芯片需求的发展与先进制程之间出现了严重的演进速度不匹配问题。算力芯片主要服务于 AI 模型领域,该领域参数量大约每 4 至 6 个月便会翻一番;而先进制程遵循摩尔定律,晶体管数量约每 18 - 24 个月增加一倍,性能同步提升。此外,随着单颗芯片内集成的计算单元和内存单元日益增多,算力芯片设计不断突破掩膜尺寸限制。因此,AI 行业迫切需要一种可扩展的解决方案,以应对急剧增长的算力需求。

现代 AI 算力集群普遍采用 “Scale Up Scale Out” 混合架构。其中,Scale Up 主要用于在算力集群中通过纵向扩展,提升单节点内的计算密度与通信效率。在传统算力网络中,每台服务器即为一个算力节点,但受空间、功耗和散热条件限制,单台服务器所能容纳的计算芯片数量有限。为此,行业引入超节点(SuperPod)概念,通过 Switch 或交换机组网技术,使单节点不再局限于一台服务器,而是可由多台服务器与网络设备共同组成。

Scale Up 旨在尽可能地增加单节点内的计算资源,而 Scale Out 则致力于突破单节点的算力上限,进行更大规模的横向扩展,以满足大模型训练对计算资源呈指数级增长的需求。对于大模型训练任务,往往需要数万至数十万计算卡协同工作,Scale Out 的优势在于其理论上具备无限扩展能力,但连接效率对其至关重要。

长期以来,英伟达公司在 “Scale Up Scale Out” 混合架构领域引领技术发展。在 Scale Up 方向,英伟达拥有 NVLink 和 NVSwitch 两大核心技术;在 Scale Out 方向,Infiniband(IB)也是主流通信网络协议之一。但正如前文所述,NVLink、NVSwitch 和 Infiniband 均为专有协议,形成了一定的行业技术壁垒。为打破这一局面,超以太网和 UALink 等开放标准应运而生,重塑 AI 基础设施的生态格局。

UALink 是一项对标英伟达 NVLink 和 NVSwitch 的关键技术,可广泛适配各类加速器。与 NVLink 相同,UALink 采用 GPU 内部总线传输的原生语义 —— 内存语义,支持内存共享功能,能够优化加速器之间的内存通信。无论是直接连接还是通过交换机连接,UALink 均可实现高效数据传输,每通道速度高达 200 Gbps,使每个加速器能够直接访问其他加速器的内存。UALink 还是一个低延迟的轻量级协议,并具备同步功能,有助于保障多个加速器之间的一致性,促进系统高效运行。

UALink 技术框图,图源:MICRO - 2024 HiPChips 研讨会


另外,UALink 还具有两项显著优势特性:支持 Switch 组网,并与 UEC 相辅相成。前者使 AI 行业能够打造支持 UALink 的交换机,进而构建更高计算性能的超级节点;后者则构建起基于开放标准的生态体系,加速行业从 “少数公司主导” 向 “开放竞争” 模式转变。凭借这些领先特性,UALink 可使超级节点如同单个加速器般运作,提供高性能、低延时、低功耗的计算性能。

2025 年 4 月,UALink 联盟正式发布 UALink 1.0 规范,支持每通道 200 GT/s 的双向数据速率,信号速率达 212.5 GT/s,单个 UALink 1.0 系统支持连接多达 1024 个 AI 加速器,并通过 UALink 交换机连接,为每个 AI 加速器分配一个端口和 10 - bit 唯一标识符,以实现精准路由。

在 Scale Out 方向,超以太网联盟致力于创建 “基于以太网的完整通信堆栈架构”,用超以太网传输协议替代基于以太网的 RoCE 协议,从而提高网络吞吐量、降低延迟,增强网络的可靠性与稳定性,这对于提升 Scale Out 的可扩展性至关重要。

超以太网集群图,图源:新思科技


以太网是当前全球应用最广泛的局域网技术,其技术标准由 IEEE 的 802.3 标准制定。UEC 采用专为 AI 和 HPC 应用设计的下一代传输协议,对以太网进行重新定义。超以太网从物理层、链路层、传输层、软件层等多个层面改进以太网技术,具备 FEC(前向纠错)统计、链路层重传(LLR)、多路径报文喷发、新一代拥塞控制、灵活排序、端到端遥测、交换机卸载等关键功能。例如,在传输层,超以太网支持选择性重传、无序传送、数据包喷射和高级拥塞控制机制,提供可靠有序交付(ROD)、可靠无序交付(RUD)和不可靠无序交付(UUD)等多种传输模式。

超以太网技术框图,图源:UEC


虽然超以太网与 InfiniBand 均是专为 AI 和 HPC 领域研发的网络通信技术,但超以太网凭借开放标准,促进了广泛的技术融合以及不同制造商和设备间的联合创新。同时,以太网庞大的供应商生态体系有助于 AI 行业降低算力门槛,使中小型企业也能以较低成本参与 AI 硬件市场竞争。

业界首款 UALink 和超以太网 IP 解决方案

超以太网和 UALink 技术的诞生,实现了不同厂商加速器的高效互连,避免了生态绑定问题。已发布的 UALink 1.0 标准和 UEC 就绪(UEC - ready)规范,共同构建起下一代 AI 基础设施的互连框架。

作为超以太网联盟(UEC)和 UALink 联盟(UAC)的活跃成员,新思科技推出业界首款超以太网 IP 和 UALink IP 解决方案,旨在满足下一代大规模 AI 算力集群在高带宽、低延迟互连方面的迫切需求。

业界首款 UALink 和超以太网 IP 解决方案,图源:新思科技


新思科技 UALink IP 解决方案集成了控制器、物理层(PHY)和验证 IP,专为数据密集型 AI 工作负载设计,具备低延迟、高带宽和先进的内存共享能力。该方案是一套面向 AI 加速器和交换机的全集成解决方案,满足 UALink 规范的完整硬件安全要求,可实现每通道 200 Gbps 的最大吞吐量,为扩展至 1024 个 AI 加速器的超级节点提供强大的带宽支持。

新思科技超以太网 IP 解决方案由 MAC(媒体访问控制)、PCS(物理编码子层)控制器、物理层(PHY)以及验证 IP 组成,并采用经硅验证的新思科技 112G/224G PHY IP,以提升可靠性,为连接百万节点构建大规模 AI 扩展网络提供超低延迟和高带宽连接。这一完整的超以太网接口栈通过 112Gbps 和 224Gbps SerDes(串行器 / 解串器)进行信息传输,支持 4×400G、2×800G 和 1.6T 以太网速率。

同时,新思科技超以太网 IP 解决方案支持不断演进的 IEEE 802.3 和 OIF - 224G 电气标准,满足 chip - to - chip、chip - to - module 以及长距离铜缆 / 背板互连的性能要求。该方案中包含以太网 PCS 的 RS - FEC(里德 - 所罗门前向纠错)功能、前馈均衡器 (FFE) 以及低抖动锁相环(PLL),有效提升了信号传输的稳定性。

更为关键的是,新思科技 UALink IP 解决方案和超以太网 IP 解决方案基于经硅验证的成熟技术,结合该公司在接口技术领域数十年的丰富经验,并严格遵循不断发展的行业开放标准,能够帮助开发人员有效降低研发风险。截至目前,新思科技已经能够为 AI 和 HPC 等前沿应用提供丰富的高速接口 IP 组合,涵盖 PCIe 7.0、1.6T 以太网、CXL、HBM、UCIe 以及最新的超以太网和 UALink 方案,充分释放下一代 AI 基础设施的发展潜能。

结语

大规模 AI 算力集群的发展已步入技术跃迁的关键阶段。面对专有技术形成的生态壁垒以及指数级增长的算力需求,开放标准正以革新者的姿态重塑行业格局。超以太网与 UALink 通过标准化互连框架,在打破技术垄断的同时,凭借高性能、低功耗和可扩展特性,为万卡、十万卡级集群的算力协同提供了坚实的底层支撑。新思科技推出的业界首款超以太网与 UALink IP 解决方案,依托经硅验证的技术积累与对开放标准的深度契合,不仅为 AI 加速器与交换机的高效互联奠定了硬件基础,更通过生态协同效应降低了创新门槛,助力中小企业参与算力基建竞争,推动行业从 “少数巨头主导” 向 “多元开放创新” 模式加速演进。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com