据TrendForce援引的消息,英伟达正计划对其即将发布的Blackwell B300 GPU(针对人工智能AI和高性能计算HPC应用)采用创新的插槽设计。这一决策的背后,是对AI GPU在高强度运算下故障率、主板替换成本以及散热难题的深入考量。
英伟达与其他AI GPU设计者正考虑在下一代产品中引入插槽设计,以替代当前GPU直接焊接到主板上的做法。然而,值得注意的是,插槽式设计往往伴随着更高的功耗和散热挑战,因为最强大的GPU通常采用BGA封装技术。
供应链方面,里昂证券分析师Chen Shuowen透露,英伟达可能从其GB200 Ultra系列开始引入GPU插槽设计。Chen提到了英伟达一个包含CPU主板的4路GPU设计方案,尽管与DGX服务器的8路GPU主板和2路CPU主板设计相比,这似乎并不寻常。
英伟达的数据中心产品线以其GPU(如A100、H100、B100/B200)和Grace CPU GPU平台(如GH100、GB200)命名。目前,GB200平台的CPU和GPU均使用BGA封装,但B200 Ultra的更新版本是否会有所改变,尤其是下半年可能出现的GB200 Ultra升级,目前尚不确定。
尽管插槽设计为维修和升级提供了便利,但在服务器环境中,它们相比BGA封装或SXM/OAM模块,占用的空间更大,功耗和散热限制也更多。虽然模块可修复,但拆卸过程复杂,且可能因主板设计而异。相比之下,插槽更为便捷。
此外,附加卡和SXM/OAM模块的制造难度高、成本昂贵,且大多数英伟达SXM模块由富士康生产。从板卡或模块转向插槽可以降低成本,但可能会牺牲部分性能。
英伟达已推出B200 GPU(功率超过1000W),用于GB200板卡(如Bianca,配备Grace CPU和Blackwell GPU;以及Ariel,配备Ariel CPU和一个Blackwell GPU),均采用BGA封装。此外,英伟达还推出了支持8个B200(1000W)和B100(700W)SXM模块的Umbriel GPU板,以及Miranda和Oberon GB200等平台。
尽管英伟达已推出基于Hopper架构的H100甚至H200附加卡,通过降低性能以适应传统服务器的功耗和散热限制,但英伟达尚未宣布任何基于Blackwell GPU的附加卡。
最新爆料显示,英伟达正在准备代号为B200A的产品,该产品基于单片B102处理器,采用台积电CoWoS-S封装技术连接四个HBM3E内存堆栈,与双芯片B100/B200设计形成鲜明对比。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com