/ 分享百科

英伟达推出面向 “AI 推理时代” 的Blackwell Ultra人工智能芯片

发布时间:2025-03-20 16:03:08

英伟达(Nvidia)在周二的年度GTC大会上宣布了用于构建和部署人工智能模型的新芯片。




该公司首席执行官黄仁勋(Jensen Huang)透露了将于今年下半年上市的Blackwell Ultra系列芯片,以及预计将于2026年上市的该公司下一代图形处理单元(GPU) Vera Rubin。



自2022年底OpenAI发布ChatGPT实现业务转型以来,英伟达的销售额增长了6倍多。这是因为它的“大型GPU”占据了开发高级人工智能的大部分市场,这一过程被称为训练。



软件开发者和投资者正在密切关注该公司的新芯片,看它们是否能提供足够的额外性能和效率,以说服该公司最大的终端客户——包括微软、谷歌和亚马逊在内的云计算公司——继续花费数十亿美元建造基于英伟达芯片的数据中心。



“去年几乎整个世界都参与了进来。计算需求,人工智能的缩放定律,更有弹性,事实上,速度也更快。”黄仁勋说。



周二的公告也是对英伟达新年度发布节奏的一次考验。该公司每年都在努力宣布新的芯片系列。在人工智能热潮之前,英伟达每隔一年就会发布新的芯片架构。



在加州圣何塞举行的GTC大会也是英伟达展示实力的机会。



此次活动是英伟达自疫情以来举行的第二次面对面会议,预计将有2.5万名与会者,数百家公司将讨论如何将该公司的硬件用于人工智能。其中包括Waymo、微软和福特等公司。通用汽车(General Motors)也宣布,将在下一代汽车上使用英伟达的服务。



英伟达周二表示,Rubin之后的芯片架构将以物理学家理查德·费曼(Richard Feynman)命名,延续其以科学家命名芯片家族的传统。据黄仁勋展示的幻灯片显示,英伟达的Feynman芯片预计将于2028年上市。



英伟达还将在此次活动中展示其其他产品和服务。



例如,英伟达发布了使用其芯片的新型笔记本电脑和台式机,包括两款专注于人工智能的个人电脑,分别名为DGX Spark和DGX Station,这两款电脑将能够运行大型人工智能模型,如Llama或DeepSeek。该公司还宣布更新其网络部件,将数百或数千个GPU连接在一起,使它们作为一个整体工作,以及一个名为Dynamo的软件包,帮助用户充分利用他们的芯片。



*Vera Rubin*


英伟达预计将在2026年下半年开始推出下一代GPU系列系统。



该系统有两个主要组成部分:一个名为Vera的CPU和一个名为Rubin的新型GPU设计。它是以天文学家维拉·鲁宾(Vera Rubin)的名字命名的。



该公司表示,Vera是英伟达的首款定制CPU设计,其核心设计名为奥林巴斯(Olympus)。


以前,当需要CPU时,英伟达使用Arm的现成设计。已经开发出定制Arm核心设计的公司,如高通(Qualcomm)和苹果公司(apple),表示它们可以更量身定制,并释放出更好的性能。



该公司表示,定制的Vera设计将是去年Grace Blackwell芯片使用的CPU速度的两倍。



当与Vera配对时,Rubin在进行推理时可以进行每秒50千万亿次的运算,是该公司目前的Blackwell芯片每秒20千万亿次运算的两倍多。Rubin还可以支持高达288GB的快速内存,这是人工智能开发人员关注的核心规格之一。



英伟达也在对所谓的GPU做出改变。英伟达称,Rubin实际上是两个GPU。



目前市场上的Blackwell GPU实际上是两个独立的芯片组装在一起,作为一个芯片工作。



从Rubin开始,英伟达将表示,当它将两个或多个芯片组合成一个芯片时,它将把它们称为单独的GPU。在2027年下半年,英伟达计划发布一款“Rubin Next”芯片,该芯片将四个芯片组合成一个芯片,将Rubin的速度提高一倍,并将其称为四个GPU。



英伟达表示,将在一个名为Vera Rubin NVL144的机架上推出。之前版本的Nvidia机架被称为NVL72。



*Blackwell Ultra*


英伟达还宣布了其Blackwell系列芯片的新版本,并将其称为Blackwell Ultra。



该公司在一次简报中表示,该芯片每秒将能够产生更多的tokens,这意味着该芯片可以在与其前身相同的时间内生成更多的内容。



英伟达表示,这意味着云提供商可以使用Blackwell Ultra为时间敏感型应用程序提供高级人工智能服务,从而使他们从新芯片中获得的收入是2023年出货的Hopper一代芯片的50倍。



Blackwell Ultra将推出两种版本,一种是双处理器配英伟达Arm CPU,名为GB300,另一种是只配GPU,名为B300。它还将推出在单个服务器刀片上配备8个GPU的版本,以及配备72个Blackwell芯片的机架版本。



英伟达表示,四大云计算公司部署的Blackwell芯片数量是Hopper芯片数量的三倍。



*DeepSeek*


中国的DeepSeek R1在1月份发布时可能吓到了英伟达的投资者,但英伟达已经接受了这款软件。这家芯片制造商将使用该模型测试其几款新产品。



据报道,DeepSeek的模型所需的芯片比美国制造的模型少,许多人工智能观察家认为,这对英伟达的业务构成了威胁。



但黄仁勋今年早些时候表示,对英伟达来说,DeepSeek实际上是一个好兆头。这是因为DeepSeek使用了一个称为“推理”的过程,这需要更多的计算能力来为用户提供更好的答案。



英伟达表示,新的Blackwell Ultra芯片更适合推理模型。



它开发的芯片可以更有效地进行推理,所以当新的推理模型在部署时需要更多的计算能力时,英伟达的芯片将能够处理它。



“在过去的两三年里,人工智能取得了重大突破,取得了根本性的进步。我们称之为具身智能(代理式人工智能,agentic AI)。”黄仁勋表示,“它可以推理出如何回答或如何解决问题。”


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com