6月1日,NVIDIA 首席执行官黄仁勋的 GTC Taipei 主题演讲举行,他宣布英伟达发布最新一代Vera CPU,他强调这颗芯片为了Agent AI诞生而设计,首批采用者包括美国科技企业OpenAI、Anthropic和全球首富马斯克的太空探索技术公司(SpaceX)。

黄仁勋表示,Vera CPU 处理器搭载 88 颗定制版 Armv9.2 架构Olympus 自研核心,主打高单线程性能、低延迟、超大带宽,专为编排 AI 智能体工作流设计。

相较传统 x86 处理器,任务完成速度快 1.8 倍。这款CPU率先采CEO用 LPDDR5X 内存,带宽高达 1.2 TB/s,并且是首款支持 PCIe Gen 6 的 CPU。英伟达黃仁勋强调,AI 代理(Agents)将是计算机科学的最新突破,而 Vera Rubin 与同步发表的全新架构 Vera CPU,将成为推动这场运算革命的核心引擎。
作为聚焦Agent AI的 Vera CPU,除了带宽、自研核心外,它具备三大核心优势:
1.极高的单线程效能(IPC):每个频率可撷取、译码并执行 10 个指令,确保极短的处理延迟与强大的单线程效能。
2.卓越的整体系统互连:具备高达 3.6 TB/s 的光速互连架构,所有核心在单一网格上运作,无需跨越芯片边界,核心间通讯速度比传统 CPU 快 50%。
3、极致的能源效率:在提升效能的同时大幅降低能耗,使数据中心能在不排挤 GPU 生成令牌所需电力的情况下,部署更多 CPU。
英伟达表示,Vera CPU 将助力各行各业(包括智能体式 AI、强化学习与数据处理)提升数据中心的 token 处理收入。
Vera 也已整合进全球主流系统厂商的 AI 基础设施,包括:戴尔科技、HPE、联想、Supermicro,以及多家台湾系统制造商。
开源基准测试权威 Phoronix 的全面测评显示:在代码编译、Python/Java 运行、数据库处理等智能体负载中,Vera 综合性能最快。这些任务是现代 AI 工厂的关键路径(包括智能体工具调用、沙箱执行),CPU 性能越强,智能体吞吐越高、交互越快。
实测数据也显示了这一趋势。Vera CPU 能使峰值内存延迟较 x86 架构降低 40%,在 AI 代理沙盒(sandbox)执行效能上更带来 1.8 倍的提升。在实际企业工作负载上,Vera CPU 展现了惊人的效能突破。在执行全球广泛使用的 SQL 数据库引擎时,速度提升高达 3 倍。此外,英伟达与纽约证券交易所(NYSE)合作进行的实时串流处理测试中,Vera CPU 的处理效能更达到了传统的 6 倍之多。

此外,英伟达推出了企业 AI 代理工具包(NVIDIA agent toolkit for enterprise AI),包含四大基础架构,包括模型(Models),可修改的英伟达开源大型语言模型。整合框架(Harness),例如高度安全的开源框架 Open Shell,能确保企业内部的隐私、权限与身分安全,目前已获 Red Hat、Canonical 与微软等企业采用。工具(Tools),提供如 CUDA X 函式库等专业技能工具,供代理调用。以及执行环境(Runtime),针对 NVIDIA AI 平台全面优化,支持云端、地端及装置端运行。
英伟达 CFO 科莱特・克雷斯(Colette Kress)预计,2026 财年 CPU 业务营收将接近 200 亿美元,目前已有多家超大规模云厂商与系统制造商达成合作并推进部署。黄仁勋也表示,Vera CPU将成为公司新兴的增长引擎。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com