/ ai资讯

NVIDIA GTC 2025精华一文读完 黄仁勋在GTC上的主题演讲

发布时间:2025-03-20 15:46:54

来自 NVIDIA 年度最大活动 GTC 的精华新闻,内容涵盖最新服务和硬件、技术演示以及 AI 的未来发展趋势。

GTC 2025 将揭示 AI 的最新发展趋势。这里不仅有最新技术,还汇聚了推动 AI 发展的人才和创意。对于创造新机会、新解决方案和新思维方式而言,GTC 无疑是绝佳选择。

在 GTC 大会,您可以了解最新新闻、聆听业内讨论、观看机器人演示,并思考变革行业的重大趋势。

GTC 主题演讲要点总结

以下是 NVIDIA 创始人兼首席执行官黄仁勋在主题演讲中涵盖的要点:

我们正处于 1 万亿美元的计算拐点。在推理 AI 和代理式 AI 趋势的推动下,AI 计算需求正在迅速增长。AI 工作负载的规模和复杂性正在改变全球数据中心的投资。

NVIDIA Blackwell 已全面投产,其性能是 Hopper 的 40 倍。Blackwell 架构显著增强了 AI 模型的训练和推理能力,从而实现更高效、可扩展性更强的 AI 应用。

NVIDIA 将采用构建 AI 基础设施的年度更新节奏。每年都会推出新的 GPU、CPU 和加速计算技术,包括即将推出的 NVIDIA Vera Rubin 架构,旨在推动 AI 数据中心的性能提升和效率改进。

包括 Photonics 和 AI 优化存储在内的 AI 基础设施将彻底改变行业。先进的网络和存储解决方案将改善大型数据中心的 AI 可扩展性、效率和能耗。

面向工业和机器人领域的物理 AI 蕴藏着价值 50 万亿美元的商机。AI 驱动的机器人和自动化技术将改变制造、物流、医疗健康等行业,而 NVIDIA Isaac 和 Cosmos 平台将引领这一变革。

深刻洞察:NVIDIA 创始人兼 CEO 黄仁勋

在 GTC 上的主题演讲

欢迎来到 NVIDIA

在主题演讲伊始,黄仁勋便通过震撼的视觉效果,带观众“走入 NVIDIA 总部”,展现了一个仿佛环绕观众的公司大堂画面。他首先谈到了 25 年前 NVIDIA 从 GPU 起步的发展历程。同时介绍了过去十年 AI 技术的发展,包括代理式 AI 的出现——如何推理并解决问题、制定计划,以及采取行动。

AI 正处于转折点

黄仁勋随后概述了具备“逐步推理”能力的 AI 发展历程,并讨论了推理和强化学习需求如何推动 AI 计算需求的增长。随着 AI 迎来“拐点”,四大云服务提供商对 GPU 的需求正在激增。黄仁勋表示,他预计数据中心建设的市场价值将达到 1 万亿美元。

NVIDIA CUDA 生态系统

黄仁勋表示,NVIDIA CUDA-X GPU 加速库和微服务现在服务于各行各业。未来每家公司都会拥有两家工厂:一家生产产品,另一家生产 AI。在举例介绍 NVIDIA 在其中所做的多种努力后,他宣布 NVIDIA 将开源其 cuOpt 决策优化平台。他认为,CUDA 的安装基础现在“无处不在”。“我们已经到达了加速计算的临界点 —— CUDA 让这一切成为可能。”

通用汽车和 NVIDIA 合作开发 AI

黄仁勋表示,AI 需要基础设施。如今,AI 正在走向“全球各个角落”,并被广泛应用于机器人、自动驾驶汽车、工厂和无线网络等领域。他指出,自动驾驶汽车是 AI 最早应用的行业之一,并表示“无论在数据中心,还是在汽车上,我们构建的技术几乎被所有自动驾驶汽车公司所采用。”黄仁勋随后宣布了这一进程的下一步规划:全球领先的汽车制造商通用汽车将借助 NVIDIA 的 AI、仿真和加速计算技术,合作打造下一代汽车、工厂和机器人。此外,他还发布了 NVIDIA Halos,这是一个综合安全系统,整合了 NVIDIA 在汽车硬件、软件安全解决方案以及自动驾驶安全 AI 研究方面的最新成果。

数据中心与推理

接下来,黄仁勋谈到了数据中心。他宣布,NVIDIA Blackwell 平台已全面投产,并展示了来自众多行业合作伙伴的系统。“这难道不令人惊叹吗?”他感叹道。

他详细介绍了 Blackwell 如何支持极限扩展。黄仁勋表示:“我们之所以要做到这一点,是为了应对一个极端挑战,这个挑战就是推理。”

他解释说,推理的本质是 token 生成,这对企业至关重要。用于生成这些 token 的 AI 工厂必须具备极高的效率和卓越的性能。随着最新一代推理模型能够思考和解决日益复杂的问题,对 token 的需求也将持续增长。

为了进一步加速大规模推理,黄仁勋宣布推出 NVIDIA Dynamo,一款用于加速和扩展 AI 工厂中的 AI 推理模型的开源软件。“它本质上是 AI 工厂的操作系统,”他表示。

NVIDIA Photonics

黄仁勋随后讨论了 NVIDIA 如何帮助客户扩展到更大规模的系统。关键在于将 Photonics 技术——一种依赖于光而非电信号传输数据的网络技术——紧密集成到加速计算基础设施中。

NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光网络交换机通过融合电子电路和光通信技术,支持 AI 工厂能够在多个站点之间连接数百万个 GPU,同时降低能耗和运营成本。

黄仁勋表示:“这真是令人难以置信的技术。”NVIDIA 硅光交换机创新地集成了光器件,与传统方法相比,减少了 4 倍的激光器数量,能源效率提高到 3.5 倍,信号完整性提高到 63 倍,大规模组网可靠性提高到 10 倍,部署速度提高到 1.3 倍。

DGX Spark

为了支持 AI 开发者、研究人员、数据科学家和学生能够在桌面电脑上对大模型进行原型设计、微调和推理,NVIDIA 发布了基于 NVIDIA Grace Blackwell 平台的 DGX 个人 AI 超级计算机。黄仁勋将其形容为完美的礼物,并宣布了 DGX Spark(前身为 Project DIGITS),将 Grace Blackwell 架构的强大性能带到桌面。用户可以在本地运行这些模型,或将其部署到 NVIDIA DGX Cloud 或任何其他加速的云平台或数据中心基础设施上。黄仁勋表示:“这就是 AI 时代的计算机。”

代理式 AI

在讨论代理式 AI 的未来时,黄仁勋宣布推出具有推理功能的开放 Llama Nemotron 模型系列,旨在为开发者和企业提供业务就绪型基础,从而构建能够独立工作或以团队形式完成复杂任务的高级 AI 智能体。NVIDIA Llama Nemotron 推理模型系列基于 Llama 模型构建,提供按需 AI 推理功能。NVIDIA 在后训练期间对该推理模型系列进行了增强,以提升多步数学运算、编码、推理和复杂决策能力。

物理 AI 和机器人技术

黄仁勋将机器人描述为下一个 10 万亿美元的产业,并表示到 2030 年年底,全球将面临至少 5000 万劳动力短缺的问题。NVIDIA 提供了一整套技术,用于训练、部署、仿真和测试下一代机器人技术。

在一段视频中,黄仁勋宣布推出全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1,该模型可赋能通用人形机器人实现推理及各项技能。

NVIDIA 还宣布了新一代 NVIDIA Cosmos 世界基础模型的重大更新,为物理 AI 开发引入了一个开放式和可完全定制的推理模型,并为开发者提供了前所未有的世界生成控制能力。

黄仁勋表示:“使用 Omniverse 来调节 Cosmos,并通过 Cosmos 生成无限数量的环境,从而支持我们能够创建既扎根于现实、由我们掌控,同时又在系统上可以实现无限的数据。”

他还介绍了由Google DeepMind 和 Disney Research 共同开发、用于机器人仿真的 Newton 开源物理引擎。随后,他与一台小型机器人“Blue”一同登上舞台,机器人从地板出口钻出来,向黄仁勋发出“嘟嘟”声。

总结

黄仁勋在演讲结束时强调了如下主题。

首先,Blackwell 已进入全面量产阶段,“而且增长非常迅猛,客户需求也非常强劲,”黄仁勋表示。“这是有道理的,因为 AI 到达了一个拐点,推理 AI 的出现使我们需要的计算量大大增加,同时推理 AI 系统和代理式系统的训练也在推动这一变化。”

其次,Blackwell NVL72 配合 Dynamo 提供了比 NVIDIA Hopper 高 40倍 的 AI 工厂性能。“推理将在未来十年成为最重要的工作负载之一,因为我们正在扩展 AI。”

第三,NVIDIA 采用 “年度更新” 路线图,全世界都可以规划自己的 AI 基础设施。NVIDIA 正在构建三种 AI 基础设施:一种用于云计算,一种用于企业,第三种则用于机器人技术。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com