/ ai资讯

英特尔发布Gaudi3 AI加速器,押注低成本优势挑战市场

发布时间:2024-09-26 17:46:24

英特尔近期震撼发布了专为AI工作负载设计的Gaudi3加速器,这款新芯片虽在速度上不及英伟达热门型号H100与H200 GPU,但英特尔巧妙地将竞争优势聚焦于其更为亲民的价格与总拥有成本(TCO)上。

Gaudi3处理器采用双芯片设计,内置强大的计算单元,包括64个张量处理器核心(TPC,配备256x256 MAC结构并集成FP32累加器)、8个高效的矩阵乘法引擎(MME,支持256位宽矢量处理)以及高达96MB的片上SRAM缓存,提供惊人的19.2TB/s带宽。此外,它还集成了24个200GbE网络接口和14个媒体引擎,后者能够高效处理多种视频编解码格式,如H.265、H.264、JPEG和VP9,为视觉处理应用增添强大助力。内存方面,Gaudi3搭载了128GB HBM2E内存,通过八个内存堆栈实现高达3.67TB/s的带宽,确保数据处理的高效流畅。

相较于前代产品Gaudi2,Gaudi3在架构上进行了显著优化,尽管在TPC和MME数量上有所精简,但它专注于提升特定精度下的计算能力,仅支持FP8矩阵运算及BFloat16矩阵和矢量运算,这一调整旨在更好地满足当前AI工作负载的需求。

在性能表现上,Gaudi3提供了高达1856 TFLOPS的BF16/FP8矩阵运算能力,以及28.7 TFLOPS的BF16矢量运算能力,同时其热设计功耗(TDP)约为600W。尽管在某些指标上略逊于英伟达H100,但英特尔强调,Gaudi3在实际应用中的性价比优势将尤为突出。

英特尔为Gaudi3制定了明确的市场定位,旨在与AMD的Instinct MI300系列及英伟达的H100、B100/B200等高端芯片展开竞争。据英特尔透露,基于8个Gaudi3芯片的加速器套件定价为125,000美元,单芯片成本约为15,625美元,相较于英伟达H100的30,678美元售价,展现了显著的价格优势。然而,面对可能具备更强性能的英伟达Blackwell架构GPU(如B100/B200),英特尔能否持续保持其竞争优势,仍需市场进一步验证。

英特尔执行副总裁Justin Hotard表示:“AI需求的激增正驱动数据中心领域的深刻变革,行业迫切需要更多元化的硬件、软件及开发工具选择。通过推出搭载P核与Gaudi3 AI加速器的Xeon 6,英特尔正积极构建一个开放的生态系统,助力客户以更高的性能、效率和安全性应对各种工作负载。”

目前,Gaudi3 AI加速器已通过IBM Cloud及英特尔Tiber开发者云平台提供服务,并计划于今年第四季度通过戴尔、慧与(HPE)和Supermicro等合作伙伴全面上市,其中戴尔和Supermicro的部分系统将于10月开始出货,而Supermicro的设备则将于12月抵达市场。

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com