本站报道(文/梁浩斌)今年8月底传出阿里巴巴开发新 AI芯片的消息后,这款芯片一直非常神秘,没有太多详细的性能参数信息。根据此前曝光的消息,阿里自研AI芯片是面向AI推理任务,兼容CUDA ,并交由中国大陆代工厂生产,已经进入测试阶段。
然而在9月16日晚,央视《
新闻联播》节目中,阿里 平头哥AI算力卡PPU在新闻背景画面里被曝光,在“国产卡与NV卡重要参数对比”表格中显示,PPU在显存、片间带宽等多项硬件参数均超越 英伟达A800。
平头哥神秘算力卡曝光,首个国产化万卡集群落地
在《新闻联播》曝光的画面中,平头哥PPU采用HBM2e显存,单卡显存容量96GB,片间带宽为700GB/s,采用PCIe5.0×16通道 接口,单卡功耗为400W。从这些外围硬件参数来看,平头哥PPU的规格介于英伟达A800和H20之间。
A800显存同样采用HBM2e,单卡显存80GB,片间带宽400GB/s,接口规格是PCIe4.0×16,功耗400W;而H20的显存和片间带宽更强,单卡96GB HBM3显存,片间带宽为900GB/s,采用PCIe5.0×16接口,但功耗较高为550W。
另外,表格里也展示了华为和壁仞两款算力卡的一些外围参数数据:华为昇腾910B单卡采用6 4GB HBM2显存,片间带宽392GB/s,接口为PCIe4.0×16,功耗350W;壁仞104P单卡搭载32GB HBM2e显存,片间带宽256GB/s,采用PCIe5.0×16接口,功耗为300W。平头哥PPU在外围硬件上领先于另外两款国产算力卡。
但我们从表格中也可以发现,列出的数据其实都只是算力卡的硬件参数,并没有提到算力芯片的算力、核心数量等数据。
不过值得关注的是,多个国产算力芯片大规模落地的项目,也在这次新闻报道画面中被曝光。
《新闻联播》画面显示,位于青海的中国联通三江源绿电智算融合示范园,已经与阿里云签约了“阿里云万卡”项目,项目总计1024台设备、采用16384张平头哥算力卡、提供1945P算力。

已经签约的国产算力项目还包括:中科院算力项目共计512台设备,采用4096张沐曦算力卡,提供984P总算力;北京京仪算力项目,总计83台设备、采用1328张壁仞算力卡、算力达450P;中昊芯英算力项目总计128台设备、算力达200P。
另外,还有基于太初元基、燧原 科技、摩尔线程算力卡的项目还在待签约的状态。
据了解,中国联通三江源绿电智算融合示范园是由中国联通青海分公司与西宁开发区管委会合作建设的绿色算力项目,位于西宁经济技术开发区南川工业园区。该项目于2024年8月17日正式揭牌,总投资约27.7亿元,旨在构建集约化、规模化、绿色化的智算综合园区,支撑“东数西算”战略需求。
公开信息显示,该示范园主要建设三江源国家大数据 中心二期、三期项目,后期规划建设四期项目。其中,二期项目拟投资8.8亿元,重点建设智算机房,规划840架高功率服务器机柜,IT总用 电容量约16.80MW,建成后可支持超高功率密度,最大可扩展至单机40KW,具备万卡集群同步能力,形成超10000P以上超强算力能力。三期项目拟投资9.8亿元,重点建设3栋智算中心,共规划智算服务器机架约984架,总用电容量约32MW,建成后承接东数西算、东数西训、东数西储的算力服务中心,形成12000P以上智算能力,未来扩展至万卡集群规模。四期项目拟投资50亿元。
联通内部人士提供的资料显示,中国联通·阿里云万卡绿色算力项目是国内首个国产化万卡智算集群。该项目规划16000卡算力规模,全部采用自主研发技术和设备,是青海联通打造“新型一体化智算基础设施建设工程”的标志性成果。
在项目进度方面,中国联通三江源绿电智算融合示范园二期工程预计2025年10月投产,三期已于3月投产,四期投资已获批。整体进度较原计划提前15%。园区标准机架已超万架,算力值由1284P跃升至6000P。今年年底全面投产后,将形成超20000P的强大算力规模。
平头哥PPU早已上云?甚至还有一体机!
阿里自研AI芯片的历史其实也已经有一段时间。自2018年,阿里收购中天微,成立平头哥 半导体后,阿里就一直在推动自研云端AI算力芯片。2019年,平头哥推出了首颗数据中心芯片含光800,这是一颗面向AI推理的芯片,目前官网信息显示该芯片基于12nm工艺, 集成170亿 晶体管,性能峰值算力达820 TOPS。 在业界标准的ResNet-50测试中,推理性能达到78563 IPS(每秒处理7.8万张照片),能效比达500 IPS/W。
2021年,阿里又推出了倚天710服务器 CPU,采用 Arm架构,128核,主频为2.7 5GHz。不过近年阿里的CPU布局重点已经转向玄铁 RISC-V IP,以及打造芯片设计
生态。
根据知情人士曝光的消息,阿里自研PPU最早在今年年初就已经在阿里云上部署,在训练和推理应用中都有部署,并已“灵骏智算资源”的产品名称实现对基于英伟达计算卡的“通用计算资源”平替,这也意味着PPU已经完成对英伟达 GPU的部分替代。
值得一提的是,根据一些业内人士透露,PPU属于GPGPU,其一大特点是对CUDA兼容极佳,据称性能对标英伟达A100。

而今年4月,阿里云推出的一体机方案AI St ack也可能已经使用上自研PPU芯片。根据官方介绍,该一体机内置16卡 1.5TB超大显存,卡间互联达到700GB/s,这个参数与前面曝光的平头哥PPU相同。同时AI Stack单机支持DeepSeek R1 671B满血无损精度模型,适配Qwen 72B/32B/14B/7B等多尺寸大模型(截至2025年4月28日)。
从目前阿里目前对自研PPU的内部应用情况来看,最近传出新的AI芯片消息,有可能是第二代PPU芯片。
小结:
国产算力芯片规模化商用,目前看来已经迈入了加速期。从这次中国联通三江源绿电智算融合示范园中透露的信息来看,国产算力落地并非孤例,除了中国联通与阿里云合作的国内首个国产算力万卡集群项目之外,还有中科院、京仪、中昊芯英等项目同步推进沐曦、壁仞等国产算力卡落地,而太初、燧原、摩尔线程等厂商的算力落地也已经提上日程。
可以说,这一轮国产算力集群的规模化落地,不仅是国产AI芯片产业的重要里程碑,更将是重构全球AI基础设施格局的起点。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com