本站报道(文/莫婷婷)当前,全球 人工智能迈入具身智能(Agen tic AI)时代,云天励飞董事长兼CEO陈宁博士在“大算力芯片战略前瞻会”上强调:公司将聚焦大模型推理芯片。在大会上,云天励飞阐述了GPNPU架构的技术内涵,并公开了未来三年大算力芯片路线图,致力于成为“最懂AI的推理芯片领军企业”。
GPNPU:打造中国版TPU的最优解
自2025年起,AI推理芯片将迎来未来5至10年的高光时刻,核心驱动力在于大模型推理需求的爆发式增长——尤其是Token数量的指数级攀升。
以字节跳动的豆包为例:2024年5日均Token量仅为0.12万亿;到2025年9月,已飙升至30万亿;仅三个月后(2025年12月)便突破50万亿。按此每季度近翻倍的增速推算,当前日均Token量很可能已达70–80万亿。
大模型训练与推理在计算范式上的根本差异:训练追求算力绝对值、 高精度和大规模集群互联,而推理则聚焦成本敏感、能效比与极致性价比。训练芯片需要百万卡级的高性能互联,依赖FP64/32/16等高精度计算,对成本不敏感;而推理场景——如 手机上的豆包、耳机中的同声传译、眼镜里的智能助手——更关注每个Token背后的真实成本。
陈宁博士表示,云天励飞将持续推进“百万Token推理成本每年两位数下降”的目标,力争到2030年实现“百亿Token仅需一分钱人民币”,最终达成“推理算力平权”。
面对全球AI算力重心从训练向推理迁移的历史性拐点,云天励飞指出“训练追赶、推理超车”是公司未来五年的核心策略。2025年,云天励飞提出其第五代芯片架构——GPNPU。
陈宁博士表示,GPNPU架构是大模型推理的最佳载体。
GPNPU是一套覆盖硬件微架构、系统集成和
软件生态的综合解决方案,其本质是“GP GPU NPU 3DM 算力积木”四维融合,具备了通用性、高效性、大带宽、低延时等特点,且采用了算力积木架构。
云天励飞CTO李爱军进一步介绍,GPNPU实现对CUDA兼容,支持“一行代码迁移”;采用NPU级 SIMD矩阵计算单元,实现单位面积更高的计算密度;该架构引入自研3D Memory堆叠架构,带宽达HBM的10倍,有效破解“内存墙”瓶颈;通过3DM高效访存架构实现10纳秒级延迟,满足实时交互类应用需求。
值得一提的是,云天励飞在过去五年深耕国产工艺,率先探索了 Chiplet算力积木架构,而这一架构与当前大模型推理所需的超节点设计理念异曲同工。为此,公司定义下一代芯片的Scale-Up超节点架构,从而高效支撑万亿级乃至十万亿级MoE大模型的推理需求。云天励飞也是国内少数掌握D2D Chiplet和C2C Mesh互连技术的企业之一。
李爱军提到,GPNPU系统级芯片,相比当前主流以训练为主的GPGPU架构,在推理效率、性能表现和成本控制方面均实现了显著领先。更进一步的在Agent 时代,多模型、多智能体的自主多模型的推理时代,对于推理的时延到了毫秒级,这个时候我们的领先优势将会实现跨代的领先。
公布
三年三芯路线图
在发布会上,云天励飞公布了未来三年大算力芯片规划,以“PD分离 AFN细粒度优化 超节点集群”为核心设计理念,精准应对大模型推理中prefill(计算密集)与decode(访存密集)阶段的不同需求。
2025年:推出第一代超节点P芯片(DeepVerse 100),专注百万长上下文场景的prefill推理,算力对标 英伟达Hopper架构的H100;
2026年:发布第一代超节点D芯片(DeepVerse 200),聚焦超低延迟decode推理,性能看齐Bl ackwell架构的B200;
2027年:迭代至第二代超节点P芯片(DeepVerse 300),实现毫秒级端到端推理时延,算力目标直指英伟达下一代Rubin架构。
云天励飞以大模型推理为核心应用场景,覆盖大模型云推理、多模态理解等当前主流。云天励飞透露,公司的产业也可以应用到深空探测领域,推进“算力进太空”,开启AI航天新篇章。
目前,云天励飞已构建多元化的生态布局,其客户群体包括AI大模型企业、涵盖互联网大厂、科技领军企业等行业头部客户,以及政企与基础设施客户。
可以看到,云天励飞不仅拥有领先的技术,还具备强大的供应链韧性与交付能力。尤为值得关注的是,云天励飞已成功实现全国产化工艺闭环。仅用五年时间,公司完成了从芯片设计、先进制造工艺到先进封装的全链条自主可控,并推动全国产推理算力芯片持续迭代。
至今,云天励飞已构建“1 4”组织架构,包括:
政企事业部:作为公司基石,聚焦智慧城市、交通、安防等领域,正在规划建设区域级千卡智算集群,赋能城市级AI渗透;
噜咔(Luka)事业部:打造面向儿童的AI原生硬件智能体,被内部称为“Token吞金兽”,有望成为消费级爆品;
岍丞(Qiancheng)事业部: 蓝牙耳机模组年出货超3200万颗,占中国手机品牌35%以上份额,2026年将启动自有AI C端品牌探索;
智算事业部:服务互联网大厂与运营商,已斩获16亿大单,正与多家头部客户推进深度合作。
这四大事业部,让云天励飞形成从技术研发到市场落地的完整闭环。
小结
:
站在第四次工业革命的门槛上,云天励飞正以GPNPU为支点,撬动中国在全球AI基础设施格局中的新地位。在发布会上,云天励飞强调,“到2030年,通过GPNPU推理架构的持续创新,坚定推进百万Tokens推理成本万倍降低,最终实现推理算力平权!”
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com