7月26日-29日,2025世界人工智能大会(WAIC)在上海举办。摩尔线程携以全功能GPU为核心的“云边端”全栈AI产品和解决方案精彩亮相,并首次提出“AI工厂”理念,旨在为AGI时代打造生产先进模型的“超级工厂”。此次参会不仅彰显了摩尔线程在AI基础设施领域的系统性创新,更通过多行业案例展现了国产GPU技术的广泛应用前景。
首提“AI工厂”理念:系统性创新突破大模型训练效率瓶颈
摩尔线程提出的“AI工厂”,如同芯片晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层芯片架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。
据了解,这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单芯片有效算力 × 单节点效率 × 集群效率 × 集群稳定性。
为应对生成式AI爆发式增长下的大模型训练效率瓶颈,基于全功能GPU的通用算力,摩尔线程通过五大核心技术,以系统级技术创新工程和工程化能力,构建新一代AI训练基础设施。
其自主研发的全功能GPU以“功能完备、精度完整”为特色,集成AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码等多元能力,全面支持从FP64至INT8的完整精度图谱,FP8算力将Transformer计算性能提升约30%;独创的ACE异步通信引擎减少15%计算资源损耗;MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽;muDNN算子极致性能优化,GEMM算子算力利用率达98%,Flash Attention算子算力利用率突破95%;基于Triton-MUSA编译器 MUSA Graph,实现DeepSeek R1推理加速1.5倍;KUAE集群通过5D并行训练和秒级备份恢复等创新技术,显著提升集群效率;零中断容错技术使得集群有效训练时间占比超99%,为大规模AI训练提供稳定保障。这一完整技术体系展现了摩尔线程在AI基础设施领域的系统性创新能力。
丰富行业应用展示:国产GPU赋能千行百业
在WAIC展区,摩尔线程通过覆盖“云边端”全栈的丰富产品与行业解决方案,全面展示其技术在多领域的应用成果:
此外,摩尔线程还展示了在低空经济、智能座舱、智能驾驶、创娱教育、智慧医疗、视频超分、数字人等领域的创新应用,彰显了全功能GPU技术的技术突破与应用价值。
展望未来:首届MUSA开发者大会即将启幕
摩尔线程宣布,将于今年10月举办首届MUSA开发者大会,进一步推动国产GPU生态建设。从芯片架构到集群系统,从技术突破到行业落地,摩尔线程正以“AI工厂”为蓝图,引领国产算力基础设施迈向AGI时代的新高度。
关于摩尔线程
摩尔线程以全功能GPU为核心,致力于向全球提供计算加速的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。
我们的目标是成为具备国际竞争力的GPU领军企业,为融合人工智能和数字孪生的数智世界打造先进的计算加速平台。我们的愿景是为美好世界加速。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com