本站报道(文/黄晶晶)今年初,微软推出引入Copilot功能的全新个人电脑,Copilot作为AI语音助手被确定为AI PC不可或缺的按键以及功能,它能够在不需要云数据中心的情况下处理本地的人工智能任务。同时,微软还提出,这款全新电脑搭配拥有全新神经处理单元NPU的芯片,可实现每秒超过40万亿次即40 TOPS的运算。那么也就是说,若要符合微软给出的AI PC的定义,NPU的算力至少要达到40 TOPS。
这一定义的抛出,突显了NPU的重要性。半导体大厂们普遍认为CPU GPU NPU的组合将是AI PC的算力基座。
《AI PC产业白皮书》中指出AI PC五大特性,包括提供多模态自然语言交互、终端内嵌个人的大模型、标配本地混合AI算力、连接开放的AI应用生态、设备级个人数据和隐私安全保护。尤其是本地混合AI算力,即CPU GPU NPU异构混合算力保证了AIPC本地推理的可行性,同时随着端侧算力的快速提升,AIPC可以承载更大的AI模型,执行更加复杂的任务。
在分工上,CPU是计算机的运算核心和控制核心,GPU进行图形处理和大规模并发计算,NPU提供高效能和低功耗的神经网络运算支持,在多种应用场景中实用智能计算。三者的组合发挥各自的优势,协同工作,高效实现端侧AI的能力。
不过,当前来看NPU别说是多少算力的问题,甚至很多设备都还没有NPU。以安卓平台来看,目前70%的第三方 ML/AI 应用运行在CPU上,特别是一些低级别设备很难承担NPU的费用,CPU GPU NPU的组合或许要从高端设备开始。
AI PC的演进过程中,《白皮书》指出应分为AIReady阶段和AIOn阶段。在AIReady阶段,AIPC主要表现为芯片计算架构的升级,具备基本的本地混合AI算力,能够为AIPC的软件及服务创新提供基本保障,开启体验创新。
如今,NPU以及高算力NPU的导入已经开始。英特尔、AMD、苹果、高通等厂商纷纷推出了带有NPU的处理器产品,不少新产品的NPU算力都达到40 TOPS,高算力应对复杂且众多的本地AI大模型需求,为迎接AI PC的应用爆发做好准备。
英特尔
去年12月,英特尔正式发布酷睿Ultra处理器。它是首款基于 Intel 4 制程工艺打造的处理器,代表了40年来英特尔架构最大的革新。采用了先进的Foveros 3D 封装技术,在 CPU、GPU 和神经网络处理单元(NPU)的架构中集成了专属 AI 加速功能,从而成为英特尔历史上 AI 性能最强、能效最佳的客户端处理器。英特尔方面还宣布,将与主流 OEM 伙伴推出 230 余款机型,开启AI PC新纪元。
根据英特尔的酷睿 Ultra 产品路线图,2023年为Meteor Lake,2024年将有Lunar Lake、Arrow Lake,2025年为Panther Lake,2026年Future Products还没有具体架构代号。其中Lunar Lake采用台积电3nm工艺,NPU性能将是上一代的4倍,达到48 TOPS,满足 Copilot 需求。
另外,英特尔将于年内发布Arrow Lake处理器。报道称,Arrow Lake涵盖了台式机和笔记本电脑产品的多个细分平台,其中“S”用于台式机并采用LGA 1851插座,“HX”用于发烧级游戏本,算力方面,Arrow Lake-S和Arrow Lake-HX提供AI算力达37 TOPS,其中Arrow Lake-S/HX的GPU在新架构加持下,AI算力从3 TOPS提高到9 TOPS;内置的NPU提供13 TOPS的AI算力。
AMD
AMD于2023年5月推出的锐龙7040系列是全球首款内置XDNA架构NPU的X86处理器,同年12月推出锐龙8040系列移动处理器,提供高达16TOPS的NPU算力和39 TOPS的整体算力,相较上一代带来60%的AI性能提升。
在今年6月的台北电脑展上,AMD重磅发布了Ryzen AI 300 系列处理器,采用Zen 5架构、第三代AMD Ryzen AI,内置XDNA2 NPU,GPU升级为RDNA 3.5。
作为一款专为AI PC打造的处理器,其NPU算力可达50 TOPS,相较而言上一代Ryzen 8040系列芯片只有16 TOPS。
可以看到,这款处理器的亮点之一就在于NPU算力的大幅提升。AMD表示,XDNA2 NPU的计算能力提供5倍多,多任务并行能力翻一番,能效提升最多2倍。并且,XDNA2首次引入全新的Block FP16浮点精度,传统的8-bit INT8数据类型性能强但准确性低,16-bit FP16数据类型准确性高但性能弱。FP16 NPU可兼顾两者的性能与准确性,目前大多数AI应用都采用了16-bit精度。另外,AMD已经与超过150家AI赋能的ISV合作伙伴达成深度合作,进而为AMD Ryzen AI提供兼容性更好、性能体验更好的各类型AI应用。
苹果
2023年,苹果A17 Pro处理器对整块芯片进行了全方位提升,包括 apple 有史以来最大规模重新设计的图形处理器。通过微架构和设计上的改进,全新的中央处理器实现了多达 10% 的速度提升,神经网络引擎的速度也提升多达 2 倍。采用台积电3nm工艺制程,其NPU拥有16核心,性能达到35 TOPS。
今年5月,苹果发布的11英寸和13英寸iPad Pro搭载了M4处理器,该处理器基于台积电第二代3nm工艺,拥有280亿个晶体管,NPU算力从18TOPS提升到38 TOPS。
在前不久的苹果全球开发者大会(WWDC)上,苹果宣布了全新的AI系统apple Intelligence。要提升系统的AI能力,NPU的升级必不可少。今年9月苹果全新一代iPhone 16 Pro将配备最新的A18芯片,据悉台积电启动2nm芯片试产,苹果A18性能或提升30%,而在NPU性能上,有消息称A18有望超越苹果自家的M4处理器,可能达到45TOPS。
高通
此次微软首批Copilot PC,搭载高通骁龙(Snapdragon)X Elite 芯片。高通于2023年推出为AI PC设计的骁龙 X Elite 处理器,该处理器集成高通定制 Oryon CPU,基于 4nm 工艺打造,采用 12 颗 3.8GHz 大核,全新 Hexagon NPU 最高可提供 45 TOP(每秒万亿次运算)算力,并且可以在设备上以“惊人的速度”运行超过 13B 参数的生成式 AI LLM(大型语言模型)。首批搭载骁龙X Elite 芯片的PC制造商包括荣耀、联想、小米等。
此外,消息称,联发科与英伟达联手研发Arm架构AI PC处理器,新款芯片将对标苹果M4,预计2024年第三季度完成设计,第四季度进入验证阶段,将采用台积电3nm工艺制造,并计划2025年发布。
小结:
微软给AI PC划了一条NPU算力的“红线”,基于微软强大的生态号召力,AI PC处理器厂商都十分重视NPU性能的提升,当然这也有利于后续AI PC上端侧AI真正的应用普及。40 TOPS NPU也许会成为今后用户购买AI PC的一个必选项。
关注
68文章
18640浏览量
225251关注
87文章
27782浏览量
265294免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com