现代人工智能计算工作负载给传统处理器架构带来了前所未有的挑战,已将其推向了极限。当下,无论是企业,还是云服务提供商,若要实现自身的人工智能愿景,最为关键的任务便是追求更高性能、更强扩展性,以及在计算过程中实现更高效的通信。这不仅是顺应人工智能发展潮流的必然选择,更是在激烈的市场竞争中脱颖而出,占据技术高地的核心诉求。面对这一挑战,Ampere Computing 凭借丰富的知识产权创新产品组合所驱动的高性能、高效率人工智能计算解决方案,积极应对。在本次问答环节中,Ampere 首席产品官 Jeff Wittich 深入解读了公司的创新理念。他详细阐述了 Ampere 如何通过定制化知识产权实现性能层面的重大突破,这种创新又是怎样为后续产品提供有力支撑,进而引领并塑造下一代人工智能计算系统,展现出 Ampere 在人工智能计算领域的前沿探索与深远布局 。
Q: AmpereOne 产品系列(其中包括备受期待的 AmpereOne Aurora)的核心是 Ampere 的定制化内核。这些内核有哪些不同之处呢?它们又是如何具备处理人工智能工作负载的能力的呢?
Ampere 基于 Arm 架构的定制化内核在处理人工智能工作负载方面,尤其是人工智能推理方面,具有多项优势。其主要的一些优势包括:
用于并行处理的高计算密度:如今,Ampere 处理器支持多达192个内核,在 AmpereOne Aurora 中,内核数量将增加到512个。这些内核提供了强大的并行处理能力,对于众多人工智能推理工作负载来说是一大优势,比如生成式人工智能、自然语言处理和图像识别等方面。就如同 GPU 依靠大量特定的计算元件协同工作来执行一项任务一样,Ampere 处理器依靠大量通用的高性能内核来实现这一点。
超高能源效率:自成立以来,Ampere 一直专注于开发高能效的处理器。这一核心价值也体现在我们的定制内核上。与基于x86架构的处理器相比,我们的定制内核能够实现更高的每瓦性能。由于人工智能推理在云环境中常常需要持续运行,因此这种能源效率对于确保人工智能在规模扩展时仍能保持可持续性至关重要。
可扩展的性能:Ampere 处理器兼具微架构特性和产品功能,以确保性能能够可预测地扩展,即便处于始终有大量数据在处理器中传输的高利用率环境中也是如此。诸如自适应流量管理和服务质量(QoS)保障等功能,以及我们的单线程内核,都有助于消除云人工智能部署中“嘈杂邻居”效应。
Q: Ampere 近期披露,已成功研发出专属的定制网格。在人工智能领域迅猛扩张且数据密集程度与日俱增的当下,Ampere 的这款定制网格架构究竟如何满足不断攀升的带宽需求,进而显著提升人工智能驱动型应用程序的性能呢?
Ampere 的定制网格架构,专为满足人工智能日益增长的高带宽、低延迟需求而设计。Ampere 在 CPU 密度和效率上不断突破极限,性能远超其他网格架构技术。该架构通过降低事务处理开销,实现内核间数据高效传输,大幅降低延迟,这对实时性人工智能任务至关重要。
Ampere 定制网格架构的主要优势包括:
宽阔的数据传输路径:支持信息的高效流动,减少传输事务量。
优化的延迟:将事务负载降至最低,提升实时性能。
高带宽容量:支持快速访问大型数据集。
能源效率:通过专有的创新设计,实现性能最大化以及数据的高效传输。
这种架构在确保低延迟的同时,能够实现人工智能应用所需的数据吞吐量,满足人工智能日益增长的复杂需求 。
Q: 网格架构在支持像 AmpereOne Aurora 这样即将推出的人工智能专用产品方面发挥着怎样的作用呢?
AmpereOne Aurora 是 AmpereOne 系列的下一代产品,它将通用计算内核与人工智能加速功能相结合。
Ampere 的定制网格架构能够满足这些未来产品在可扩展性和性能方面的需求。它支持大量计算元件之间的连接,同时还能维持内核与内存之间的高效通信,确保随着系统规模的扩大,数据传输依然保持高效。
除了扩充内存容量、采用新型内存技术外,Ampere 确保每个内核都具备处理高要求工作负载所需的带宽。如此一来,Ampere 即将推出的产品便能从容应对现代云应用与人工智能应用带来的挑战。
Q: 软件在 Ampere 实现人工智能领域的宏伟目标中扮演着怎样的角色?公司如何让自己从软件领域脱颖而出?
2021年,Ampere 收购了人工智能部署与加速软件领域的领先供应商 OnSpecta,旨在为客户带来大幅提升的人工智能性能。Ampere 利用 OnSpecta 的知识产权,打造了一系列定制化的人工智能软件库,这些软件库旨在优化机器学习和人工智能推理工作负载。
例如,一个关键工具就是 Ampere 人工智能优化器(AIO)。这个加速引擎已完全集成到流行的人工智能框架中,这样一来,开发人员无需使用 GPU,就能够在 Ampere 处理器上高效的,并且以最高性能无缝运行人工智能推理工作负载。
Q: 这些知识产权创新是怎样协同发力,助力 Ampere 在人工智能领域中崭露头角、与竞争对手形成显著差异的呢?
AmpereOne Aurora,作为我们即将发布的集成人工智能加速功能的512核 CPU,是一个很好的范例,它充分展现了 Ampere 在知识产权领域的投入如何汇聚并转化为成果。Ampere 将定制内核、专有的网格架构以及跨小芯片的裸片到裸片互连技术等创新成果深度整合,融入自主研发的人工智能加速功能,最终造就了具有革命性意义的 AmpereOne Aurora,更好的满足行业需求。
这款产品性能卓越,将远超我们现有的 AmpereOne 处理器三倍之多,在人工智能计算领域,其每机架的性能表现处于领先地位。尤为突出的是,它采用风冷散热方式,无需对数据中心进行特殊升级改造。这使得它能够在全球任意现有数据中心部署,无论是公有云、企业数据中心,还是超大规模数据中心与边缘计算场景皆可适用。而这一点,正是化解全球人工智能领域电力危机的关键所在 。
这一切得以实现,源于 Ampere 在过去数年持续深耕研发,促使各项创新技术相互融合、协同发力。
关于 Ampere Computing
Ampere Computing 是一家现代化半导体企业,致力于塑造云计算的未来,并推出了世界上首款云原生处理器。为可持续云而生,Ampere 云原生处理器兼具最高性能和最佳每瓦性能,助力加速多种云计算应用的交付,为云提供行业领先的性能、能效和可扩展性。
关注
68文章
19597浏览量
232269免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com