/ ai资讯

SK海力士在CXL技术领域的研发进展

发布时间:2025-01-24 11:46:17

挑战传统,打破限制,勇攀高峰,打破常规者们在寻求开创性解决方案的过程中重塑规则。继SK海力士品牌短片《谁是打破常规者》播出后,将推出一系列文章,展示公司在重塑技术、重新定义行业标准方面采取的各种“打破常规”的创新举措。本系列第七篇文章将深入探讨SK海力士在CXL技术领域的研发进展。

当今世界离不开数据的运转——网络中不断涌动的1和0的数据浪潮,为从流媒体服务到人工智能等各类应用提供了源源不断的动力。为了应对这场数据洪流,数据中心必须采用更先进的存储解决方案,以满足日益增长的性能需求。

然而,传统的存储器扩展方法面临诸多局限。处理器和存储技术的限制,加之数据中心成本和能耗的不断攀升,愈发凸显了对革命性方法的迫切需求。因此,CXL(Compute Express Link)应运而生,这是一项具有变革意义的存储器互联技术,旨在解决人工智能时代所带来的挑战。

本篇Rulebreakers’ Revolutions系列文章将介绍SK海力士在CXL解决方案领域的研发历程,详细讲述公司如何克服行业规格缺失等挑战,并为CXL生态系统做出重要贡献,最终确立其在CXL领域的领先地位。

使命:利用新型互联技术扩展存储容量

在人工智能时代,数据中心亟需不断扩展其存储容量,以应对日益增长的数据量。然而,采用传统方法扩展存储容量的成本过高且效率低下。例如,在单个CPU系统中添加太字节(TB)级存储容量,将显著增加总体拥有成本(TCO)1和功耗。试图通过增加存储通道或集成更大容量的存储器来解决这一问题,往往会导致能耗和热量的大幅上升,从而增加冷却系统和管理成本。这些现象凸显了设计创新型存储系统的必要性,这些系统能够以更快、更高效和更具成本效益的方式处理数据。

1总体拥有成本(TCO, Total Cost of Ownership):购置、安装和维护产品的过程中产生的所有成本,其中包括了采买、能耗及维护费用。

数据中心亟需增加存储容量,

以满足人工智能时代日益增长的需求

过去十年间,为了满足市场需求,业界持续致力于开发新的存储器互联技术。这一技术是指处理器和存储器之间交换数据的方法,在数据处理速度和效率方面起到至关重要的决定性作用。在传统的存储架构中,存储器与附近的单个处理器通过物理方式连接,当应用程序未充分使用存储器时,往往会导致存储资源供应过剩。而如CXL等的新兴存储器互联技术,则可以通过允许多个处理器共享存储容量来提高效率,从而解决这一问题。

这引发了业界对CXL的极大关注,然而,由于此项技术没有先例可循,且初期缺乏行业制定的规格,所以其开发过程面临诸多挑战。JEDEC固态技术协会(JEDEC Solid State Technology Association)2所制定的规格通常是为DRAM产品而设,在缺失此类行业规格的情况下,CXL的开发过程从根本上而言,比一般情况更为复杂。

2JEDEC固态技术协会(JEDEC Solid State Technology Association):一个拥有超过350家成员公司,负责制定全球微电子行业公开标准的领导机构。

在缺乏行业规格指导的情况下,SK海力士面临着开发全新CXL产品以突破存储器扩展壁垒的挑战。为了应对这一挑战,公司充分发挥其深厚的内部专业知识,并积极与行业合作伙伴携手并进。

探索未知:从零开始开发开创性CXL技术

自2019年CXL问世以来,SK海力士迅速意识到该技术能够满足日益增长的存储容量扩展需求。作为一种开放性的行业互联技术,CXL统一了存储器、存储装置和处理器等不同系统设备的接口,支持存储容量共享等功能,使多个处理器能够访问同一存储器,从而提升数据共享效率。同时,它还支持存储池化(Memory Pooling),将来自共同存储池的存储器分配给不同处理器,以提高效率。此外,CXL还实现了存储器切换功能,允许数百个设备(如处理器)在独立处理数据的同时共享存储资源。

除了这些创新功能外,SK海力士在观察到市场和客户对CXL技术认可度不断增加,并意识到其在解决技术和成本挑战方面的潜力后,对该技术的前景愈加坚定。然而,公司必须克服一个重大阻碍才能启动项目,即首先解决行业规格缺失的问题。因此,在参与CXL标准化工作并与客户合作确定规格后,SK海力士迅速着手制定了内部基本需求文件。公司还与CXL控制器制造商合作,为规格文件制定了控制器要求。此外,SK海力士还与JEDEC固态技术协会和CXL联盟(CXL Consortium)3合作,积极推动业内CXL标准中DRAM相关规范的完善。

3CXL联盟(CXL Consortium):一个致力于制定CXL技术规格的开放性行业标准组织。

通过扩展系统存储容量和带宽,SK海力士的CXL技术客服了存储器扩展难题

在协助制定行业标准和开发相关规格后,SK海力士加快了CXL技术的研发。在此过程中,SK海力士确定了满足客户需求的关键标准,即成本效益、高容量、优化带宽和可靠性。

首先,成本效益在CXL研发过程中至关重要。抵消CXL控制器高昂成本的关键在于将模块等存储介质的费用降至最低。鉴于高容量对促进大规模数据处理非常重要,公司认为CXL存储器的存储容量应达到现有DDR产品的2到4倍。此外,必须优化带宽设计,以充分发挥CXL模块的性能潜力。最后,可靠性和数据完整性须与主机存储器的高标准相匹配,从而赢得客户的信任。

为了满足这些标准,SK海力士的多个部门正在协同努力,致力于将TB级存储器打造成更加经济高效的解决方案。一方面,公司开创性地研发了存储池化技术,以实现多个设备之间的资源共享。另一方面,还成功开发了近内存处理(NMP, Near-Memory Processing)4技术,从而在数据源附近进行数据处理。这些创新技术有望为高性能计算(HPC)、存储器内数据库和人工智能等领域带来显著优势。

4近内存处理(NMP, Near-memory processing):一种在数据存储附近执行计算的技术,能够降低延迟并提升人工智能和高性能计算(HPC)等高带宽任务的性能。

通过这些不懈的努力,SK海力士已成功推进了开创性CXL产品的研发,这些产品将彻底颠覆存储器市场。

SK海力士不断壮大的产品阵容推动CXL的未来发展

自2022年开发出首款基于DDR5的CXL样品以来,SK海力士不断加强其CXL产品阵容,其中包括创新型CMM-DDR5(CXL Memory Module-Double Data Rate 5)。采用第五代高速PCIe连接,CMM-DDR5可确保流畅、快速的数据处理。同时,CMM-DDR5提供高达128GB的容量,可满足当今人工智能和高性能计算应用对高容量的需求。此外,该模块还具有高水平的电源效率和安全性。

真实性能测试突显了CMM-DDR5所带来的变革性影响。与仅搭载DDR5 DRAM的系统相比,该产品可将系统带宽提升82%,容量提升100%。测试结果进一步表明,在人工智能运行时,每秒令牌性能(Token Per Second Performance)提升高达31%。而在高性能计算领域,其吞吐量效率更是跃升33%。CMM-DDR5不仅展现出卓越的性能表现,同时符合JEDEC固态技术协会和CXL联盟的标准。目前,随着CMM-DDR5产品逐步迈向量产阶段,客户正在积极开展对其进行验证和认证的工作。

SK海力士基于CXL的CMM-DDR5,可有效提升人工智能和高性能计算的性能

SK海力士的其他CXL解决方案还包括Niagara 2.0,这是一款集成硬件和软件的综合性解决方案,允许多台主机高效共享大型存储池,从而最大限度地减少未利用或未被充分利用的存储容量。此外,CMM-Ax(CXL Memory Module-Ax)则是一种针对计算工作负载而优化设计的高性能内存模块,在提高人工智能和数据中心效率方面表现突出。

除了在硬件领域的显著进步,SK海力士还开发了异构存储器软件开发套件(HMSDK,Heterogeneous Memory Software Development Kit),以最大限度地发挥其CXL存储器的潜力。该软件工具包已成功集成到Linux操作系统中,进一步提高了其可访问性和实用性。硬件和软件解决方案的协同开发及其标准化工作,彰显了SK海力士对致力于创建一个蓬勃发展的CXL生态系统的不懈追求。

打破常规者专访:下一代存储器与存储装置部,崔源夏(Thomas)

本文采访了下一代存储器与存储装置部门的杰出工程师(DE,Distinguished Engineer)5崔源夏(Thomas),深入探讨了公司在CXL技术开发方面取得的突破性思维。崔源夏负责JEDEC固态技术协会和CXL联盟的标准化工作,并为CXL等下一代存储器开辟道路,采访中他详细阐述了CXL的发展历程以及其未来可能带来的影响。

5杰出工程师(DE, Distinguished Engineer):是SK海力士的资深工程师,在各自领域出类拔萃,负责解决技术难题并指导下一代人才。

Q在研发行业领先的CXL技术时,您和您的团队如何展现出打破常规的思维?

A“在CXL研发过程中,我们秉持SK海力士VWBE6理念的工作原则,并借鉴DRAM和NAND闪存产品的丰富研发经验,主动向客户提出工作方法和初步的CXL需求设想。提前明确需求为我们深入探索CXL技术创造了更多机会,最终成功研发出首款CXL存储器产品。”

6自觉自愿地发挥才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理体系(SKMS)中强调的员工价值观之一。

“对我而言,我构想了一种将标准化和验证方法相结合,以融合DRAM和NAND闪存的创新方法论,并在CXL联盟中独立提出并完善了与DRAM相关的功能。通过这些努力,我深感自豪能够为公司最初的CXL部署战略贡献一份力量。这表明,即便像探索CXL那样踏入未知领域,我们也可以凭借自身的创新精神和坚韧毅力,找到解决新问题的答案。”

“此外,我自愿在JEDEC固态技术协会和CXL联盟中担任要职,以此助力公司在标准化工作领域的地位不断提升。”

Q您如何看待CXL在未来人工智能生态系统中的发展?

A“CXL有望被构建成一个能够实现超大存储容量共享的生态系统。若要在人工智能时代进一步拓展其应用,CXL亟需支持计算节点,以确保1TB以上的高性价比存储器可以按需提供带宽,并在存储层面保持可靠性和安全性。这将有助于降低总体拥有成本,提高系统平台内的存储器利用率。”

“构建如此庞大的生态系统,绝非SK海力士一己之力所能实现。这需要GPU和CPU制造商、CXL控制器和交换机供应商,以及CXL知识产权(IP)公司的紧密协作。我们计划与这些机构携手合作,以进一步推动和壮大CXL生态系统。”

  • 处理器 处理器 关注

    关注

    68

    文章

    19404

    浏览量

    230755

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com