/ ai资讯

算力密度翻倍!江原D20加速卡发布,一卡双芯重构AI推理标杆

发布时间:2025-11-14 09:45:55
本站报道(文/莫婷婷)随着 AI技术迅猛发展,大模型的参数规模已突破千亿级别, AI推理需求呈现出爆发式增长。然而,在大模型加速落地的浪潮中,高效、稳定且安全的推理能力日益凸显为制约产业发展的关键技术瓶颈。

在此背景下,江原科技推出采用自研AI芯片的AI加速卡江原D10,并在今年5月实现量产交付。在大算力AI芯片全流程国产化产业链实现首次突破后,11月11日,江原科技再次发布新一代全国产AI加速卡——江原D20,成为中国AI芯片产业迈向自主可控的关键一步。

 

市场需求驱动下的国产替代加速:从D10到D20的跨越式发展

当前全球AI技术正从“训练为王”转向“推理主导”,预计在2024年推理业务占比为65%,到了2028年将达到73%。国际市场调研机构 IDC预测,生成式AI成为IT增长的核心驱动力引擎,预计到2028年,GenAI服务器占比将高达37.7%。

但在技术上,全球 半导体供应链面临严峻挑战:由于美国实施出口管制, 英伟达等国际企业禁止向中国市场出售高端 GPU产品,导致国内企业难以获取高性能算力。与此同时,国内AI应用落地需求持续升温,对本地化、安全可控的AI算力平台需求日益迫切。

正是在这样的背景下,江原科技选择进入国产AI推理芯片赛道,依托本土完整的产业链资源,实现了从芯片设计、制造到 封装测试的全流程国产化,为客户提供高性价比、高可靠性的国产替代方案。

江原科技成立于2022年11月,在这三年时间里,江原科技完成了产业链协同、研发规划与制造工艺上的系统性布局,快速完成产品迭代。

2025年5月,江原D10加速卡正式量产交付,其核心搭载的是江原科技自研的AI芯片。7月,品高股份发布了搭载D10加速卡的“品原AI一体机”,加速D10的商业化落地。在此基础上,江原科技迅速迭代出D20加速卡。

江原科技CEO李瑛在接受采访时表示:“我们在产品发布前就完成了整体规划,所有研发进程都按照既定路线稳步推进,确保了从D10到D20的快速迭代。”

江原科技联合创始人、CTO王永栋指出,当前行业有两大技术趋势,一是国内私有化部署需求迅猛增长,对数据安全隐私的高度重视;二是随着百亿乃至千亿参数大模型成为主流,单卡已难以承载其部署需求,多卡分布式计算已成为常规方案。

与此同时,存储性能已超越算力,成为影响系统综合性能的关键因素,在这里面,云端和边缘端的关注点也有不同,云端更关注存储带宽以支撑高并发,边缘侧则更侧重存储容量。因此,提升单机的算力密度与存储密度,不仅能降低整机成本,还能支持更大规模模型部署,显著提升性价比。这也正是江原科技研发全新国产AI加速卡D20的核心动因,王永栋表示。

D20加速卡:一卡双芯 、320 TOPS ,重构算力密度新标杆

江原D20加速卡采用“一卡双芯”架构,在单张PCIE插槽内集成两颗江原全国产AI芯片,通过先进的PCIe Bifurca tion技术,共享一个16-lane PCIe 5.0 接口,实现双芯片直连 通信,省去了传统多卡系统中昂贵的PCIe Switch芯片,大幅降低了成本与功耗。

一卡双芯的架构带来两大优势:一是算力密度翻倍:相比D10,D20的INT8算力提升至320 TOPS;二是存储密度升级:最大支持256GB LP DDR5显存,单台服务器最多可达4T,满足大模型推理对高容量显存的需求。

此外,在功耗控制方面,D20整卡功耗仅为145W,提供主动散热与被动散热两种模式,同时,其多媒体处理能力同样出色,支持256路高清视频解码、20路高清编码。



王永栋表示,“一卡双芯”类产品比较少主要是受限于软件生态,因为单卡与多卡在软件层面、执行方式都不相同,所以很难做到单卡和多卡同时运行。但在大模型时代,分布式计算框架已成为行业标配。

如今,江原科技已经构建了完备的软件生态体系。从底层驱动、中间件 编程模型,到高性能计算库、通信库,再到主流框架的无缝接入,有效解决了软件生态瓶颈。从GPU迁移到D10只需修改一行代码,而从D10升级至D20则无需任何改动,做到全栈软件无缝支持,极大降低了迁移门槛。

从服务器到 液冷 AI PC 全场景产品矩阵

基于D20加速卡,江原科技升级了服务器产品,推出江原D20 4U16卡智算服务器,并推出全新产品桌面型AI PC,构建起覆盖云端、边缘侧和桌面端的完整算力生态。

江原D20 4U16卡智算服务器搭载16张D20加速卡,集成32颗全国产AI芯片,整机INT8算力达5POPS,LPDDR5显存高达4TB,支持PCIe 5.0 x16互联,具备强大的集群扩展能力。得益于D20的低功耗设计,为数据 中心客户提供极具性价比的算力解决方案。

D20桌面型AI PC系列采用全液冷静音设计,推理运行噪音≤30dB,仅为风冷的八分之一;推理运行温度控制在50℃以下,比风冷方案降低了35%。


在算力方面,与海外高端GPU产品在桌面端部署场景下的推理表现进行性能对比的结果显示,在8B小模型上,双方性能基本持平;而在14B和32B大模型中,江原AIPC展现出显著优势,推理性能优于竞品。

通过高密度算力和大容量LPDDR5显存的协同设计,江原D20实现了在算力与显存之间的完美匹配,有效弥补了国产AI芯片与海外高端GPU产品工艺制程上的差距。

 

针对行业客户与个人用户,江原科技推出三款液冷静音AI PC:D20s基础版:搭载1块D20,配备 Intel i5 CPU与128GB显存;D20d升级版:双D20配置,搭配 AMD 7960X CPU;D20q信创版:采用海光CPU 四张D20,支持Qwen系列480B及DeepSeek-R1-Distill系列671B满血版部署。

李瑛表示,江原科技的产品不仅支持纯国产信创环境,也面向医疗等对生态兼容性有特定需求的行业客户,公司正在积极适配国内外主流 操作系统和服务器平台,确保在多样化应用场景下的广泛兼容与灵活部署。

江原科技已开放测试平台,累计导入100 客户进行业务测试,涵盖云服务、医疗、能源、传媒、高校、公安等20多个行业。

在D20加速卡发布会上,江原科技宣布与中国电子技术标准化研究院、上海新相微电子、黑龙江振宁科技等战略伙伴签署合作协议。通过技术共研、生态共建、场景共创,江原科技正在加速推动国产AI从底层芯片到行业应用的深度融合与规模化落地。例如,在与新相微的合作方面,双方将联合研发核心硬件,重点提升在视觉计算领域的适配能力;另一方面,双方共同开发加速卡与传感模组的一体化解决方案,聚焦智能安防、工业视觉等细分场景落地。

按照产品规划,江原科技的旗舰级芯片T800将在明年量产。从D10到D20,再到即将面世的T800,江原科技在短短三年内,江原科技实现了从产品研发到商业落地的跨越式转变。在这个过程中,国产AI推理芯片企业不再是简单复制国外产品,而是结合中国市场需求特点,开发出真正有价值的差异化解决方案。


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com