6月12日,国内端侧AI芯片龙头企业瑞芯微在官方微信宣布,正式发布RK182X SDK 1.0.4版本,这个版本将为轻量级Agent全栈赋能,加速端侧AI量产。

瑞芯微之所以在RK3588之外,还要专门开发RK182X协处理器,主要是为了突破传统SoC(系统级芯片)在端侧运行大模型时面临的物理瓶颈。RK182X本身就是一颗内置了多核高算力NPU(峰值算力达20 TOPS)的AI推理芯片。瑞芯微给客户提供的选项是:当客户现有产品需要增加AI能力时,通过与主处理器的协同工作,来满足AI算力的升级需求,大大节省时间成本和研发周期。
根据瑞芯微的实测数据显示,RK182X运行Qwen2.5-3B模型的输出速度突破百Token,是市场对标产品的3倍。RK182X运行Qwen3-VL-2B模型输出速率近百Tokens。
近日,瑞芯微发布的2026年第一季度财报显示,2026年第一季度,瑞芯微依托RK3588等主力AIoT SoC平台及RK182X协处理器系列,实现营收12.05亿元,同比增长36.22%;净利润3.29亿元,同比增长57.15%,毛利率达43.04%。

瑞芯微强调,2026年第一季度,在终端市场受到存储价格高涨的冲击下,AIoT市场延续增长态势,端侧AI深入千行百业,重塑产品体验的趋势日益显著。财报中也重点披露,瑞芯微于 2025 年 7 月正式发布协处理器 RK182X 系列,9 月迅速发布SDK,快速导入十几个行业、数百家客户,首批客户已进入产品发布、量产阶段,应用于各产品线的旗舰产品,导入速度超出预期。
6月12日发布的最新RK182X SDK 1.0.4版本,有以下三大亮点:
1、量产级工具链,从开发到运维全闭环
▸ 批量烧录 自动化测试→产线一站搞定
▸ KV Cache导入导出→预计算上下文,首包加速
▸ 运维闭环:OTA 远程升级 设备状态监控
▸ 模型加密:保护企业自研算法IP
▸ LoRA微调:私有数据微调,无需全量重训
瑞芯微表示该版本已通过严苛测试,支持 7×24 小时连续稳定运行。
2、Agent 能力大幅跃升
谷歌最新开源模型Gemma4,在指令遵循、工具调用等 Agent 核心能力上实现大幅提升,是端侧 Agent 落地的首选基座;瑞芯微自研 KV Cache 压缩技术,上下文长度翻倍!Qwen3-4B 最高支持 37K token,让 Agent 记住更长的对话和任务指令
3、全模态模型体系,端侧 AI 完整链路
端侧 AI 不只是"跑大模型",而是要形成「听→看→想→做」的完整链路:
音频入口:Qwen3 ASR/TTS、VITS...让设备能听会说 ;视觉入口:PaddleOCR、SigLIP、DINOv2、Yolo 系列、Depth-Anything,让设备能看懂;Agent 决策:Qwen 全系列、GLM Edge、Gemma4、InternVL3,从理解到执行;模型全景:覆盖LLM(0.5B~8B)、VLM、Omni全模态、ViT/CNN等8大类40 款模型。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com