赋能轻量级Agent！瑞芯微重磅发布RK182X SDK 1.0.4版本

发布时间：2026-06-29 15:46:15

6月12日，国内端侧AI芯片龙头企业瑞芯微在官方微信宣布，正式发布RK182X SDK 1.0.4版本，这个版本将为轻量级Agent全栈赋能，加速端侧AI量产。

瑞芯微之所以在RK3588之外，还要专门开发RK182X协处理器，主要是为了突破传统SoC（系统级芯片）在端侧运行大模型时面临的物理瓶颈。RK182X本身就是一颗内置了多核高算力NPU（峰值算力达20 TOPS）的AI推理芯片。瑞芯微给客户提供的选项是：当客户现有产品需要增加AI能力时，通过与主处理器的协同工作，来满足AI算力的升级需求，大大节省时间成本和研发周期。

根据瑞芯微的实测数据显示，RK182X运行Qwen2.5-3B模型的输出速度突破百Token,是市场对标产品的3倍。RK182X运行Qwen3-VL-2B模型输出速率近百Tokens。

近日，瑞芯微发布的2026年第一季度财报显示，2026年第一季度，瑞芯微依托RK3588等主力AIoT SoC平台及RK182X协处理器系列，实现营收12.05亿元，同比增长36.22%；净利润3.29亿元，同比增长57.15%，毛利率达43.04%。

瑞芯微强调，2026年第一季度，在终端市场受到存储价格高涨的冲击下，AIoT市场延续增长态势，端侧AI深入千行百业，重塑产品体验的趋势日益显著。财报中也重点披露，瑞芯微于 2025 年 7 月正式发布协处理器 RK182X 系列，9 月迅速发布SDK，快速导入十几个行业、数百家客户，首批客户已进入产品发布、量产阶段，应用于各产品线的旗舰产品，导入速度超出预期。

6月12日发布的最新RK182X SDK 1.0.4版本，有以下三大亮点：

1、量产级工具链，从开发到运维全闭环

▸ 批量烧录自动化测试→产线一站搞定

▸ KV Cache导入导出→预计算上下文，首包加速

▸ 运维闭环：OTA 远程升级设备状态监控

▸ 模型加密：保护企业自研算法IP

▸ LoRA微调：私有数据微调，无需全量重训

瑞芯微表示该版本已通过严苛测试，支持 7×24 小时连续稳定运行。

2、Agent 能力大幅跃升

谷歌最新开源模型Gemma4，在指令遵循、工具调用等 Agent 核心能力上实现大幅提升，是端侧 Agent 落地的首选基座；瑞芯微自研 KV Cache 压缩技术，上下文长度翻倍！Qwen3-4B 最高支持 37K token，让 Agent 记住更长的对话和任务指令

3、全模态模型体系，端侧 AI 完整链路

端侧 AI 不只是"跑大模型"，而是要形成「听→看→想→做」的完整链路：

音频入口：Qwen3 ASR/TTS、VITS...让设备能听会说；视觉入口：PaddleOCR、SigLIP、DINOv2、Yolo 系列、Depth-Anything，让设备能看懂；Agent 决策：Qwen 全系列、GLM Edge、Gemma4、InternVL3，从理解到执行；模型全景：覆盖LLM（0.5B~8B）、VLM、Omni全模态、ViT/CNN等8大类40 款模型。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

赋能轻量级Agent！瑞芯微重磅发布RK182X SDK 1.0.4版本

相关阅读

ai资讯推荐

最新资讯