/ ai资讯

端侧AI革命:移远通信如何用大模型重构人机交互

发布时间:2025-04-07 09:46:52


2025 年春节前后,DeepSeek 横空出世,改变了全球 AI 产业的市场格局与发展范式。DeepSeek 爆火进一步激发了“边缘 AI”的市场刚需,显著降低了大模型在边缘设备的部署及运营成本。一时间,各类应用纷纷接入 DeepSeek,包括搜索引擎、机器人、汽车、智能手机等。


移远通信产品总监王韬在“绽放通信之美—预见端侧 AI 未来”主题直播中指出,DeepSeek 推动端侧 AI 从被动智能迈向主动智能,但也引发了关于算力、算法与应用的新思考和新挑战。移远通信提供的端侧大模型解决方案,深度融合 LLM(大语言模型)、RAG(检索增强生成)与 Agent(智能体)等前沿技术,赋能端侧 AI 方案创新。



DeepSeek带来端侧AI发展新范式


端侧 AI 并非新兴概念。早期,产业借助 DSP 等专用芯片处理语音识别、图像增强等基础任务。随着芯片算力提升,产业开始探索将复杂算法融入终端设备。2021 年前后,将 AI 大模型能力植入端侧兴起,标志着端侧 AI 进入认知智能阶段。根据头豹研究院发布的《2024 年中国端侧 AI 场景应用分析:智能终端与边缘计算的融合创新》报告,2023 年中国端侧 AI 市场规模达 1939 亿元,预计 2028 年将增至 19071 亿元,年均复合增长率为 58%。


中国端侧 AI 市场规模,图源:头豹研究院


从千亿级迈向万亿级,端侧 AI 后续更大的增量源于端侧应用与边缘计算、AI 大模型的融合。这种融合从技术架构、场景创新和产业生态三个维度重塑端侧 AI 的边界。移远通信产品经理王柯指出,相较于云端 AI,端侧 AI 实时性更佳,推理成本更低,且保障了用户隐私安全。此外,端侧 AI 使大模型推理摆脱网络依赖,在信号不佳或无网络服务区域也能提供推理服务。


然而,将云端AI 大模型部署到端侧面临诸多难题。比如,如何平衡端侧推理效率与模型能力,怎样实现硬件、软件与商业模式的协同发展等。在 DeepSeek 出现前,端侧 AI 发展的难题是云端依赖与端侧限制并存。端侧设备受算力、存储和功耗制约,难以承载超 10B 参数的大模型,需借助云端协同完成复杂任务,这导致响应延迟和隐私风险。同时,模型功能单一,无法支持多模态交互或主动决策。


DeepSeek 的出现对端侧 AI 发展具有革新意义。它采用创新的 MoE(混合专家)架构,如在 DeepSeek-V3 模型中,每层包含 256 个路由专家和 1 个共享专家,每个 Token 仅激活 8 个专家,大幅降低了训练和推理成本;通过高效蒸馏技术,将大模型推理能力迁移至更小、更高效的版本,弥补了小推理模型 Self-play 学习的不足;此外,DeepSeek-R1-Zero 实验性版本表明,仅通过强化学习就能获得强大推理能力。


DeepSeek 的方法论使端侧能够独立完成复杂任务,将应用决策权从云端真正下放至边端。王柯认为,DeepSeek 阐释了一种 “少即是多” 的 AI 大模型部署理念,进一步推动模型小型化发展。现阶段,3B 或 4B 参数级别的模型已等效于之前的 7B 参数模型。


移远通信产品经理罗铮谈到,从硬件角度看,DeepSeek 的一大优势在于以更小体量模型带来更强能力,这使得小算力芯片、小容量存储及小 BOM 就能实现高性能端侧 AI 方案。


当前,端侧 AI 大模型主要落地场景包括 AI PC、AI 手机、AI 可穿戴设备、AI 智能家居、AI 智能汽车、AI 零售等。机器人应用,尤其是人形机器人,则是端侧 AI 落地的蓝海市场。端侧 AI 大模型部署通过技术架构革新和场景适配能力突破,推动机器人产业向更高阶的自主化、智能化方向发展。一方面,端侧部署大模型可提升机器人实时性和可靠性,通过本地化运算大幅降低数据传输延迟,使机器人能在毫秒级的时间内完成环境感知 - 决策 - 执行闭环,满足工业场景中精准抓取、避障等高实时性需求;另一方面,端侧部署大模型还可提升机器人交互性能,支持视觉、语音、触觉等多模态数据实时融合处理,使服务型机器人实现更自然的拟人化交互。


移远通信产品经理沈锋称,对于机器人等端侧 AI 应用而言,DeepSeek 带来的直观影响是能以更低成本实现相同性能,使越来越多领域愿意投资端侧 AI。



移远通信为端侧AI落地提供一站式解决方案


正如移远通信几位产品经理在直播中所分享,移远通信为端侧 AI 落地提供涵盖智能硬件、算力、算法和服务的完整解决方案,助力用户快速实现端侧 AI 从概念到落地的商业转化。


高效支持主流 AI 大模型



AI 大模型是 AI Agent 的核心。目前,移远大模型解决方案可实现 AI 模型的端侧部署,支持通义千问、DeepSeek 等主流 AI 大模型。


针对当下大热的 DeepSeek,DeepSeek-R1 版本专注于强化学习技术路线,其蒸馏版本参数范围为 1.5B 至 70B。得益于蒸馏技术,这些小模型虽体量小但性能强劲,是端侧 AI 部署的理想选择。目前,移远通信高算力AI智能模组 SG885G已能稳定运行 DeepSeek-R1 蒸馏小模型,并完成了针对性微调。


实测数据显示,移远通信 SG885G 模组运行 DeepSeek-R1 蒸馏小模型的方案,其生成 Tokens 的速度超每秒 40 个 Tokens。按人类讲话速度换算,人类每分钟能讲 300 - 400 个字,约 500 - 600 个 Tokens。因此,能支持每秒准确输出 10 个Tokens 的 AI 模型即可满足商业落地条件。


未来,随着性能持续优化,该方案的速度还将进一步提升,为智能终端设备赋予更强大的 AI 能力。该方案适用于智能机器人、智能座舱、机器视觉、个性化虚拟助理、平板电脑、老人监护、智能家居、AI 玩具及可穿戴设备等多元场景。



王柯表示,在众多厂商还在探索如何支持 DeepSeek 模型时,移远通信已率先取得突破,这充分彰显了移远通信技术团队卓越的工程化能力,能够快速完成方案设计、模型微调、端侧部署和资源调度等工作。


在端侧 AI 交互至关重要的语音交互领域,移远通信大模型解决方案在全语音链路上实现无缝衔接与高效运行,涵盖 KWS 语音唤醒、VAD 人声检测、ASR 语音识别和 TTS 语音播报等主流功能,助力用户快速实现基于语音的无感交互。




满足端侧 AI 广泛需求的模组产品矩阵


边缘计算智能模组是AI Agent 的基石。移远通信面向端侧 AI 应用提供丰富的模组产品。SG885G-WF 是该公司目前在端侧 AI 领域主推的一款智能模组,集成高通 QCS8550 芯片,综合算力高达 48 TOPS,并提供 LCM、摄像头、触摸屏、I2S、PCIe、UART、USB、I2C 等丰富接口资源。为满足端侧 AI 在不同算力、成本、功耗方面的需求,移远通信还提供包括但不限于以下产品系列:


■ 基于高通 QCS8250 的 SG865W 系列,算力为 15 TOPS;


■ 基于高通 QCM6490 的 SG560D 系列,算力为 12 TOPS;


■ 基于展锐 UIS7885 的 SG530C 系列,算力为 8 TOPS;


■ 基于瑞芯微 RK3568 的 SG368Z 系列,算力为 1 TOPS。



罗铮介绍,总体而言,移远通信的智能模组可覆盖 1 TOPS 到 48 TOPS 的算力需求,公司还在规划 80 - 100 TOPS 甚至更高算力的产品,以满足客户在端侧 AI 不断增长的算力需求。


同时,移远通信也打造了有利于用户方案实现的开发板,比如MWC 2025上公司推出QuecPi Alpha智能生态开发板,基于高通跃龙QCS6490处理器打造,AI算力高达12 TOPS,能够满足众多AIoT应用场景中对物体识别、图像识别等功能的多样化需求。这些硬件方案都能灵活支持安卓、Linux 和 Ubuntu 等操作系统,充分满足客户在高端机器人和端侧 AI 方面的开发需求。移远通信的软硬件产品组合及背后的技术服务,能让用户便捷地完成不同算力平台间的切换,加速产品升级迭代进程。


QuecPi Alpha智能生态开发板



智能模组 AI 大模型,重构端侧 AI 应用


如前所述,移远通信的智能模组和大模型解决方案有着丰富的应用场景。下面通过具体案例,看看移远通信如何借助智能模组 AI 大模型赋能端侧 AI 应用。


第一个案例是当下热门的 AI 机器人。基于移远通信端侧大模型解决方案中的 SG885G-WF 智能模组和全语音链路架构,服务机器人能对指令、提问或求助迅速响应,准确理解用户意图,并以清晰自然的语音反馈,实现无感交互。尤其值得一提的是,得益于 SG885G-WF的高算力,移远“大模型 AI 机器人”解决方案在离线状态下也能提供完整 AI 性能。



这一方案使服务机器人在终端市场具备巨大应用价值,涵盖医疗康养、智能客服、接待导览和零售导购等领域。在具体落地过程中,移远通信技术团队提供高效、全面的工程化支持,助力客户产品快速进入市场,并形成差异化竞争优势。比如,在医疗康养领域,德壹机器人基于移远通信集成SG885G-WF模组的端侧AI解决方案推出了全能王AI具身机器人,支持8自由度3D视觉导航,融合尖端AI技术、中医理疗智慧与具身智能,重新定义了智能理疗服务边界。



沈锋认为,DeepSeek 等 AI 大模型的推出为机器人行业发展注入新活力,重塑了机器人的 “大脑”。现阶段,机器人仅具备一些基础能力,交互方面存在较大欠缺,AI 大模型的加入将改善这一状况。未来,落地到终端的AI机器人会越来越多,这将是一个在未来 5 年增长率极高的领域。


第二个案例是 AI 智能无人零售解决方案,移远通信通过大模型重新定义无人零售的交互体验。在 MWC 2025 上,移远通信宣布推出围绕 “动态视觉 边缘计算” 构建的全新 AI 智能无人零售解决方案。该方案基于移远高性能5G AI算力模组 SG560D,支持先进的全链路商品识别算法,识别准确率高达 99%,还具备创新的上新平台等软硬件服务,可无缝对接客户应用程序。除 SG560D 模组搭载的QCM6490平台外,移远通信这套方案还能兼容更多算力平台,满足零售机厂商的差异化竞争需求。


目前,移远 AI 智能无人零售解决方案已与兴元科技 “喵星人” 智能售货机等多家客户产品完成系统集成,并进入实地场景测试阶段。



结语


作为端侧 AI 生态的重要构建者,移远通信正通过“智能模组 AI 大模型”双轮驱动,重塑端侧 AI 的产业格局。其一站式大模型解决方案深度融合 DeepSeek 等前沿 AI 模型,结合SG885G-WF 等高性能AI模组,成功突破端侧部署的算力瓶颈与工程难题,在机器人、智能零售、汽车电子等场景中,构建起 “本地决策 - 实时交互 - 隐私保护” 的闭环能力。


未来,移远通信将持续深化算力平台迭代,推出 80 – 100 TOPS 甚至更高算力的智能模组,结合场景化算法优化,将 AI 大模型的能力拓展至更广泛的端侧 AI 场景。


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com