近日,北京橡木果机器人科技(Acorn Robot)正式发布 "本能驱动"(Instinct-Driven) 技术路线,走出一条与业界主流完全相反的具身智能路径——不靠大模型模仿人类,而是从底层赋予机器人操作本能,让其在与物理世界的交互中自主涌现智能。
公司同日宣布已于2026年3月完成 近亿元种子轮融资 ,领投方为钱唐材料实验室与普华资本。
当前具身智能主流采用VLA(视觉-语言-动作)端到端架构,属于"自上而下"路线。橡木果认为该路线面临三个结构性困境:
| 困境 | 自上而下(VLA) | 橡木果(本能驱动) |
|---|---|---|
| 数据规模 | 语言1个模态→操作3个模态 硬件强相关,数据量指数级膨胀 | Natus零数据冷启动,不依赖训练数据 |
| 实时性 | 语言模型"一个字一个字蹦",操作等不起 | 毫秒级端侧响应,触觉直接驱动 |
| 泛化性 | "换场景就失灵",硬件差异导致模型失效 | 硬件自适应,出厂即适配不同夹爪/灵巧手 |
橡木果用一个类比说明两者的本质区别:打乒乓球的规则全世界一样(任务),但每位选手的打法完全不同(硬件适配)。 没有最好的预训练模型,只有最适配硬件的模型。
橡木果将任务规划与操作执行彻底解耦,通过标准化接口协同:
任务规划层(上层) :负责知识推理与任务分解,输出关键图像帧和语义约束(如"不要洒水"),而非具体动作指令。
操作执行层(下层) :由两个核心模型构成——
| 模型 | 定位 | 核心能力 |
|---|---|---|
| Natus | 端侧自主决策模型,嵌入末端执行器 | 零数据冷启动、硬件自适应、毫秒级响应 |
| Magis | 通用操作技能模型 | 利用Natus交互数据训练,实现跨本体/跨任务泛化 |
Natus完全嵌在末端执行器中,由触觉刺激直接驱动,不需要任何训练数据或微调。它赋予机器人三大操作本能:
实测中,Natus驱动的机器人面对从未见过的异形物体,会沿表面自主探索并成功抓起;面对半瓶水的瓶子,反复试探重心后调整抓力;面对极薄卡片,通过推、翘、扣等动作成功抓起。这些行为不是预设程序,而是本能催生的行为涌现。
Magis利用Natus在真实交互中产生的、带有触觉语义的数据进行训练。当Natus抓取一个香蕉,记录的不仅是"成功了",还有"120g、质心偏左、表皮粗糙、硬度中等"等力学语义。这些数据叠加到视觉帧上,使Magis能"理解"物理世界,而非仅识别外观。
训练数据需求因此从百万小时级别降至 几千小时 。
本能的构建需要完备的触觉输入。橡木果历时7年、迭代十余代原型机,自研 第三代视触觉传感器 :
橡木果已将技术应用于工业柔性生产场景。其机器人系统在某全球头部化妆品ODM厂商处完成验证并实现商业营收,用于抓取、旋拧形状材质各异的瓶罐。
凭借Natus的快速适配能力,新硬件接入无需重新训练,即插即用。
橡木果明确表示不追求做全能选手,而是专注构建最底层的操作基石。其愿景是:未来上层由大模型负责任务规划(解决"做什么"),下层由本能驱动系统负责操作执行(解决"怎么做"),二者通过标准化接口协作,构成真正通用、可靠的具身智能系统。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com