近日,广东智动未来联合上海创智学院蔡盼盼教授团队正式发布MINT-4B多模态VLA(视觉-语言-动作)大模型。该模型凭借突破性泛化能力与实机表现,在英伟达等行业巨头及国际权威专家发布的全球主流通用机器人大模型评测中跻身前三甲,技术指标优于OpenVLA、GR00T、π、UniVLA等标杆模型。
MINT系列的核心创新在于"复刻任务意图而非机械复刻轨迹"。传统VLA模型在面对环境变化时往往因过度依赖训练轨迹而失效,泛化能力有限。MINT-4B独创SDAT多尺度频域分词技术,将任务特征拆分为顶层任务意图与底层执行细节两类,依托跨尺度自回归推理实现分层解码,使模型能够理解"要做什么"而非仅仅记住"怎么做",从根本上解决了传统VLA模型环境适应性差的痛点。
这一设计使得MINT-4B在面对新场景、新物体、新任务时,无需重新训练即可快速适应,大幅提升了机器人在真实世界中的部署效率。
在由英伟达等行业巨头及国际权威专家组织的全球主流通用机器人大模型评测中,MINT-4B成功跻身前三甲,多项技术指标优于OpenVLA(NVIDIA)、GR00T(NVIDIA)、π(Physical Intelligence)、UniVLA(腾讯Robotics X)等国际标杆模型,展现出国产VLA模型在全球第一梯队的竞争力。
目前,MINT-4B技术已搭载于智动未来小智S2人形机器人,覆盖科教研学、商业展厅等实际应用场景。配套提供开发、实训一体化方案,有效降低落地成本与部署门槛。该机型已在全国多地实现商用落地,验证了模型从实验室到产业化的完整闭环能力。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com