谷歌借助Gemini AI系统深化对机器人的训练

发布时间：2024-07-12 17:46:06

7月12日，国际科技界传来新动态，谷歌正借助其先进的Gemini AI系统，深化对旗下机器人的训练，旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文，详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能，极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。

这一创新技术的核心在于，机器人首先通过拍摄并分析家庭或办公室等指定区域的视频，利用Gemini 1.5 Pro的强大能力来“学习”并理解其所在环境。随后，机器人能够基于这些视觉信息，灵活运用语音和/或图像反馈，执行用户的复杂指令。例如，当用户询问“我在哪里可以给手机充电？”时，机器人能迅速识别环境，并引导用户至最近的电源插座。

据DeepMind透露，在覆盖超过9，000平方英尺的测试区域内，这些由Gemini驱动的机器人成功响应并完成了50多项不同用户指令，成功率高达90%，展现了极高的准确性和效率。

更令人振奋的是，初步研究还揭示了Gemini 1.5 Pro赋予机器人的额外能力——即除了精准导航外，还能规划并执行更为复杂的任务指令。例如，面对询问是否有特定饮料的用户，机器人能够自主决定前往冰箱检查，随后返回并报告结果，这一连串动作展现了其强大的决策与执行能力。

尽管在视频演示中，机器人对每条指令的迅速确认给人留下了深刻印象，但研究报告也诚实地指出了背后隐藏的“秘密”——处理这些复杂指令实际上需要10至30秒的时间。这表明，尽管技术进步显著，但实现完全无缝的人机交互仍需时日。

不过，这一系列的进展无疑为我们描绘了一幅未来生活的美好图景：或许不久的将来，我们就能与这些高度智能化的机器人共享家园，让它们帮助我们找到遗失的钥匙、钱包，甚至是执行更多日常生活中的琐碎任务，极大地提升生活的便捷性与舒适度。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

谷歌借助Gemini AI系统深化对机器人的训练

相关阅读

ai资讯推荐

最新资讯