谷歌称 Gemini AI 正在让机器人变得更加智能

2024 年 7 月 13 日

谷歌通过 Gemini AI 训练机器人，提升其导航和任务完成能力。DeepMind 的研究团队利用 Gemini 1.5 Pro 的长上下文窗口技术，实现了与 RT-2 机器人更自然的自然语言交互。机器人通过观看视频学习环境布局，并能根据观察执行命令，如引导用户找到充电插座。在 9000 多平方英尺的区域内，Gemini 驱动的机器人对 50 多条用户指令的成功率达到 90%。研究还显示，Gemini 1.5 Pro 能帮助机器人规划执行非导航指令，如寻找指定饮料。尽管存在处理指令时间延迟的问题，DeepMind 仍计划深入研究这些成果。