谷歌旗下 DeepMind 开发出 RoboCat AI 模型
IT之家 6 月 26 日消息,谷歌表示,该公司开发了一种名为人工智能的人工智能模型,可以控制不同的机器人手臂执行一系列任务。 仅此一点并不是特别新颖,但声称该模型是第一个能够解决和适应多个任务的模型,并且使用不同的现实世界机器人来做到这一点。
受到 Gato 的启发,Gato 是另一种可以分析和处理文本、图像和事件的人工智能模型。 训练数据包括来自虚拟环境中的其他机器人控制模型、人类控制的机器人以及它们自身的先前版本的模拟和真实机器人的图像和运动数据。
“我们证明,一个大型模型可以解决多个现实机器人实体上的不网同任务,”该团队的合作者、研究科学家亚历克斯李(Alex Lee)在电子邮件采访中说道。 并且能够快速适应新的任务和实体。”
为了进行训练,研究人员首先使用人类控制的机械臂在模拟或真实环境中收集了每个任务或机器人的 100 到 1,000 个演示。 例如,让机械臂拾取齿轮或堆砌块等。然后他们对其进行微调,为每个任务创建专门的“派生”模型,并平均练习 10,000 次。 通过利用衍生模型生成的数据和演示数据,研究人员不断扩展训练数据集,训练出新版本的模型。
最终版本总共接受了 253网 项任务的训练,并在模拟和现实世界中对这些任务的 141 种变体进行了测试。 声称在观察了数小时内收集的 1000 个人类控制的演示后,学会了操作不同类型的机械臂。 虽然它已经在四个具有双爪臂的机器人上进行了训练,但该模型可以适应具有三指夹具和两倍的可控输入的更复杂的机器人臂。
即便如此,在 的测试中,不同任务的成功率差异很大,从最低的 13% 到最高的 99%。 这是训练数据中的 1000 个演示; 如果示威次数减半,成功率也会相应降低。 然而,在某些情况下,据称只需要 100 网次演示即可学习新任务。
Alex Lee 表示,这或许可以降低解决新任务的难度。 “给定一定数量的新任务演示,它可以针对新任务进行微调,并通过自我生成更多数据来进一步改进,”他补充道。
未来,研究团队的目标是将教授执行一项新任务所需的演示次数减少到 10 次以下。