谷歌研发会自学的机器人,仅需几个小时就能学会走路

智东西(公众号:zhidxcom)
编 | 王颖

智东西3月5日消息,最近谷歌一个名为Rainbow Dash的机器人通过AI模型训练学会了走路,还能自由的左右旋转。

Rainbow Dash是一款四足机器人,只需几个小时的训练就可以学会向前和向后行走。

来自谷歌、加州大学伯克利分校和佐治亚理工学院的研究人员已经发表了相关研究论文,描述了这种被称为深度强化学习AI统计的技术。

谷歌研发会自学的机器人,仅需几个小时就能学会走路

一、在真实环境中学习行走

大多数强化学习部署都是在计算机模拟环境中进行的。然而,Rainbow Dash使用这种技术来学习在真实的物理环境中行走。

而且,Rainbow Dash能够在没有专门的教学机制的情况下进行操作,例如人工指导或带有标签的培训数据。最终,Rainbow Dash成功地在多个表面上行走,包括柔软的泡沫床垫和带有明显凹口的门垫。

Rainbow Dash使用的深度强化学习技术包括一种机器学习,在这种机器学习中,代理人与环境交互,通过反复试验进行学习。大多数强化学习使用案例都涉及电脑游戏,在这些游戏中,数字代理人学习如何通过玩游戏来获胜。

这种形式的机器学习明显不同于传统的监督学习或非监督学习,在传统的监督学习模型中,机器学习模型需要标记的训练数据来学习。 深度强化学习将强化学习和深度学习结合在一起,传统机器学习的规模因为巨大的计算能力而大大扩展。

二、强化深度学习无法完全脱离人的干预

尽管研究团队认为Rainbow Dash能够自己学会走路,但人类的干预仍然在实现这一目标中发挥了重要作用。 为了防止机器人离开这个区域,研究人员必须创建边界,机器人可以在该边界内学习走路。

此外,研究人员还设计了特定的算法来防止机器人摔倒,其中一些算法专注于限制机器人的运动。为了防止诸如跌落损伤之类的事故发生,机器人强化学习通常在数字环境中进行,然后再将算法转移到物理机器人上以保持其安全性。

没有参与这项研究的斯坦福大学助理教授Chelsea Finn说:“将人员从学习过程中移除真的很难,通过允许机器人更自主地学习,机器人更接近于能够在我们生活的现实世界中学习。”

论文链接:https://arxiv.org/pdf/2002.08550.pdf

原文来自:TechXplore