欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
Facebook推Other-Play新型学习算法
2020-03-10
机器之心
18
3月10日消息,Facebook AI研究院的学者提出一种名为Other-Play(OP)的新型学习算法,通过寻找更鲁棒的策略以及利用潜在问题中已知的对称性,该算法能够增强自我对决。他们从理论和实验两方面描述了OP算法的特征。研究者探究了合作型卡牌游戏花火(Hanabi),结果证明当OP智能体与其他独立训练的智能体放在一起时会取得更高的分数。此外,初步研究结果显示,与当前SOTA SP智能体相比,本该研究的OP智能体与人类玩家成对出现时也会取得更高的平均分数。相关研究论文《“Other-Play” for Zero-Shot Coordination》已发表。