欢迎来智东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智东西公开课
清华AI研究院开源天授强化学习平台
2020-04-02
机器之心
25
4月2日消息,清华大学人工智能研究院基础理论研究中心开源其自研深度强化学习算法平台“天授”。“天授”针对现有平台训练速度慢的缺点,在并行采样基础上提高数据收集能力,采用了cache_buffer配合trainer联动即可达到每秒5000-6000fps的速度;同时注重代码模块化设计,通过避免不必要的额外运算,将reward normalization等现有各类实现中被证明行之有效的各种改进吸纳进天授0.2版本。天授是继珠算可微分概率编程库之后,该中心推出的又一个面向复杂决策任务的编程库。