下周，CMU博士胡亚飞和轻舟智航高级感知工程师陈钰讲解深度强化学习在机器人领域的研究！

「CV研究合辑」，是智东西公开课针对计算机视觉推出的一档合辑，聚焦于计算机视觉前沿领域研究成果与进展的讲解。每一讲由主讲与答疑两个环节组成，其中，主讲60分钟，采用视频直播形式，答疑30分钟，将在相应交流群进行。

我们都知道，机器学习方法主要可以分为四类，监督学习、半监督学习、无监督学习、以及强化学习。不同于连接主义的监督学习方法，强化学习是智能体通过与环境的交互，观测交互结果以及获得相应的回报。这种学习的方式是模拟人或动物的一种学习方式，因此强化学习在机器人领域有着广泛的应用。

传统的强化学习局限于动作空间和样本空间都很小，且一般是离散的情境下。然而实际情况的任务则往往有着很大的状态空间和连续的动作空间。当输入数据为图像，声音时，往往具有很高维度，传统的强化学习很难处理，此时就需要结合深度学习的方法，将高纬度数据进行降维处理，即深度强化学习方法。

然而深度强化学习到底是什么样的方法，又有哪些应用，尤其在机器人领域又有怎样的进展呢？北京时间4月11日上午10点（硅谷时间4月10日晚7点、宾夕法尼亚州时间4月10日晚10点），智东西公开课「CV研究合辑」第3讲直播开讲，由卡内基梅隆大学博士胡亚飞和轻舟智航高级感知工程师陈钰，为大家讲解《深度强化学习在机器人领域的研究》。

胡亚飞是卡内基梅隆大学博士，目前在计算机学院下的机器人系进行研究工作，主要研究方向为动态场景下的视觉SLAM（包括深度学习方法和传统几何方法）、强化学习在机器人决策与规划中的应用以及2D/3D多目标跟踪等问题。他曾任ICRA, Autonomous Robot审稿人。

陈钰是轻舟智航高级感知工程师，工作内容主要是多传感器融合的追踪；卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科；曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习，有多项美国专利；在CMU MLD Katerina Fragkiadaki实验室做研究助理；在知乎上撰写了深度学习专栏：CMU 10-703 深度强化学习笔记。

CV研究合辑」此前已经完结两讲。第一讲由电子科技大学李文教授主讲，主题为《领域适应在计算机视觉中的研究和应用》；第二讲是由小牛动漫资深算法工程师卢薇薇主讲的《生成式对抗网络GAN在动漫领域的应用》。更多讲次也已陆续敲定，会尽快公布。敬请期待。

直播信息

直播时间：4月11日10：00-11：30（北京时间）
直播平台：智东西公开课小程序
答疑地址：强化学习交流群

课程内容

主题：深度强化学习在机器人领域的研究

提纲：

1、深度强化学习的研究进展
2、深度强化学习在机器人领域的应用
3、仿真器如何解决自动驾驶领域长尾问题
4、imitation learning快速学习可操作的驾驶策略
5、使用A3C，DDPG进行smart agent方面的研究

讲师介绍

胡亚飞，卡内基梅隆大学博士，目前在计算机学院下的机器人系进行研究工作；主要研究方向为动态场景下的视觉SLAM（包括深度学习方法和传统几何方法），强化学习在机器人决策与规划中的应用，以及2D/3D多目标跟踪等问题；曾任ICRA, Autonomous Robot审稿人。

陈钰，轻舟智航高级感知工程师，工作内容主要是多传感器融合的追踪；卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科；曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习，有多项美国专利；在CMU MLD Katerina Fragkiadaki实验室做研究助理；在知乎上撰写了深度学习专栏： CMU 10-703 深度强化学习笔记。

申请入群

本次课程的讲解分为主讲和答疑两部分，主讲以视频直播形式，答疑将在「强化学习交流群」进行。

加入交流群，除了可以免费收听直播之外，还能认识讲师，与更多同行和同学一起学习，并进行深度讨论。

相关推荐