南洋理工大学AutoMan实验室在读博士黄志宇:自动驾驶智能决策生成算法解析 | 自动驾驶新青年讲座12

「自动驾驶新青年讲座」由智东西公开课全新企划,将邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。

有兴趣分享的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系。

决策是自动驾驶系统中至关重要的一环,是决定自动驾驶汽车大规模部署的前沿问题。相比于传统的基于规则的决策方法,基于学习的决策方法可以大大增强系统的可扩展性,从而加速自动驾驶汽车在现实复杂道路情况下的开发和部署。然而,目前仍缺乏对基于学习的自动驾驶决策过程的系统总结。

来自南洋理工大学的AutoMan实验室的在读博士黄志宇等人专注于自动驾驶决策、预测规划领域的研究。他们在最新的研究中利用逆强化学习(Inverse reinforcement learning)评估决策,结合模仿学习(Imitation learning)和强化学习(Reinforcement learning)直接生成决策,以及学习世界模型(World model)用于决策。

11月29日晚7点,「自动驾驶新青年讲座」第12讲邀请到南洋理工大学在读博士黄志宇,主讲《自动驾驶智能决策生成算法解析》。

本次讲座中,黄博将基于个人的研究工作,全面讲解基于学习的决策系统框架以及其中各模块的学习方法,之后重点将讲解学习世界模型对真实世界交通场景中的人类交互行为进行建模,并以此做出更加智能和拟人化的决策。

讲者
黄志宇,南洋理工大学在读博士;研究方向为自动驾驶决策、预测规划及人机交互;在TNNLS、TITS、ICRA/IV等相关领域顶级期刊和会议发表多篇论文;曾获2021年Waymo开放数据集挑战赛交互预测冠军,运动预测亚军以及2022年Occupancy Flow预测亚军。

第12讲
主 题
《自动驾驶智能决策生成算法解析》

提 纲
1、基于学习的决策系统框架
2、逆强化学习评估决策
3、结合强化学习与模仿学习的决策生成
4、学习世界模型对人类交互行为建模及决策生成

直 播 信 息
直播时间:11月29日19:00
直播地点:智东西公开课知识店铺

成果

论文标题
《Driving behavior modeling using naturalistic human driving data with inverse reinforcement learning》
《Efficient deep reinforcement learning with imitative expert priors for autonomous driving》
《Differentiable integrated motion prediction and planning with learnable cost function for autonomous driving》

论文地址
https://arxiv.org/abs/2010.03118
https://arxiv.org/abs/2103.10690
https://arxiv.org/abs/2207.10422

开源地址
https://github.com/MCZhi/Driving-IRL-NGSIM
https://github.com/MCZhi/Expert-Prior-RL
https://github.com/MCZhi/DIPP