「AI新青年讲座」将邀请世界顶尖AI研究机构和大学的科研新青年,主讲他们在计算机视觉、机器学习等人工智能领域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑,将可以帮助大家增进对人工智能前沿研究的理解,相应领域的专业知识也能够得以积累加深。同时,通过与AI新青年的直接交流,大家在AI学习和应用AI的过程中遇到的问题,也能够尽快解决。

有兴趣分享学术成果的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系。

姿态估计在以人为中心的视觉应用中起着关键作用。然而,由于计算成本高(每帧超过150 GMACs),很难在资源受限的边缘设备上部署SOTA的基于HRNet的姿态估计模型。

很多大模型上的结论和方法,在轻量模型的研究中并不适用,对大模型有显著帮助的 trick 在轻量模型上完全有可能掉点,模型性能也并不是随着计算量的增大而单调递增,其中存在很多的局部最优。因此,如何在有限的计算资源下设计出最优的模型结构,总结出一些最优的设计准则,是一个值得研究的话题。

MIT韩松老师组在研究了边缘端实时的多人姿态估计模型的高效架构设计后,通过渐进收缩(gradual shrinking)实验发现:HRNet的高分辨率分支对于低计算区域的模型是多余的,删除它们可以提高效率和性能。

在 CVPR 2022 上,来自清华、CMU 和 MIT 的团队最新提出一种用于姿势估计的高效单分支结构LitePose。在移动平台上,LitePose 在不牺牲性能的情况下将延迟降低了5倍,与现有的 SOTA 高效姿态估计模型相比,推动多人实时姿态估计模型在边缘端取得了突破性进展。

1月13日早10点,AI新青年讲座第191讲邀请到LitePose一作、普林斯顿大学在读博士王羿涵,主讲《边缘端实时多人姿态估计架构Lite Pose》。

讲者
王羿涵,普林斯顿大学在读博士;本科毕业于清华大学交叉信息研究院,曾在ICLR 2021、CVPR 2022发表一作论文;目前研究方向为计算机视觉及其应用。

第191讲

主 题
《边缘端实时多人姿态估计架构Lite Pose》

提 纲
1、典型的人体姿势估计模型解析
2、2D多人姿态估计的瓶颈
3、主流人姿态估计网络的计算冗余
4、自下而上的单分支姿态估计架构LitePose

直 播 信 息
直播时间:1月13日10:00
直播地点:智东西公开课知识店铺

成果
LitePose:《Lite Pose: Efficient Architecture Design for 2D Human Pose Estimation》
论文地址:https://arxiv.org/pdf/2205.01271
代码地址:https://github.com/mit-han-lab/litepose