英国贝尔法斯特女王大学孙冠雄博士：高精度的轻量化视频目标检测

谈到目标检测模型，大家可能都不陌生，像YOLOv1 – YOLOv5，SSD、R-CNN、Faster R-CNN，及最近大火的YOLOX等，但这些目标检测算法仍以二维图像的目标检测为主，对于自动驾驶、机器视觉和视频监控领域并不适用。因此，延伸出许多针对特定场景的目标检测算法，像视频目标检测、行人检测、人脸检测、文本检测等。

视频目标检测是图像目标检测在视频领域的自然延伸，因为视频的本质还是连续的图像，视频目标检测的基本原理与图像目标检测是一样的。视频数据由大量连续图像组成，数量多，相邻图像之间的像素变化较小，存在大量的冗余信息。若将视频数据逐帧分解，直接输入图像目标检测的模型进行训练，庞大的计算量会严重影响检测速度，导致检测结果毫无实际应用的价值，且无法解决视频数据运动模糊、视频离焦、不寻常的姿态或物体遮挡等问题。那如何设计一个兼具速度与精度的目标检测器呢？

12月8日晚7点，英国贝尔法斯特女王大学孙冠雄博士将围绕《高精度的轻量化视频目标检测》这一主题，详细讲解了一种实现速度与精度兼得的视频目标检测框架MAMBA。

MAMBA通过构造轻量级的关键特征集和细粒度的特征更新策略，显着降低计算成本。同时，提出了一种广义增强操作GEO，GEO以统一的方式增强互补的像素级和实例级特征。在 ImageNet VID 数据集上，准确率达到 84.6%mAP，速度为110.3 毫秒。

孙冠雄是英国贝尔法斯特女王大学在读博士，研究方向包括视频目标检测、跟踪、识别等多任务的统一框架，本科和硕士毕业于哈尔滨工业大学计算机学院。

「目标检测与识别专题讲座」将在智东西公开课知识店铺进行，包含主讲和问答两个部分，其中主讲环节40分钟，问答环节20分钟。讲座将组建交流群，并邀请讲师加入，欢迎感兴趣的朋友申请。

主题

高精度的轻量化视频目标检测

提纲

1、视频目标检测的发展现状
2、轻量化的多级特征聚合视频目标检测框架MAMBA
3、在ImageNetVID 数据集上的速度与精度表现

讲师介绍

孙冠雄，英国贝尔法斯特女王大学在读博士，研究方向包括视频目标检测、跟踪、识别等多任务的统一框架；本科和硕士毕业于哈尔滨工业大学计算机学院。

课程信息

直播时间：12月8日19：00
直播地点：智东西公开课知识店铺

相关推荐