英国贝尔法斯特女王大学孙冠雄博士:高精度的轻量化视频目标检测 | 讲座预告

谈到目标检测模型,大家可能都不陌生,像YOLOv1 – YOLOv5,SSD、R-CNN、Faster R-CNN,及最近大火的YOLOX等,但这些目标检测算法仍以二维图像的目标检测为主,对于自动驾驶、机器视觉和视频监控领域并不适用。因此,延伸出许多针对特定场景的目标检测算法,像视频目标检测、行人检测、人脸检测、文本检测等。

视频目标检测是图像目标检测在视频领域的自然延伸,因为视频的本质还是连续的图像,视频目标检测的基本原理与图像目标检测是一样的。视频数据由大量连续图像组成,数量多,相邻图像之间的像素变化较小,存在大量的冗余信息。若将视频数据逐帧分解,直接输入图像目标检测的模型进行训练,庞大的计算量会严重影响检测速度,导致检测结果毫无实际应用的价值,且无法解决视频数据运动模糊、视频离焦、不寻常的姿态或物体遮挡等问题。那如何设计一个兼具速度与精度的目标检测器呢?

12月8日晚7点,英国贝尔法斯特女王大学孙冠雄博士将围绕《高精度的轻量化视频目标检测》这一主题,详细讲解了一种实现速度与精度兼得的视频目标检测框架MAMBA。

MAMBA通过构造轻量级的关键特征集和细粒度的特征更新策略,显着降低计算成本。同时,提出了一种广义增强操作GEO,GEO以统一的方式增强互补的像素级和实例级特征。在 ImageNet VID 数据集上,准确率达到 84.6%mAP,速度为110.3 毫秒。

孙冠雄是英国贝尔法斯特女王大学在读博士,研究方向包括视频目标检测、跟踪、识别等多任务的统一框架,本科和硕士毕业于哈尔滨工业大学计算机学院。

「目标检测与识别专题讲座」将在智东西公开课知识店铺进行,包含主讲和问答两个部分,其中主讲环节40分钟,问答环节20分钟。讲座将组建交流群,并邀请讲师加入,欢迎感兴趣的朋友申请。

主题

高精度的轻量化视频目标检测

提纲

1、视频目标检测的发展现状
2、轻量化的多级特征聚合视频目标检测框架MAMBA
3、在ImageNetVID 数据集上的速度与精度表现

讲师介绍

孙冠雄,英国贝尔法斯特女王大学在读博士,研究方向包括视频目标检测、跟踪、识别等多任务的统一框架;本科和硕士毕业于哈尔滨工业大学计算机学院。

课程信息

直播时间:12月8日19:00
直播地点:智东西公开课知识店铺