CV前沿讲座,是智东西公开课针对计算机视觉推出的一档讲座,聚焦于计算机视觉前沿领域研究成果与进展。我们将持续邀请研究者、专家与资深开发者,为大家带来直播讲解。

现有的大多数计算机视觉任务都是试图通过图像来理解图像里的场景和推测场景里各个维度的特性:包括准确的颜色、几何结构、反射特性等等。特定的结构以及它们实际的物理意义决定了这样的任务不是简单的优化问题,也意味着一个高效的视觉算法或者模型必须理解和利用这些存在于自然场景中的结构。这既增加了计算机视觉的挑战性,又提供了很多可以探索的机遇。

什么是自然图像的自相似特性呢?在我们见到图片里,经常会见到同样的图案重复出现,比如整片墙有相近的样式,整片草地有类似的纹理,很多个人组成的人群等。这一自相似性是自然图像与随机生成的乱码的重要区别,也为图像复原和重建提供了重要的先验知识。

而自然场景里的几何结构,主要是单目深度重建,即利用一张图片的输入来预测场景的深度信息。单目深度重建是一极具挑战性的任务,因为一张二维图片包含的三维几何信息极其有限,这决定了单目深度重建的结果将充满了不确定性。这样的不确定性并不是随机的,因为场景里某一区域的深度往往能帮助确定另一区域的几何信息。

为了让大家更好的理解自然图像的自相似特性和几何结构的特点,12月9日上午10点,智东西公开课邀请到圣路易斯华盛顿大学在读博士夏志豪参与到CV前沿讲座第25讲,带来主题为《探索图像和场景结构在图像复原与场景重建中的应用》的直播讲解。

在本次的讲座中,夏博将和大家一起探讨自然图像的自然相似特性和几何结构这两种结构,并详解如何利用自形式特性进行图像复原的传统方法和融合机器学习增加图像重建的准确性和效率的方法,最后也会介绍他们在CVPR2020上发表的一篇论文《生成和探索包含概率的单目深度估计》,来讨论如何预测和表示场景中几何结构的依赖性和不确定性,以及如何利用它们。

夏志豪,圣路易斯华盛顿大学在读博士,本科毕业于中科大少年班。他在Adobe Research,Google Research等有过研究经历。夏博的研究方向主要是设计准确而高效的深度学习算法来预测图像和视频里的物理结构:包括几何结构,灯光和颜色等,同时在CVPR、WACV、NeurIP等国际顶会发表论文多篇。

课程内容

课程主题

《探索图像和场景结构在图像复原与场景重建中的应用》

课程提纲

1、自然场景中图像理解的挑战
2、基于自相似特性的图像复原方法解析
3、自然场景几何结构的单目深度重建的局限性
4、生成与探索包含概率的单目深度估计方法

讲师介绍

夏志豪,圣路易斯华盛顿大学在读博士,本科毕业于中科大少年班;在Adobe Research,Google Research等有过研究经历;研究方向主要是设计准确而高效的深度学习算法来预测图像和视频里的物理结构:包括几何结构,灯光和颜色等;在CVPR、WACV、NeurIP等国际顶会发表论文多篇。

直播信息

直播时间:12月9日10:00
直播地点:智东西公开课小程序

加入讨论群

加入讨论群,除了可以免费收看直播之外,还能认识讲师,与更多同行和同学一起学习,并进行深度讨论。
添加小助手小开(ID:hikai19)即可申请,备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~