AI不仅会P图了,还能让照片“动起来”!

智东西(公众号:zhidxcom)
编译 | 剑腾
编辑 | 云鹏

智东西6月2日消息,近日北卡罗来纳州立大学的研究人员开发了一种新型AI技术,这一技术可以用来创建和修改图像,同时在上面添加新的数字和文本。此外,这一技术允许AI在保持图像主要特征的情况下,移动或更改图像中的元素。这一AI技术将广泛使用于智能机器人和人工智能训练领域

本研究由北卡罗来纳州电气与计算机工程系的助理教授吴天福(Tianfu Wu)领导,他于 2016 年 8 月加入北卡罗来纳州立大学,负责视觉叙事的校长卓越计划集群招聘。目前他领导着北卡罗来纳州视觉建模、计算和学习实验室。

一、快速生成场景,“p图”从未如此简单

目前该技术可以根据用户的需求,生成特定的图像。比如,当用户需要猫和狗的图像时,AI就会生成这些图像。此外,AI允许用户把生成的图像放在他们所指定的位置。比如,用户可以指定天空生成在屏幕上方,大树生成在屏幕下方,另外再设置一条溪流从二者之间横穿过去。

该项目的研究人员,吴天福说道:“AI能根据用户需求生成一组特定的图像,然后把特定形象添加到这一场景中。”例如,用户可以让 AI 创建一副雪山景象,然后通过AI把滑雪者和谐地添加到这座雪山中。

二、操纵图像,让你的照片动起来

这一AI除了使用简便外,似乎与Photoshop没有太大的差别。事实真的是这样吗?

这项AI技术不仅能生成场景并在其中添加图像,还能让用户操纵图像。用户可以让图像在保有本身特征的同时,产生他们所需要细微改变。例如,根据一张滑雪照片,AI可以微调滑雪者的动作,生成一组图片,显示滑雪者穿越雪山时的动态场景。

AI不仅会P图了,还能让照片“动起来”!

这种技术有什么用呢?“将该技术应用于智能机器人上,能让机器人更好地识别和区别图像中的物体,使它更好地处理现实世界中的任务。”吴天福说。“这一技术也能帮助研究者训练其他AI,它可以生成海量训练其他AI所需的图片,这样研究者就不需要自己寻找、制作所需要的图片。”

三、走出二维,可操纵图像的AI将运用于3D图像和视频

目前,研究人员正使用COCO-Stuff数据集和Visual Genome数据集对这一AI技术进行进一步的探索。这一探索过程需要耗费大量算力,研究人员专门为此建立了一个工作站。

“我们目前的计划是看看这一技术是否有望扩展到视频和3D图像上。”吴天福说。

结语:可操纵图像的AI是否会进入人类生活?

北卡罗来纳州立大学研发的AI技术目前已经能实现生成场景、添加图像、对图像进行微调等功能,未来它还可能被运用于3D图像和视频中。

自阿尔法狗打败李世石后,AI逐渐进入人类生活。目前北卡罗来纳州立大学正在研究的AI技术未来会有怎样的发展,会如何影响人们的生活?值得期待。

来源:Tech Xplore