美图如何炼好视觉大模型?对话多位高管,解读美图工具属性进化论

智东西(公众号:zhidxcom)
作者 | ZeR0
编辑 | 漠影

智东西6月25日报道,美图在6月19日举办的第二届美图影像节上推出AI视觉创作工具WHEE、AI口播视频工具开拍、桌面端AI视频编辑工具WinkStudio、主打AI商业设计的美图设计室2.0、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo、美图视觉大模型MiracleVision(奇想智能)等7款AI产品。

会后,美图公司创始人、董事长兼CEO吴欣鸿,美图公司集团高级副总裁,影像产业事业群总裁陈剑毅,美图公司高级技术副总裁杨明花,美图公司技术副总裁兼MT Lab(美图影像研究院)负责人刘洛麒,美图公司设计副总裁、设计中心负责人许俊接受媒体采访,并分享了美图MiracleVision视觉大模型的独特之处。

吴欣鸿说,7款产品发布后,美图实现从生活场景向生产力场景的进阶,逐步形成了由底层、中间层和应用层构建的AI产品生态:在应用层,美图在AI图片、AI视频、AI设计、AI数字人领域创新探索,并由美图秀秀实现AI影像服务聚合;在中间层,美图提供了美图AI开放平台、美图创意平台、美图AI助手RoboNeo的组合;在底层,MiracleVision视觉大模型为美图全系产品提供AI模型能力。

美图如何炼好视觉大模型?对话多位高管,解读美图工具属性进化论

一、美图视觉大模型的优势:美学积累,用户基础,获客能力

美图MiracleVision视觉大模型从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化,擅长亚洲人像摄影、国风国潮、商业设计等生成方向。

谈及与市面上其它大模型的不同,杨明花说,美图做的模型是一个懂美学的模型,因为美图在美学趋势方面探索沉淀多年,美图视觉大模型对人像的理解更好,质量也更高清、更可控。

吴欣鸿补充道,美图有比较大的一个用户基数,现在是2.43亿的月活,因此有在很短时间验证产品的优势。无论是视觉大模型还是在其上的应用,会面临一个获客成本高的问题,而美图在这方面的优势得天独厚。

他透露道,美图希望把像VIP订阅和单购跑通,未来能让围绕大模型的应用很快商业化。造血是很重要的,无论是对于美图自身,还是说在美图平台上,如何让创作者和开发者也能够变现、获得分成,是美图生态非常重要的一点。

吴欣鸿介绍说,好的视觉大模型需要有良好的“模型生态”支撑,这个过程离不开创作者和开发者的持续参与。美图将通过模型的训练、分发和商业化,体系化构建模型生态。像美图云修助力商业摄影行业,美图设计室助力电商场景,WinkStudio助力影视编辑。

美图如何炼好视觉大模型?对话多位高管,解读美图工具属性进化论

陈剑毅谈道,美图庞大用户体量的正负反馈,能够不断地帮助调教和优化美图模型,因此模型成长速度会比没有这种用户规模的产品更有优势。

另据吴欣鸿介绍,美图在模型策略中加大了对Bad case的权重,类似于自训练,让它可以通过这些负反馈快速提升。

在视觉大模型所需的计算资源方面,杨明花说,2019年美图上云,内部有一个服务调度系统,会实时调度到各平台上,有云厂商在背后的大力支持。刘洛麒称,美图通过生态的方式解决这个问题,比方把模型能力提供给用户后,用户一起来共创,他们也会获得一些商业上的收益,这个收益会反哺模型的计算资源的补充和不足。

按满分100分计,吴欣鸿给美图视觉大模型打60分,他坦言目前该模型离最理想的生成效果还是仍有较大差距,特别是在创造性上面。但起点越低,空间越大,他相信美图有很好的基础去做好这个事情。他确认美图视觉大模型一定是公司最核心的业务,未来能够为美图提供最重要的支撑。

二、AI推动工具效率变革,美图订阅收入首超广告收入

吴欣鸿说,美图是一家擅长做工具、做应用、做整合的一家公司,前期会聚焦在最紧密的这些领域,先把能力所及的事做好,再一步一步看能否延展到更多的应用场景和行业。

在他看来,AI正成为推动工具效率变革的能源,工具价值将在AI时代迎来大爆发。在AI与影像生产力工具的紧密结合下,优质内容创作门槛不断降低,影像行业生产效率不断提升。

据他分享,今天美图产品的工具属性已经发生变化。过去美图主要服务于用户的生活场景,比如拍摄、修图、修视频、社交分享。在AI时代,除生活场景外,美图将提供更多生产力场景的服务,如视觉创作、商业摄影、专业视频编辑、商业设计等等。

美图如何炼好视觉大模型?对话多位高管,解读美图工具属性进化论

美图的AI相关布局始于2010年,通过成立美图影像研究院聚焦计算机视觉,自2013年开始重点投入深度学习,2016年推出AIGC的产品雏形“手绘自拍”。2022年11月以来,美图AIGC产品进入爆发期,推出AI绘画、AI动漫、AI商品图、AI试衣、AI写真等功能。

在AI的驱动下,截至6月18日,美图的全球VIP会员数从去年影像节公布的450万增长至719万。“VIP会员数的快速增长,也让我们去年的订阅收入首次超过广告收入,开启了美图商业化的第二曲线。”吴欣鸿说,AI对美图的VIP订阅和SaaS都起到了很正向的推动。

美图如何炼好视觉大模型?对话多位高管,解读美图工具属性进化论

关于AIGC对视频创作的影响,吴欣鸿谈道,AI时代真正实现了用手机就能制作有电影感的专业高清视频,另外之前更多是在本地,未来云端的各种AI生成可能会成为更主流的方式。美图正在观察这两个变化,考虑在产品上如何匹配。

在美图设计室2.0的AI商品图方面,据陈剑毅透露,美图跟几家大的客户电商平台在谈一些具体的API合作,会接入他们整个电商平台的SaaS后端。商家用手机等设备简单拍摄商品,通过SaaS在美图的AI接口一键生成整套商品图,这已经有行业应用在跑。

吴欣鸿说,美图希望能够跟行业头部进行AI的共创,通过这些头部合作伙伴的认知和帮助,增强对很多行业的深度理解。

结语:AI与影像生产力结合,不断降低优质内容创作门槛

吴欣鸿坦言,现在无论是美图还是其他的一些产品,跟世界最顶尖产品还存在一些差距,所以美图希望先打造出世界级的产品,消除能力上的差距,然后在此基础上,探索如何更好地服务美图的用户和行业客户。

在AI与影像生产力工具的紧密结合下,优质内容的创作门槛将不断降低,很多行业的生产效率也将不断提升。吴欣鸿希望更多人享受AI科技红利,一起用上AI时代的影像生产力工具。

除了视觉影视行业外,未来会更多行业逐步用到视觉大模型的能力。国家正推动“数实融合”,而人工智能是数字化的一个重要组成部分。在这样的产业大背景下,未来没有技术背景的公司也能轻松用上视觉大模型带来的各种能力,吴欣鸿相信这一天应该在三年内会逐渐到来。