计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023

智东西(公众号:zhidxcom)
编辑 | GTIC

智东西4月14日报道,在刚刚落幕的GTIC 2023中国AIGC创新峰会上,计算美学(Nolibox)联合创始人黄晟昱发表了名为《AIGC驱动设计创意生产机制革新》的主题演讲。

黄晟昱向在场嘉宾介绍了设计中的技术演化。他指出,当下AI等新兴技术正在经历爆炸式的发展增长,设计行业正在面临着飞速增长的设计创意市场需求与高效率及高品质设计之间的矛盾。从行业趋势上来看,设计创意的过程及方式会随着机器的进化呈现出多元化的趋势。总之,AIGC时代,设计行业面临着生产力变革。

黄晟昱认为,目前实现AIGC驱动下可控的设计创意生产,面临着“人和机器在设计创意中的语言不可通约性”“复杂设计创意需求的获取与分析困难”“设计生成创意难以迭代及落地”等三重困境。但这些困难可以通过保证设计资产的可量化性、设计经验的可归纳性、设计行为的可模拟性等三方面来解决,从而实现从“设计认知”到“机器认知”的转化。

黄晟昱指出,在AI可直接创作的背景下,人和机器设计角色将发生变化。一方面,将从过去的由人主导、以人机交互方式进行设计变为人机协创。另一方面,设计领域还将出现一种训练机器的设计师,他们通过训练机器来实现自己的设计目标。

最后,黄晟昱介绍了设计美学的未来愿景,即通过构建面向未来的智能设计,让设计工具更包容、设计更简单、设计创意更普惠。

以下为黄晟昱的演讲实录:

作为最后一个出场的演讲者,其实我的压力蛮大的。大家今天听了一天的技术干货,包括前沿的大模型研究、产业应用分享等,接下来,我给大家分享一些好玩的东西。我相信,艺术和设计一直都是大家很关注的内容,这也是我们团队,包括计算美学这家公司在这几年一直以来深耕的领域。

我今天演讲的主题是《AIGC驱动设计创意生产机制革新》,势必涉及到设计创意的机制和流程。今天的演讲,我将分三个章节跟大家做一个拆解。

第一章节,我想聊一下设计中的技术演化、技术革新及其影响。其中包括技术如何来影响艺术家?如何影响设计师的创作行为?设计工具如何在一次次的技术迭代中不断演进?

第二章节,基于设计与技术之间的相互纠缠,以及我们在AI设计基础领域近三年的研究,我想聊一下,如何实现AIGC支持下的设计生成技术的路径,包括怎么来解构设计量化的数据和语言?如何构建机器可理解的美学评估模型?

最后一个章节,我希望能够带着大家了解一下我们发布的几款产品,我们如何把AIGC转化为可以落地的设计创意类生产力工具,以及未来是不是每个普通人都将拥有自己的设计创作能力。

一、设计行业面临生产力变革,创意形式及手段呈现多元化趋势

首先,我来讲一下设计与技术的演进,从时代背景来说,以ChatGPT为代表的新兴技术爆发,其实极大地影响了设计行业的竞争和供需关系。

生成式AI使技能变得更加民主和普惠,而技能的民主普惠将会导致设计专业工作模式的变化。从行业趋势来看,我们会发现,在设计创作领域,无论是工业设计、平面设计、服装设计,越来越多的设计师开始使用人机协同的技术和方式来推动设计创作手段的多样性。设计创意的过程也随着机器的进化呈现出多元化的趋势。

我们可能会有一个疑问,在AI都能进行自主设计创意的过程当中,人类应该发挥什么样的作用?如何顺应环境的发展合理使用人工智能技术,协同进入到现有的不同垂类的设计行业工作流,从而不让AI取代人类,而只是辅佐设计师发挥更大的设计创意力量,以及把这种能力赋能给普通人。

回顾一下历史,其实早在70年前的建筑设计领域,设计学者便思考将能够运算和思考的机器带入到设计产品当中。数据和运算在设计领域并不是这几年才兴起的新鲜话题。

每一次运算的进步,其实都伴随设计范式的引进。比如上世纪60年代提出建筑控制论、宇宙结构学;扎哈·哈迪德(Zaha Hadid)大师提出的参数设计、交互设计;很早之前MIT发布的生成设计;再到目前流行的数字建造、网站的响应自适应布局设计,这些都是技术和设计之间不断迭代的标志。

2010年以后,设计行业逐渐进入到设计人工智能的时代,尤其是今年,AIGC理念的爆火,将会诞生一些新的生产方式。

除此之外,我还梳理了一下设计与计算的研究发展历程以及设计与计算的应用发展历程。在1.0阶段,大家很熟悉的Adobe、AUTOCAD等计算机辅助图形设计工具诞生。这个图形在上世纪90年代已经在全球范围之内普及,这些基于机器视觉及图形学,设计动作会被转化为量化规则,早年间设计师通过手绘、印刷方式进行创作。

到了2.0时代,比较有代表性的是阿里的鲁班设计系统、AutoDraw等辅助智能设计工具,它们基于大量的数据和机器学习来提升设计师的工作效率和能力,自动生成banner、简单的海报。

计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023

在3.0时代,微软收购OpenAI之后,推出了Microsoft Designer,我们也推出了图宇宙和画宇宙两款智能产品。这两款产品以机器为主导进行直接设计创意,并在整个设计流程里辅助设计师,并且赋能给普通人。

二、突破AIGC驱动下设计生产困境,实现“设计认知”到“机器认知”转化

谈起我们做这件事情的初衷,其实在2019年,我们就在清华大学发起了一个跨学科的研究性项目。当时设计学、艺术学、计算机学、数学等不同领域的学者希望在一起做一件激动人心的事,彼时,在这些学者看来,没有什么比让机器学会设计创造这件事更让人激动。

2021年,我们进行了产学研转化,联合成立了计算美学,2022年我们分别发布了面向超级创作的生产工具以及智能设计平台。

纵观设计学所关注的人工智能研究,我们通过对设计领域的平面、产品、服装、建筑、室内体验、UI设计等进行分析,做了一些关键词的聚类分析及检索。这其中包括中文研究领域相对比较火的专家系统、知识工程、计算机辅助设计、参数化设计等。除此之外,我们还关注国外目前研究的主流方向和趋势,例如使用大模型或者智能设计产品构建良好的用户体验。

那么,具体而言,如果想实现比较可控的、可编辑的智能设计,而不仅仅是用Stable Diffusion生成一张简单的图像,那么我们前期需要做哪些准备?

首先第一步,我们需要构建设计认知到机器认知的基础概念。我简单做一个类比,智能设计之于设计行业正如自动驾驶之于交通行业,这两者的结果都很相似。人们提供一个设计需求,完成一个交付,就跟人们打车从初始点到终点,完成旅行一样自然。

但相比较而言,驾驶行为是一种结构较强的行为,而设计是一种结构性较弱的行为,它具有很强的不确定性。简单来说,设计一般没有最优解,如果把设计抽象成一类大家比较熟悉的函数关系,那么函数往往不是唯一。

举一个非常简单的例子,当我们打开全球最大的设计素材库、同时也是一家社交网站的Pintrest去搜熊猫的logo。在不同的语义环境和文化下,人们可能会检索到不同风格表达的方式,但很难说哪个logo更受人喜欢。可能用户A喜欢左上角的,用户B喜欢潮酷一点的,这其实是大千世界影射下设计行为复杂性的典型缩影。

为了实现AI驱动下可控的设计生产,需要解决几点问题。首先要解决人和设计创作当中语言的不可通约性;第二,要解决复杂设计创意需求的获取难与分析的问题;第三,要解决设计创意的生成方案难以迭代的问题。我们使用生成式产品做内容创作,当我对整体的画面很满意,但是需要对局部细节进行很多微调的时候,目前很多直接生成创意内容的工具没有办法去满足。所以,我们提出通过把握“设计认知”到“机器认知”转化的三要素来解决这个问题。

计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023

首先,是要保证设计的资产具备可量化性,这个可量化性,其实是针对整个设计创意领域中,非线性思维比较活跃的领域数据和数据集的构建。

第二块是要保证设计经验的可归纳性,这个设计经验有点类似于炒菜,当所有的菜品都备齐了,我需要知道菜谱,而这个菜谱正是不同的设计师基于自己的行业知识所产出的先验经验和知识。

第三个环节,是要保证设计行为的可模拟性,简单来说,就是设计师在做设计的过程中,机器怎么基于资产的量化以及经验的归纳去进行模拟,这个过程我们称为设计生成的算法可控。

因此,我想把这三个最关键的要素跟大家一块儿分享一下,首先什么是设计资产的可量化性?当大家去一些国内知名的素材网站下载各类平面设计素材的时候,这些确实是设计资产。但是,从机器进行设计创造的角度来说,机器并不理解这些数据结构。

简单来说,机器只认识这张图片的尺寸大小,但没有办法知道里面的元素所代表的人类主观情感是什么。除此之外,机器也不知道这张图片是赛博朋克风、波谱艺术风还是潮流潮酷风?更适合哪些人群?这两种元素搭配在一起有哪些情感倾向?而这些其实都是设计师基于常年的一些判断去积累的主观评价经验。

所以我们要做的事情,就是把这些停留在数字空间里的死亡状态下的设计资产,让机器能够从主观的角度去理解它。在这个过程当中,我们构建了全球第一款可商用的视觉设计数据集,我们花了很大工夫自己搭建了标注工厂。

目前,标注工厂以专业的设计师专家系统为主,这其中包括大量普通设计类学生和设计师从业者对于不同元素、视觉内容排版、布局等一系列因素的主观考量。

我们积累了近20万套结构化的设计及模型、近3万张可调用的设计元素、100万条设计美学的评判标准,在此基础上,我们搭建了自己的美学推荐及评估系统,这其中包括了以风格标签、情感标签在内的超过1000万次的标签数据。

跟今天很多嘉宾提到的大模型相比,这个规模可能并不算很大。但是对于设计创意或者平面设计来说,之前没有人做过这类事情。所以,我们希望通过构建未来面向机器可理解的美学数据集来贡献我们自己第一步的基础设施。

其次,我想讲一下设计经验的可归纳性如何实现?在设计领域,有一句大家经常说的话:我在买一个设计师的服务,而不是买设计师给我服务一个月或者一周,我买的是设计师走过的路、旅过的游、读过的书、看过的电影,以及最终设计方案带给我的艺术感受。

简单来说,设计师做设计的过程是一个非线性思维活动的过程,所以我们需要对设计师的设计经验进行归纳。在这个层面上,我们通过设计信息表达模型来完成不同元素之间设计师的阵列,搭建了面向平面设计的设计师框架,还基于自研的设计语言,为设计问题的重构及设计知识的推广和迁移等关键技术提供了非常有力的理论和技术方案的基础。

再往下走,在设计行为具体内容上,我们对图形、文字、色彩、布局、风格等设计构成要素进行了图谱构建,同时基于已有的数据集,结合已经量化好的设计师的先验知识,把基础创意概念和可视化的视觉表达进行了关系映射,为机器提供非常可控、有效接近人类审美的设计作品,提供了一系列的基础。

计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023

最后是如何保证设计行为的可模拟性。因为我们相信,无论Stable Diffusion、ChatGPT给我们带来怎样的冲击和发展,未来主流的设计生产方式一定还是人机协创。

在这个过程当中,我们需要把人类和机器在整个设计链路流程当中的分工达到一种最优的配置,其实也就是明确人机协同视觉设计方案过程当中的生成路径,以及评估和决策路径。因为人类仍然有决定权去说,这个设计可能适不适合我的输出和使用。目前,机器通过学习只能是越来越接近决策者对于设计的判断。

三、针对性搭建底层系统,推动创意生产商业化落地

实现可控的AI设计关键技术要点。第一,我们要构建一套统一结构化的设计元语言来打通人和机器之间沟通的不可通约性,让机器听得懂设计师的话;第二,进行多通道、多模态创意信息捕捉研究,基于DH需求模型,机器可以通过各种媒介来抓取人们的各种行为,成为它创意的来源;第三,进行多技术耦合设计生成技术研究,设计生成算法方法集、目标导向的约束优化规则集。

计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023最后一步很关键,也就是实现人机协同下设计美学评估及决策。这里面涉及到美学评估方法、联想推荐、包括反向基于人类数据的设计产出的学习。

我们还梳理了一整套流程,即解构设计师不同系列的非线性复杂设计行为,到进行统一结构化的描述,再到设计知识的推理及迁移,以及最终统一化的映射表达、可视化的表达,从而产生方案。

因此,我们也针对性地搭建了三个非常底层的系统,其中包括设计资产量化系统、人工智能AIGC设计生成引擎、云端协同可基于AIGC进行二次创作的专业引擎,这三个底层系统将实现从创意内容生产到具体商业化应用AIGC全链路设计服务,有望成为未来产品运作的核心。

四、人和机器设计角色将发生变化,人机协创成为新趋势

那么就会有人问了,AI可以直接进行创作了,那么设计师还要做什么?人和机器在设计创意角色当中会有怎样的变化?

在进行AI设计研发的过程中,我们始终关注设计师与机器之间协同分工的比例,并量化了不同的分布,通过不断的试错来调整人机协创比例,来提升设计创意的效率以及多样性。因此我们内部产生了一个新的训练机器的设计师岗位,这可能是未来构建通用型智能设计模型底层必须要走的路径。

人类以前通过命令机器去完成一些事情,现在通过训练机器来达成自己的设计创意目标。以前,我们关注的更多是设计师在软件使用操作方面怎么样?现在我们更加关注设计师的原创能力如何?设计师训练机器进行设计创意的思路如何?这都将成为未来从业者关注的重点。

在AIGC时代,设计创作成本无限趋于零,原有的供需关系已经被打破,原来以为高品质的价格等于良好的设计,但是现在以非常低成本的价格也能产出很fancy的效果。设计技能逐渐从专业化转向到全民化。门口卖煎饼果子的老太太都可能利用我们的这个产品快速生产新的设计,这是非常有可能的。

大模型产品机会空间广大,这在今天很多嘉宾的分享中也有体现。但是,大模型目前只拘泥于少数巨头。对于垂类行业的创意者而言,应该关注专业场景的应用层,因为这其中可能有非常多的潜在机会,未来的巨头也将会从中出现。

以设计行业为例,从创意内容到设计应用,我们相信AIGC将会驱动整个设计创意自主化加速,从而解放行业生产力。正如设计界非常著名的学者所说的,设计,在人人设计的时代。同时,在这些技术基础之上搭建什么样的产品来服务现有的社会、企业及市场的需求,这将关系到全球平面设计市场、全球设计服务市场以及全球创意市场的市值。

计算美学黄晟昱:设计行业迎来生产力变革,让AIGC驱动设计创意丨GTIC 2023

我们相信,在未来10年,AIGC至少赋能10亿人进行设计创造。按照今年最新的数据,全球的设计从业者为9600万人,将近1亿人,相当于80个人当中就有一个设计师。最新的传统的设计公司,以Adobe为例,它的市值就比较高,我认为,全球设计市场的工具类市场,肯定有非常大超过3000亿美元的巨头出现。

五、B端、C端双重布局,构建面向未来的智能设计体

我们希望让每个人享受好设计,每个人享受好创意,每个人享受好的工具,所以我们在成立两年多的时间相继推出两款产品,也是AIGC超级生产工具。一款是高品质的智能设计引擎,它涵盖了目前整个非线性设计创意活动的两个链路。

第一个是如何激发设计师的灵感,然后在灵感的基础上进行绘制以及草图和素材的积累?第二个是如何成为商业化的设计应用?举一个简单的例子,比如今天大会的背景PPT、大会的视觉体系,这些创意内容的组合输出都需要保证严谨性。在商业化的设计应用上,我们推出了图宇宙和画宇宙,图宇宙和画宇宙将成为面向全球的AI设计创意综合平台,同时真正成为一款以机器设计为主导的设计工具,并重新定义什么是未来的设计生产工具。基于此,我们的NoliHub设计量化引擎及设计模型平台也会向上述两个产品提供强大的底层模型集数据支持。

再简单介绍一下图宇宙和画宇宙,它们区别于现有娱乐化的AIGC包括AI绘画产品,我们更侧重于把我们的能力,尤其做设计工具操作系统的能力赋能到不同的设计创意垂类行业当中,因此我们在去年早期就定向针对Stable Diffusion模型进行重构,并基于垂类行业的训练和调整,同时搭配上我们自研的国产AIGC的无线画板功能,相当于我们提供了非常完善的、针对设计创意的工作流。

在我们看来,单一生成图像并不能解决整个复杂的设计创意工作,它必须要搭配抠图替换、图像超分辨率、文本生成图像等其他公民进行重新规划和设计。

我们目前提供B端和C端两个版本的产品,C端产品为个人用户提供基于无线画板以及AIGC功能合成集。目前C端产品已经积累了来自用户产出的海量AI创意内容,C端产品也因此成为国内最大的AI绘画社区。

除此之外,在B端产品上,我们是第一家实现对B端需求进行大规模定制的公司。目前,B端产品作为面向专用场景的AIGC专业化的工具,应用于服装、游戏、工业设计等非常细分且专业的领域。这些也是垂类用户跟我们共创的产品结果。

在我看来,我们提供多样化的AIGC模块更多是为了构建未来面向AIGC模型的专业操作系统,而这个操作系统会随着有新的垂类行业专业场景玩家的加入而不断更新,从而使我们的AI绘画超越简单的娱乐化功能,而真正成为不同行业领域新的生产方式。

目前,我们通过部署层、模型层、技术层、功能层到整个无线创作画板空间的产品层构建了第一步创意内容的生产。第二步,我们将基于设计自研的SVG画板引擎,构建未来的高品质智能设计平台。这个平台将包含技术创意内容一键设计、海报生成、自适应响应式的开发设计、一键多尺寸的视觉海报延展、各类智能化设计的组件等功能,同时还会基于AI营销文案进行相应填充,包括全局配色,相似风格的生成等。这些都狠狠切在目前传统设计领域当中的痛点。

我们希望,未来设计行业将告别繁琐的模板,所有的设计基于自然语言的描述一键生成。我们也希望助力更多的企业、商家以及个人,让他们以非常低成本的价格获取高品质的设计服务。

我们相信,基于设计认知模型,通过中台的量化平台及管理模块,前台的三个产品矩阵可以给大家带来更好的设计体验。我们希望基于人机协创,构筑面向未来的设计智能体,把非线性的创意思维转为线性的结构数据,从而形成机器和美学的共同进步,我们也希望构建面向未来的智能设计体,让设计工具更包容,设计过程更简单,设计创意更普惠。谢谢各位!

以上是黄晟昱演讲内容的完整整理。