专心“搞事业”的成长型甜美系歌手!讯飞音乐首个AI虚拟歌手亮相

智东西(公众号:zhidxcom)
作者 | 程茜
编辑 | 漠影

你想粉一个声音独一无二的爱豆吗?你脑海里冒出来的第一个甜美声音是什么样?现在,这一切都有了答案。

今年开学季,上海音乐学院出现了一位粉头发、大眼睛、头顶一根呆毛的元气少女偶像歌手。这正是科大讯飞旗下讯飞音乐的首位AI虚拟歌手Luya(露芽),刚出道就已经拥有两首单曲——《北极星与流行雨》和《迷雾之中的微光》,其中,《迷雾之中的微光》在QQ音乐热歌榜排名17。

专心“搞事业”的成长型甜美系歌手!讯飞音乐首个AI虚拟歌手亮相

从洛天依、初音未来到华智冰、柳叶熙,越来越多的虚拟偶像已经“出道”,唱歌、跳舞都不在话下。而Luya与她们最大的不同则是“成长型”,她拥有甜美可爱的外形、声音,还能够在技术、能力不断提升的同时不断成长。

值得一提的是,Luya的声音并不是真人发出,而是由AI创造,科大讯飞AI研究院副院长、讯飞音乐首席科学家江源说:“依托科大讯飞研究院在语音和人工智能领域的技术储备,使得Luya的形象逐渐饱满。” 

1999年成立的科大讯飞,已经在语音及AI技术领域下积淀了20余年,2019年官宣进入音乐赛道。科大讯飞高级副总裁、讯飞研究院院长胡国平曾在讯飞音乐发布会上说:“语音技术融入音乐,势必对音乐行业有深刻影响,甚至帮助整个行业实现质的飞跃。”

智东西与科大讯飞AI研究院副院长、讯飞音乐首席科学家江源进行了深入交流,从Luya的“出道故事”,去揭开AI虚拟歌手背后的黑科技及AI+音乐未来的融合路径。

一、讯飞首个AI虚拟歌手,成长型、音色“唯一”打造强标识

2019年7月讯飞音乐成立,致力于专业音乐制作、多元化宣发、艺人经纪及AI音乐创新产品研究。截至2022年9月,讯飞音乐出品歌曲总播放量突破570亿次,播放过亿歌曲100余首,各音乐平台上榜歌曲数百首。作为讯飞音乐的首位AI虚拟歌手,Luya印证了讯飞音乐在AI+音乐领域探索的更进一步。

作为一名歌手,其亮点离不开优秀的作品和好听的音色,这放在AI虚拟歌手上同样如此。

不过,为了打造虚拟偶像的独特性,很多玩家则选择了完全不同的路径,一种是虚拟偶像的动作、声音、思考都来自于幕后穿戴动作捕捉设备的真人,也就是“中之人”;一种则是用AI创造音色,为虚拟偶像打造独一无二的声音。

选择后一种方式的讯飞音乐,其首个AI虚拟歌手Luya的音色也成为了其亮点。

那么具体而言,打造一个AI虚拟歌手需要几步?确定人设、AI创造音色、打造外形、出道。对于Luya来说,其中最重要的就是AI创造音色,江源告诉智东西,这一套流程下来,用AI创造Luya的音色他们就花了大量时间磨合调试。

最初,Luya的设定就是性格爽朗、古灵精怪的天才少女,这之后,她的外形和音色也都延续了这一特点。在Luya发布单曲下方的评论区中,可以看到网友讨论的焦点都在其甜美、元气满满的声音上。

专心“搞事业”的成长型甜美系歌手!讯飞音乐首个AI虚拟歌手亮相

Luya的音色并不是来源于某一个具体的真人,而是讯飞音乐基于AI不断调节、优化声音属性的同时去创造一个独一无二的声音。

江源告诉智东西,为了找到符合Luya人设的声音,他们构建了一个拥有海量音色的声音库,通过多维的手段,利用这些音色建立一个音色空间模型,再将上百万的声音样本进行拆解、调节,这个调节过程可能包括声音的甜美程度、性别变化、年轻程度等。

讯飞音乐在对这些细节不断组合调整的过程中,使得Luya的声音形象逐渐饱满、成熟。

除此以外,不同于一个成熟的歌手,Luya的定位更像一个不断成长的大学生,同时也是在音乐世界徜徉探索的“精灵”。

提及AI虚拟歌手,你脑海中的雏形可能是更早期的洛天依、初音未来,以及最近引起热议的乐华娱乐虚拟偶像团体A-SOUL,但Luya与这些虚拟偶像最大的不同还在于,“她是成长型歌手”

江源说:“和洛天依、初音未来的不同之处在于,Luya并没有被在最开始就定义成完美,她更像我们的女儿,随着技术和能力的进步,而不断成长。”

而这些特点也凸显出了AI虚拟歌手Luya的强标识性特征。那么,在独一无二的Luya背后,还有哪些黑科技?

二、甜美、元气的声音,由AI创造

说的不如唱的好听,我们可以先来感受一下Luya的真正实力。

这两首歌正是Luya已经发布的单曲,这些元气满满的声音不是现实中某人发出,而是由AI创造的,这背后的黑科技也正是科大讯飞的核心优势。

不同于很多AI虚拟歌手背后的“中之人”,世界上,几乎找不出与Luya的音色完全相同的人声,这背后正是依靠讯飞音乐的“x-vocal”技术。

上文我们提到的讯飞音乐建立了一个具有海量音色的声音库,再由技术专家、混音师、音乐创作者、爱好者对声音进行挑选、制造,在这个庞大的音色空间中,找到最终符合Luya声音定位的专属音色,而这个就是“x-vocal”技术的实现过程。

从技术角度而言,其难度在于,即使讯飞音乐构建了一个庞大的音色空间,但其中可调节的维度及其对应的物理解释、人对其的物理感知量,都是很难去进行调节的。

因此,江源解释道,他们会定标一些声音的程度,如年龄层次、甜美程度、高亢沙哑等,通过人工判断并给予其人工定标,再围绕着这一过程,去拆解主线条上的维度。

再加上“声音是一个动态变化的过程,因此AI虚拟歌手背后的技术难度其实非常高”。

从音乐角度来看,就如同“一千个观众眼中有一千个哈姆雷特”,每个人会对音乐作品产生不同的理解。因此,Luya背后不光蕴含着黑科技,还有音乐向的理解存在。

在用AI创造Luya音色的过程中,技术人员对于音色的理解和评价逐渐从技术角度延伸到大众语言的角度。“我认为这是非常有趣的,对我们有很大的帮助和提升。”

具体而言,声音对于一个人有时候具有代表性作用,你可能听到“咳嗽声”就能知道是谁,但相比于作为歌手的声音,其判断维度有很大不同。因此,如果单纯按照说话的声音去构建一个发音模型,对于歌声来说是不适用的。

因此,讯飞音乐在技术积淀的同时,也在加深对音乐的理解,而Luya也在不断成长。江源说:“我们希望打造一个不断成长,并给Luya不断赋能的过程。”

目前而言,讯飞音乐对于Luya的包装仍然是不成熟的,随着技术和能力的不断提升,Luya的未来具有无限可能。

三、成长型AI虚拟歌手,携手上音“搞事业”

很多人可能会有这样的好奇,现在已经有很多真人偶像,为什么我们还会需要AI虚拟歌手?想要回答这个问题,我们可以先从真人偶像和AI虚拟歌手的共性说起。

事实上,AI虚拟歌手并不神秘,她的成长路径和真人歌手有很多相似之处,其真正价值在于音乐作品,AI技术也只是其中的辅助。

江源谈道,中之人的优势在于可以和粉丝进行交互,除音乐外,这些虚拟偶像被包装的元素可能更多。而相对于声音创作,中之人会比AI的流程更加轻松一点。

归根结底,音乐本身的价值更为关键。谈及Luya的下一步计划,江源透露,他们还是希望通过音乐内容去撬动更多的粉丝群体,更强调她的音乐属性。

因此,为了积淀Luya在音乐领域的实力,同时助力AI+音乐领域的融合,Luya在今年开学季进入上海音乐学院“音乐工程系·讯飞音乐 联合研发中心”。

专心“搞事业”的成长型甜美系歌手!讯飞音乐首个AI虚拟歌手亮相

接下来Luya的成长计划将着眼于AI辅助创作能力提升,初期,Luya将凭借其AI合成的音色参与歌曲演绎,未来会进一步延伸至AI辅助作词、作曲等领域。

江源还谈道,Luya会在上音的实验室里联合专业领域进行音乐创作等,而这一部分内容也会进一步赋予给Luya,这也是讯飞音乐推动Luya未来能力不断成长的关键过程。

总的来看,AI虚拟歌手与真人歌手并不会相互取代,反之,凭借其优秀的音乐作品会拥有一众粉丝群体。

Luya现阶段会基于自己的人设特点,从人格化角度与喜爱她的粉丝、听众交流回复,接下来会通过构建自己的知识库,依托知识积累沉淀,与粉丝进行更直接的互动。

“我相信,AI虚拟歌手会变得更加有血有肉。”江源说。他们的价值也是可以不断被挖掘,并超出人类预期的。他认为,三年到五年的时间,AI虚拟歌手就可以在音乐领域构建自己的知识库,拥有专家级别的理解和认识。

依托于Luya的成长型特性,她也会随着讯飞音乐在语音和AI技术领域的不断发展而成长。

AI技术的发展逐渐走向千行百业,并真正落地其中。AI与音乐的融合并不止于此,讯飞音乐也一直在探索创新路径。

结语:讯飞音乐解开AI+音乐的奥秘

AI+音乐已经成为AI技术应用落地的重要领域,科大讯飞依托于其深厚的技术积累,开始发力,Luya也凭借其甜美的音色在各大平台吸引了一众粉丝。不同于其他领域,人们对于艺术的看法总是千人千面,江源说:“这也是我们在研发过程中觉得有趣的一点。”Luya让我们看到了讯飞音乐在这一领域探索的无限可能。

未来,随着Luya越来越成熟,AI虚拟歌手更加立体,AI技术的不断进步,这一领域也许会迸发更多元的可能性。