可以“高兴”可以“失望“的Alexa来了!还可以化身电台DJ聊音乐【附音频】

智东西(公众号:zhidxcom)
编 | 云鹏

智东西11月27日消息,亚马逊今日宣布Alexa可以用高兴、失望等多种不同语气来回答用户的问题,同时可以用类似广播电台DJ的声音来讨论音乐相关内容。

今年1月,亚马逊通过“神经文本转语音(NTTS)”技术使Alexa可以通过类似新闻播音员的声音来播报新闻。以下是对Theverge相关报道的原文编译。

一、当你喜欢的球队输球,Alexa会与你一起“悲伤”

亚马逊今天宣布,Alexa可以通过“高兴/激动”或“失望/同情”等不同语气回答用户问题,不过目前限于美国地区用户。这些用户很快就可以感受到Alexa的声音可以包含更多的情绪在里面。

亚马逊表示,当你正确回答一些细小问题时,Alexa就会使用高兴/激动的语气,而当你询问体育比赛得分,恰好你喜欢的球队输球时,Alexa就会使用失望/同情的语气。

为了让用户可以感受不同情绪的声音,亚马逊提供了6个示例,针对高兴和失望分别有三个示例,每个示例的情感强烈程度由弱到强。

略微失望:

一般失望:

非常失望:

略微高兴:

一般高兴:

非常高兴:

从以上示例中我们可以明显感受到“非常失望”和“非常高兴”之前还是有着强烈的情感差异的。

二、电台DJ版的Alexa来了

这并不是亚马逊第一次给Alexa的声音带来新变化,今年1月份,亚马逊为Alexa增添了类似新闻播音员的声音。在今天的博客中,亚马逊还宣布开发人员可以使用另一种新的“专注于主题(topic-focused)”的声音来讨论音乐。

与标准Alexa语音相比,这两种声音的语调和语速略有不同,而且听起来更像在广播中听到的新闻播音员或广播DJ的声音。

标准Alexa语调:

播音员语调:

标准Alexa语调:

广播DJ语调:

亚马逊还表示,开发人员现在也可以启用带有澳大利亚口音的新闻播报员声音。

三、Alexa还可以拥有更多种类声音

今年1月亚马逊表示,他们通过机器学习来分析实际新闻频道的音频片段,从而确定新闻播音员的讲话方式,创造新的语音语调。这种“神经文本转语音(NTTS)”方法意味着Alexa可以知道要强调哪些音节、跳过哪些音节,而不是像以前一样均等地发音。

同时,亚马逊称这种机器学习方法具有快速训练Alexa以多种不同风格说话的潜力,因为他们仅用了几个小时的数据进行训练,就使得Alexa可以像新闻播音员那样说话。通过同样的方式,经过10个月的训练,如今他们又推出了此次的多情绪声音以及广播DJ声音。

值得一提的是,多情绪声音的推出,离不开亚马逊早期的积累。早在2008年,亚马逊就开始了语音情绪识别的研究,并且已经在退伍军人中应用。到现在,亚马逊已经积累了大量语音情绪数据。

结语:AI语音“拟人化”是未来发展趋势

此次亚马逊语音助手Alexa“情绪化”的语音语调给我们留下了深刻的印象,也为他们的智能音箱及其他接入Alexa的IoT设备增添了优势。

AI对人类语音中所包含的情绪的识别,以及智能语音助手声音的不断“拟人化”,都使得AI离我们更近一步,更加像一个朋友而不是冰冷的机器系统。

为AI语音加入情绪,让AI更懂人,更像人,才可以让这些智能设备拥有更好的用户体验。“伴随式”AI才不会显得生硬突兀,而这也是各家厂商都在发力的方向。