思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

智东西(公众号:zhidxcom)
作者 | 韦世玮
编辑 | 漠影

思必驰在AI智慧办公赛道上正不断玩出新花样!

两个月前的上海AWE(中国家电及消费电子博览会)上,思必驰首次亮相了面向智慧办公场景的新产品——会议魔方M1,具有蓝牙和USB两种连接方式、360°全向麦克风拾音、智能降噪和录音转文字等功能,大大满足了各类办公场景的会议需求。

作为我国人工智能语音行业的独角兽,思必驰在这条赛道上已布局多年,构建了语音识别、声纹识别、口语对话系统等一系列核心技术,其自然语言交互解决方案已落地车联网、IoT及政务、金融等行业场景。

与此同时,思必驰长期以来也为许多合作伙伴提供了会议场景下,声音采集和处理的软硬件解决方案。而会议魔方M1推出,也是思必驰将这部分智能语音技术向更加专业的方向集成拓展。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

作为思必驰智能语音技术的集大成产品之一,会议魔方M1背后的技术城池是如何构建的?能解决哪些行业及用户的痛点需求?未来产品迭代路径是如何规划的?

为此,智东西与思必驰智慧办公业务负责人进行了深入交流,在尝试寻找上述答案的同时,也看到了不少思必驰打磨会议魔方系列背后的思路和闪光点。

一、三大核心技术加持,会议魔方的技术护城河

在深入交流之前,我们也亲自体验了一下会议魔方M1,看看使用它来进行远程会议是不是真的那么方便。

刚拿到会议魔方M1,我们感觉它比一台iPhone 12要重一些,形状是一个塔尖被削平的倒金字塔形立方体,重量只有260g,方便携带。

在一次业务周会中,我们体验了一下它在多人远程会议场景下的使用效果,并和手机进行了对比。参加远程会议的异地同事反馈,会议魔方的拾音效果明显优于手机,对环境噪音的抑制能力很强,以往在远程会议中不可避免的键盘敲击声、开关门声、以及空调运转声等,在使用会议魔方时,都没有听见。与会发言者们的声音也始终非常清晰,无论远近,听到的音量都几乎一致,没有忽高忽低现象出现。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

如果要使用会议魔方的录音以及语音转写功能,在初次使用时,首先要下一个名为晓语听听APP,打开后根据软件提示进行绑定。绑定成功后,直接点击软件下方的蓝色加号开启录音,会议魔方M1就会同步开启录音,记录会议内容。

开始录音一秒后,手机端的录音工作界面就会开始出现实时转文字的内容。遇到想要重点记住的内容时,我们只需要点击APP录音界面的“M一下,转写界面就会出现高亮部分,能更好地一眼区分哪里是用户关注的会议重点。会议结束后,我们只需点击会议魔方M1上方的结束录音,手机端的转写工作也能很快结束。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

从结果上来看,在我们长达3个小时的会议中,会议魔方M1除了口语交流中的少数同音词、多意词没有识别准确外,其他大部分的对话内容都能准确且流畅地转写完成。还可以快速生成会议记录,一键分享给参会的同事。

之后,智东西在和思必驰智慧办公业务负责人的沟通中了解到,会议魔方M1流畅的远程会议体验背后有三大核心算法技术,一是拾音,包括远距离拾音;二是智能降噪;三是对语音进行识别和转写,整个过程也是沟通信息被数字化和智能化处理的过程。

1、拾音:5米内全方位清晰拾音

用户所处的空间环境不同,给会议魔方M1带来的拾音挑战也不同。目前,会议魔方能够做到在75分贝条件下,清晰拾取5米内的任何语音。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

2、降噪:3项智能降噪核心

拾音后的降噪工作是一个大工程,涉及到噪声抑制、回声消除、增益放大等技术。

一方面,通常会议场景中也会存在许多噪音,包括会议室外有人说话、走动、敲键盘,或是室内空调、风扇的声音,会议魔方M1则需要对这部分噪音进行噪声抑制,把会议中的人声清晰地呈现出来。

另一方面,由于设备的扬声器和麦克风连接得很近,当人们在讲话过程中很容易出现回音,这也会影响到用户的通话效果,这时就需要对拾音内容进行回声消除。

同时在远距离拾音过程中,有些说话人离麦克风较远,会议魔方M1也需要对这部分声音进行增益放大处理。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

3、转写:实际会议场景中准确率达95%

正如前面的体验,目前会议魔方M1在转写方面有两项核心功能,一是区分说话人,根据声纹和音色的不同,让转写文字能按不同说话人段落显示;二是文本智能校正,识别口语中常出现的反复、停顿等表达,让转写文本更加流畅。

此外,会议魔方M1通用的转写准确率约95%,还支持中英文混合识别、离线转写分析等功能。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

二、远程会议需求爆发背后,沟通的数字化与智能化

实际上,会议魔方M1的诞生,离不开思必驰对智慧办公场景深刻观察。

思必驰发现,现在的企业会议场景中经常会遇到一个尴尬情况,那就是常常听不清会议内容或是需要喊话交流,一定程度上影响了会议的质量和效率。

另一方面,企业日常中有许多会议或面对面的沟通,都没有被进一步的数字化或智能化处理,难以对会议中的一些价值内容进行深入挖掘。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

“那思必驰作为专业语音和语义技术的企业,能够解决其中的一些关键点。”负责人解释,这也是思必驰做会议魔方M1的优势所在。

首先是思必驰的拾音和智能降噪技术,能够帮助企业解决声音的质量问题,让用户不管是在小型还是大型会议场景下都能清晰交流。其次是思必驰的语音识别和转写技术,能够实现沟通的数字化。

同时,将一场会议面对面沟通的所有语音转成文字,能让用户快速去获得整个会议的信息,再通过机器学习技术对信息进行结构化处理,从而实现会议效率和内容价值的进一步提升。

“我们外部环境的变化,疫情的变化也导致越来越多人需要远程或在家办公。”负责人补充,在这个环境下还有另一个细分场景,那就是家里或咖啡厅场景下的个人设备需求,能够让用户的远程沟通更加清晰,并且还能实时记录交流内容。

而这些都是思必驰决定研发会议魔方M1的重要出发点。

三、千亿规模蓝海市场下,智能会议业务的创新逻辑

目前思必驰面对整个会议场景的思路是构建一个终端设备+云服务的生态模式,这也是发展的核心,具体到产品业务的拓展大致有三类方向。

一是思必驰在录音采集方面已经做了单款采集设备,但适合小型、中型和大型等各类会议场景的采集设备也存在不同区别,而这个方面思必驰会继续做纵深拓展,做得更专业。

二是从横向来看,为了给用户带来更丰富便捷的智能会议体验,思必驰也将选择通过深度合作的方式,补全多模态交互的产品组合。

三是所有传统的会议设备都能和思必驰的语音转写终端做配合,将传统设备变成一个也能智能语音转写的会议设备。

思必驰会议魔方背后有何黑科技?三大算法核心技术加持!

除此之外,未来会议魔方M1还需继续打磨和优化,这主要体现在算法和软件两个层面。

算法方面,会议魔方的智能降噪算法技术将实现更大突破和提升。软件的安全性、易用性和可扩展性也是思必驰接下来重点优化的方向。尤其是会议魔方主要面向企业用户,对产品的安全性要求更为严格。

在可拓展性方面,思必驰在未来也将推出针对大型会议的产品,实现多个设备的互联互通,从而拓展产品的使用空间。而在信息化上,思必驰表示也将面向多人协作场景提供更多软件服务,特别是利用到语义识别或关键信息提取等技术,与企业化流程相结合,目标是降低企业的运营成本。

结语:远程办公浪潮爆发,AI语音赛道的机遇和挑战

过去一年的疫情影响下,云办公、语音视频会议等办公方式逐渐成为大多数人的常态,彻底点燃了智能办公行业的发展浪潮。

尽管在后疫情时代下,人们的办公方式也有所转变,但企业对办公效率智能化、数字化的需求已成行业的一大趋势,越来越多的玩家也抓住机会入局,想着要分一杯羹。在这一市场浪潮下,思必驰也为行业的创新发展提供了一个重要思路。

归根结底,这也是一场技术与企业实现更深入结合的关键阶段。相信在未来,随着人们利用语音技术提取和挖掘信息价值形成一个成熟方法论,也将能广泛地拓展到政务、医疗等更多细分场景,让各行各业都能更好地实现降本增效。