罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

智东西(公众号:zhidxcom)
作者 | 屈望苗
编辑 | 江心白

智东西4月13日报道,今天,百度与罗技联合发布了VOICE M380语音鼠标。其中搭载了百度语音识别和机器翻译两大技术,中文语音识别率可达98.6%,具有每分钟400字的听写能力。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲M380鼠标白色款,单击其上的绿色按钮可开始和结束语音输入,双击可切换模式

罗技大中华区PW&PC品类营销总监张亮说,近年来语音输入成为了年轻人新宠,中国用户今年发送语音的条数高达61亿条,较去年增长26%,而PC端的语音输入成为了一个新的发力点。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲罗技大中华区PW&PC品类营销总监张亮致辞

百度总监蔡玉婷还提到,这次合作基于百度的AI语音输入系统和罗技的硬件能力,未来还将拓展会议、游戏等多个应用场景,实现更多产品的AI赋能。

一、识别准确率达98.6%,支持8种语言翻译

M380鼠标有多国语音输入、语音翻译、中英自由说和离在线语音四大性能。

1、多国语音输入。据张亮介绍,M380鼠标通过搭载百度语音输入技术,其文字识别准确率可以达到98.6%,而且还能实现不同语种和方言的识别和输入,如英语、法语、日语、汉语,以及合肥话、西安话、粤语等。

2、语音翻译。M380鼠标搭载了此次发布会首发的百度语音输入,支持8种语言的翻译。机器翻译是百度大脑上最具优势的技术之一,百度翻译的机器翻译功能已经支持203种语言互译。

3、中英自由说。中英自由说是一种新的模式,支持自动实现中英文混合语音输入而无需用户切换。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲百度总监蔡玉婷介绍“中英自由说”功能

4、离在线语音。这款鼠标还具有离在线融合模式。张亮介绍时提到,这是百度软件的独有技术,使这款鼠标能自动判断当前网络环境,在网络信号好的场景下可以提供更佳的识别和翻译功能,网络不稳定时也能保证听写功能正常运行。

在外观设计方面,M380鼠标有黑色和白色两种款式,外观符合人体工学,适合长时间抓握,同时使用罗技独家技术Unifying无线连接,在10米范围内连接稳定。此外,这款鼠标内置一节AA电池,续航时间长达18个月。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲罗技大中华区PW&PC品类营销总监张亮介绍M380鼠标

M380鼠标的用户群体主要有重度内容创作者、追求效率的年轻专业人士,以及泛行业各领域的从业者等。

蔡玉婷提到,百度的AI语音技术将通过罗技的鼠标产品应用到智能办公场景,比如文档撰写、外语识别、个人笔记,以及中文转译等。未来还将搭载罗技的其他硬件设备,如会议设备和游戏设备等,拓展更多场景,为消费者带来更极致的体验。

“百度的AI能为人们的生活带来便利,用科技让这个复杂的世界更简单。”她说。

二、百度大脑加持,未来还将拓展至会议、游戏

在蔡玉婷看来,百度不仅是强大的搜索引擎,还是一家拥有强大互联网技术的AI公司,希望借助AI探索产业智能化的升级。百度大脑是百度AI能力的集大成者,截至去年已经升级到6.0版本,成为了大型的软硬一体AI生产平台。

百度大脑的AI能力正在不断输出到社会各界,赋能各个行业。而罗技是电脑外设领域的领导者,希望通过AI赋能实现全产品线的智能化升级。而且双方都想要让人们的工作和生活更加便捷,这一共同目标促成了这次合作。

百度集团副总裁吴甜认为,随着技术发展,人们的工作和生活日新月异,市场需求也在不断变化。而百度很早就开始利用AI技术提升产品体验,并将成果沉淀在百度大脑系统中。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲百度集团副总裁吴甜致辞

百度大脑的基础层建设了数据、算力和AI框架,感知层能力上建设了语音技术、视觉技术和AR/VR等,认知层面上有自然语言处理等AI技术。语音技术和百度翻译是百度大脑的两个经典的AI技术。

语音技术方面,早在2012年,百度首次将深度学习技术应用到语音识别中,语音搜索功能免去了用户打字的烦恼,对儿童和老人等群体十分友好。近几年百度在这方面也有了新的进展,比如将流式截断的多层注意力建模(SMLTA)模型上线百度语音输入法,将基于麦克风阵列的拼音增强以及声学建模一体化的端到端识别技术应用到小度音箱等,提升了交互体验。

罗技推出能做翻译的鼠标!每分钟听写400字,百度AI语音加持

▲罗技大中华区PW&PC品类营销总监张亮介绍百度语音输入

目前,百度语音服务的日调用量已达到155亿次,移动端方面有百度搜索、百度输入法等应用,应用场景方面有智能家居、智能车载系统等,还推出了语音AI芯片百度鸿鹄,可以应用于智能音箱、车载系统等。

而百度翻译是另一项主要的AI技术,曾获国家科技进步二等奖。2015年,百度首次将基于深度学习的机器翻译网络上线网络产品,目前百度的机器翻译系统已经能支持203种语种的翻译,每天的翻译量可达1000亿字,服务于5亿用户,为跨语种交流带来便利。

结语:软硬件协同发展,语音输入还将升级

此次百度与罗技的合作是一次软硬一体、AI赋能的实践,未来,语音输入还会有更大的发展空间和更丰富的应用场景。

正如百度语音首席架构师贾磊介绍的,通过大数据训练和更大的模型,语音输入技术会适合更复杂的场景;伴随着与硬件设备的协同发展,语音输入可以听得更远、更清;语音输入系统还会更加情感化、个人化,如使用亲人声音的语音导航等,这些都可能成为未来语音技术的发展方向。