绑定手机号
获取验证码
确认绑定
订阅成功
扫码关注智东西Plus
接受订阅信息更新提醒
Alexa研究人员推双麦克语音识别系统

4月2日消息,据外媒报道,Alexa的研究人员开发了一种比7麦克风阵列更好的双麦克风阵列语音识别系统。研究人员称,他们已经开发出一种新型声学建模框架,在实验中,该模型比7麦克风系统语音识别错误率降低了9.5%。他们在两篇论文(“Frequency Domain Multi-Channel Acoustic Modeling for Distant Speech Recognition,” “Multi-Geometry Spatial Acoustic Modeling for Distant Speech Recognition”)中描述了该技术,论文将于下月的声学语音和信号处理国际会议上发表。

订阅
订阅语音识别最新消息
相关快讯
  • 05月14日 18:53
    小鹏汽车提出判别性多模态语音识别

    5月14日消息,小鹏汽车在论文《判别性多模态语音识别, Discriminative Multi-modality SR》提出了一个两阶段语音识别模型。在第一阶段,通过唇动的视觉信息将目标语音从背景噪声中分离出来,使模型能够清晰地理解。第二阶段,音频模态再次结合视觉模态,通过MSR子网络更好地理解语音,进一步提高识别率。据介绍,通过在LRS3-TED和LRW数据集上进行了大量的实验。该两阶段模型 (音频增强多模态语音识别,AE-MSR) 以显著的优势达到了最先进的性能,证明了AE-MSR的必要性和有效性。

    来源:机器之心
  • 04月30日 19:32
    腾讯云发布专属语音识别模型

    4月29日,腾讯云正式发布金融、音视频等多个领域专属语音识别模型,新增对粤语、韩语的支持,并将陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的支持。

    来源:36氪
  • 02月05日 10:16
    苹果公司在语音识别领域发表系列论文

    2月4日消息,据外媒报道,在过去的一周时间里,苹果公司在语音识别领域发表了一系列研究论文,主要研究改善语音触发检测、说话人验证以及对多个说话人进行语言识别的技术。在《用于说话人验证和语音触发检测的多任务学习(MULTI-TASK LEARNING FOR SPEAKER VERIFICATION AND VOICE TRIGGER DETECTION)》论文中,苹果研究人员提出了一种经过训练后可同时执行自动语音识别、说话人识别任务的AI模型。在《提高多语言使用者的语言识别能力(IMPROVING LANGUAGE IDENTIFICATION FOR MULTILINGUAL SPEAKERS)》论文中,苹果研究人员探索了一种针对多语言使用者量身定制的说话人语言识别系统。

    来源:智东西
  • 01月14日 21:29
    Facebook开源低延迟在线语音识别框架

    1月14日消息,Facebook目前已开源wav2letter@anywhere,这是一种基于深度学习的推理框架,可在云或嵌入式边缘环境中实现在线自动语音识别的快速性能。该框架基于基于神经网络的语言模型wav2letter和wav2letter ++,在2018年12月发布时,FAIR称之为可用的最快的开源语音识别系统。

    来源:机器之心
  • 19年12月26日 19:37
    探境科技发布用于语音识别降噪的HONN

    12月26日消息,今天,AI芯片创企探境科技发布用于语音识别降噪的高计算强度神经网络(HONN),并提出了增强识别一体化的端到端识别流程。HONN在远场和高噪声等环境下的识别率明显优于DNN。现场,探境宣布升级语音解决方案,实现在线离线一体化,并展示了探境语音产品全矩阵及端云一体的全栈式平台化发展战略。据介绍,到目前为止,探境语音识别方案已实现百万级产品出货,今年营收已经破千万元。

    来源:智东西
  • 19年12月24日 16:12
    今日头条灵犬升级 新增语音识别功能

    12月24日消息,今日头条灵犬反低俗助手进行了升级,新版“灵犬”增加语音识别功能,支持用户以语音输入方式对内容进行反低俗检测,具备反色情低俗、反暴力谩骂、反标题党等能力。据官方介绍,“灵犬”本次所上线的语音识别功能主要涵盖语音类型识别和语音内容识别两大核心能力,在用户输入语音后,“灵犬”将通过分析音频类型,判断该音频是否包含实质内容。

    来源:36氪
  • 19年12月04日 18:36
    以色列创企研发抗噪汽车语音识别系统

    12月4日消息,据外媒报道,以色列初创公司Hi Auto针对车内噪音推出了隔离扬声器和增强语音的方法,结合了一个麦克风和一个摄像头,能够跟踪说话人的嘴唇,消除所有的噪音,让汽车语音识别功能在任何噪音条件下都能够可靠地工作。并且,该公司在种子轮融资中成功筹集了450万美元(约合3149.33万元人民币)。

    来源:盖世汽车
  • 19年11月28日 15:44
    百度推新语音识别模型 准确率提30%

    11月28日消息,在百度大脑开放日上,百度语音首席架构师贾磊推出了一款新的语音识别模型——全名叫“基于复数CNN网络的语音增强和声学建模一体化的端到端语音识别模型”,它与业内几乎所有语音识别方案都不一样,打破了传统远场语音识别技术的流程,能够将语音识别准确率提高30%以上。

    来源:智东西
  • 19年10月23日 17:40
    小米:将升级语音识别开源工具Kaldi

    10月23日消息,小米AIoT战略委员会副主席叶航军表示,语音识别和AI专家Daniel Povey加入小米后,会新一歩升级语音识别开源工具Kaldi,同时提升开源社区的语音水平。他的工作除了会提升小爱音箱的能力外,也包括小米整体业务线中其他产品语音控制的能力。

    来源:36氪
  • 19年10月17日 18:14
    语音识别专家Daniel Povey将入职小米

    10月17日消息,据AI科技大本营报道,语音识别界专家Daniel Povey发布推特,宣布自己2019年末将要入职小米,目前正在签订合同阶段,入职后,他将带领一支团队研发下一代PyTorch-y Kaldi。小米公司内部知情人士确认了该消息,表示还在走最后流程,具体职位信息不便透露,但很快就会对外公布官方消息。

    据悉,Daniel Povey教授此前因为与霍普金斯校内的抗议学生发生冲突,因而被霍普金斯校方解雇。被解雇后,Daniel很快收到了 Facebook的offer,但因不满公司对其个人进行的独立调查,随后表示将来中国公司任职。

加载更多 ···