爱数智慧首席数据科学家贾艳明：从数据角度看AI模型训练的挑战

数据，人工智能的三大要素之一，是AI最基础的要求，同时也是AI模型效果的决定性因素。

数据问题，是所有企业都需要考虑的问题。尤其是对于中小型企业来说，大量数据的获取、样本筛选和特征标注，是一件非常消耗资源的事情。尤其是语音数据，语音是一个连续的音频流，它是由大部分的稳定态和部分动态改变的状态混合构成，其采集的难度要远远大于图像等数据的采集。

数据的质量决定AI模型的质量，高质量语音模型取决于高质量的语音数据。那么如何获取高质量的语音数据呢？语音数据的标注生成又有哪些难点，有什么样的解决方案呢？

为了让大家更好理解语音数据的标注难点与标注方法，6月12日晚7点，智东西公开课策划推出AI数据服务公开课爱数智慧专场。

爱数智慧是一家专业的AI数据标注服务商，提供语音数据，文本数据，图像数据标注和采集服务，自主研发了语音合成，语音识别，发音词典等领域的成品数据集。去年10月，语音识别开源工具Kaldi的主要开发者和服务者Daniel Povey成为公司首席科学家顾问。

本次专场将由爱数智慧首席数据科学家贾艳明直播讲解。贾老师将为大家分析AI数据所面临的挑战，并对基于人机协同的语音数据筛选与标注进行系统的讲解。同时，本次课程内含免费在线教育数据集，欢迎大家关注、获取。

专场内容

主题：从数据角度看AI模型训练的挑战

提纲：

1、数据决定AI模型的上限
2、高质量数据的需求定义
3、语音数据的难点解析
4、基于人机协同的语音数据筛选与标注
5、最新开源的语音数据集解读

讲师介绍

贾艳明，爱数智慧首席数据科学家，清华大学计算机系博士、博士后，前朗播首席科学家（CSO），发表人工智能相关论文十余篇，申请专利十余篇，参与国家十一五“核高基”重大专项项目；先后在学校、外企和央企任职，在计算机算法的理论研究和工程应用上均具有丰富的经验，尤其在AI和大数据落地在线教育领域有多年实战经验。

直播信息

时间：6月12日19点
地点：智东西公开课小程序

加入主讲群

本次专场我们将设置主讲群，并会邀请讲师入群。加入主讲群，你除了可以免费收听直播之外，还能直接和讲师认识及交流。当然，你还可以结识更多的技术大牛。

想要加入主讲群的朋友可以添加小助手甜甜（ID：hitian20）申请，备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~。

相关推荐