爱数智慧首席数据科学家贾艳明:从数据角度看AI模型训练的挑战 | 直播预告

数据,人工智能的三大要素之一,是AI最基础的要求,同时也是AI模型效果的决定性因素。

数据问题,是所有企业都需要考虑的问题。尤其是对于中小型企业来说,大量数据的获取、样本筛选和特征标注,是一件非常消耗资源的事情。尤其是语音数据,语音是一个连续的音频流,它是由大部分的稳定态和部分动态改变的状态混合构成,其采集的难度要远远大于图像等数据的采集。

数据的质量决定AI模型的质量,高质量语音模型取决于高质量的语音数据。那么如何获取高质量的语音数据呢?语音数据的标注生成又有哪些难点,有什么样的解决方案呢?

为了让大家更好理解语音数据的标注难点与标注方法,6月12日晚7点,智东西公开课策划推出AI数据服务公开课爱数智慧专场。

爱数智慧是一家专业的AI数据标注服务商,提供语音数据,文本数据,图像数据标注和采集服务,自主研发了语音合成,语音识别,发音词典等领域的成品数据集。去年10月,语音识别开源工具Kaldi的主要开发者和服务者Daniel Povey成为公司首席科学家顾问。

本次专场将由爱数智慧首席数据科学家贾艳明直播讲解。贾老师将为大家分析AI数据所面临的挑战,并对基于人机协同的语音数据筛选与标注进行系统的讲解。同时,本次课程内含免费在线教育数据集,欢迎大家关注、获取。

专场内容

主题:从数据角度看AI模型训练的挑战

提纲:

1、数据决定AI模型的上限
2、高质量数据的需求定义
3、语音数据的难点解析
4、基于人机协同的语音数据筛选与标注
5、最新开源的语音数据集解读

讲师介绍

贾艳明,爱数智慧首席数据科学家,清华大学计算机系博士、博士后,前朗播首席科学家(CSO),发表人工智能相关论文十余篇,申请专利十余篇,参与国家十一五“核高基”重大专项项目;先后在学校、外企和央企任职,在计算机算法的理论研究和工程应用上均具有丰富的经验,尤其在AI和大数据落地在线教育领域有多年实战经验。

直播信息

时间:6月12日19点
地点:智东西公开课小程序

加入主讲群

本次专场我们将设置主讲群,并会邀请讲师入群。加入主讲群,你除了可以免费收听直播之外,还能直接和讲师认识及交流。当然,你还可以结识更多的技术大牛。

想要加入主讲群的朋友可以添加小助手甜甜(ID:hitian20)申请,备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~。