腾讯AI Lab高级研究员李丕绩:格式控制下的文本生成框架SongNet

文本生成任务是自然语言处理中一个重要的研究领域,具有广阔的应用前景。国内外已经有诸如Automated Insights、Narrative Science以及“小南”机器人和“小明”机器人等文本生成系统投入使用。这些系统根据自然语言文本生成新闻、财报或者其他解释性文本。但是这些系统都有一个共同的特征,那就是无法满足特殊文本格式的要求。

目前的文本生成任务大多属于开放式的生成风格,将生成的数据简单的罗列在一起,却没有对生成数据的格式进行控制。这种情况使得一些诸如歌词、诗词等特殊文本的生成格式无法满足要求。虽然也有一些模型能生成一定格式的文本,但这些模型只是将格式视为一种潜在信息,让模型在训练过程中隐式地捕捉这一特征。简单来说就是五字四行语料库上训练的模型不能生成七字诗,并且这些模型也不能根据任意新定义的格式生成令人满意的文本。基于特殊文本范式的特征,需要解决三个问题:1)怎样使生成的文本符合我们需求的格式;2)如何生成符合押韵方案的内容;3)怎样保证句子的完整性。

SongNet,是一种可以解决特殊文本范式格式控制问题的基于自回归语言模型的文本生成框架。9月3日晚8点,智东西公开课联合腾讯AI Lab推出「腾讯AI Lab专场」,第1讲的讲师、腾讯AI Lab高级研究员李丕绩博士将围绕《SongNet:格式控制下的文本生成框架》这一主题进行直播讲解。李博士将从文本生成任务的研究与挑战出发,详解基于自回归语言模型的格式控制文本生成框架SongNet,并深入解析其在诗词生成、诗歌创作方面的应用。

李丕绩是香港中文大学的博士,2018年8月加入腾讯AI Lab任高级研究员,从事对话系统和文本生成相关的科研和落地相关工作,主要研究方向为自然语言处理领域的文本摘要、文本生成和对话系统。李博在相关领域顶级会议和期刊发表多篇论文,并担任EMNLP 2020 summarization方向的Area Chair,多次担任ACL、EMNLP、NAACL、NeurIPS、SIGIR、TACL等会议和期刊的PC Member和审稿人。

课程内容

课程主题

《SongNet:格式控制下的文本生成框架》

课程提纲

1、文本生成技术的研究与挑战
2、SongNet:基于自回归语言模型的格式控制文本生成框架
3、诗词生成、歌词创作应用案例解析

讲师介绍

李丕绩,博士,毕业于香港中文大学,2018年8月加入腾讯AI Lab任高级研究员,从事对话系统和文本生成相关的科研和落地相关工作;研究领域为自然语言处理,具体包括文本摘要、文本生成和对话系统;已在相关领域顶级会议和期刊发表多篇论文;担任EMNLP 2020 summarization方向的Area Chair,多次担任ACL、EMNLP、NAACL、NeurIPS、SIGIR、TACL等会议和期刊的PC Member和审稿人。

直播信息

直播时间:9月3日20:00
直播地点:智东西公开课小程序
答疑地址:智东西公开课交流群

加入智东西公开课交流群

本次课程的讲解分为主讲和答疑两部分,主讲以视频直播形式,答疑将在智东西公开课交流群进行。
加入讨论群,除了可以免费收看直播之外,还能认识讲师,与更多同行和同学一起学习,并进行深度讨论。
添加小助手小语(ID:hilele20)即可申请,备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~

直播间链接
https://appoSCMf8kb5033.h5.xeknow.com/st/3CR8280Mm