基于对话的中文正面情感风格迁移 |
| |
作者姓名: | 胡玉婷 左家莉 刘江盛 万剑怡 王明文 |
| |
作者单位: | 江西师范大学计算机信息工程学院 |
| |
基金项目: | 国家自然科学基金项目(61866018,62266021); |
| |
摘 要: | 文本风格迁移旨在保留文本内容的前提下,通过编辑或生成的方法使得目标文本带有某些特殊属性,如礼貌、情感、性别等。现有的情感风格迁移研究主要集中在英文数据集上,在中文数据集上的研究相对较少。该文构建了一个基于对话的中文情感文本数据集,该数据集的部分原始数据源自电视连续剧《家有儿女》中的对白,并对其进行人工标注和循环模型标注。目前该数据集的负面情感文本和正面情感文本句子共30 836个。根据该数据集中大多数情感词是显性的特点,在编辑类的模型上开展了基于对话的中文正面情感风格迁移的研究。实验结果表明:在该数据集上,编辑类的模型可以较好地识别文本的情感属性,并实现文本正面情感风格迁移。
|
关 键 词: | 自然语言处理 文本生成 情感风格迁移 循环模型 编辑模型 家庭对话 |
|
|