基于全局语义学习的文本情感增强方法研究 |
| |
作者姓名: | 王庆林 李晗 庞良健 徐新胜 |
| |
作者单位: | 中国计量大学质量与安全工程学院,杭州310018;中国计量大学质量与安全工程学院,杭州310018;中国计量大学质量与安全工程学院,杭州310018;中国计量大学质量与安全工程学院,杭州310018 |
| |
基金项目: | 国家社会科学基金重大项目、浙江省重点研发计划主动设计项目、浙江省科技公益技术研究计划项目 |
| |
摘 要: | 为解决弱情感倾向语料影响文本情感分类的问题,提出基于全局语义学习的文本情感增强方法。首先设计语料划分方法,将语料划分为强情感倾向语料与弱情感倾向语料,然后,从文本处理全过程及整体语义学习的角度出发,构造均值抽取与最大值抽取的语义提取方式及文档信息向量,改进基于循环神经网络的变分自编码器的语义学习过程,并用于学习强情感倾向语料中文本的词语序列特征与语义特征。基于此,对弱情感倾向语料进行重构,实现情感增强目标,最后,将经过情感增强的语料替换掉原来的弱情感倾向语料,再进行情感分类模型的训练与测试。结果表明:提出的文本情感增强方法能够提升情感分类效果,并使得Bert分类器对IMDb影评数据集的情感分类精确率达到了93.03%。
|
关 键 词: | 全局语义学习 文本情感增强 变分自编码器 情感分类 |
收稿时间: | 2020-01-22 |
修稿时间: | 2020-05-30 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|