首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于GAN的中文虚假评论数据集生成方法
引用本文:吴正清,曹晖.基于GAN的中文虚假评论数据集生成方法[J].云南大学学报(自然科学版),2023(5):1033-1042.
作者姓名:吴正清  曹晖
作者单位:西北民族大学中国民族语言文字信息技术教育部重点实验室
基金项目:国家自然科学基金(61633013);;中央高校基本科研业务费专项(31920230054);
摘    要:针对互联网虚假评论大肆横行,在虚假评论研究领域却没有完全公开的中文数据集可供中文虚假评论检测研究的问题,提出了一种基于生成对抗网络的中文虚假评论数据生成模型.首先,对生成器生成的文字序列通过蒙特卡洛搜索获取一批样本;然后,采用强化学习方法将判别器、分类器和重构器的反馈化为奖励分数;最后,传回生成器,对生成器进行参数优化,以生成贴近真实世界的具有相应类标签属性及特征的虚假评论数据.以BLEU值为评估指标,实验结果表明,所提出的模型在本文数据集上取得了更好的BLEU值,具有较好的生成效果.

关 键 词:虚假评论  生成对抗网络  文本生成  强化学习
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号