强化文本关联语义和多特征提取的重复缺陷报告检测模型 |
| |
作者姓名: | 周文杰 谢琪 崔梦天 |
| |
作者单位: | 西南民族大学 计算机系统国家民委重点实验室,成都 610041 |
| |
基金项目: | 国家自然科学基金资助项目(61502401,12050410248);四川省科技计划项目(2021YFH0120);西南民族大学中央高校基本科研业务费专项资金(2020YYXS59)。 |
| |
摘 要: | 针对重复缺陷报告检测研究中存在语义长距离依赖以及缺陷报告特征的单一性问题,提出一种强化文本关联语义和多特征提取的重复缺陷报告检测模型。引入自注意力机制捕获缺陷报告文本序列内部的语义关联性,从而动态计算上下文语义向量进行语义分析,解决长距离依赖问题;利用隐含狄利克雷分布算法捕获缺陷报告文本的主题特征,同时针对缺陷报告的类别信息,构建一种特征提取网络计算类别差异特征;最后基于3类特征向量进行综合检测。实验结果表明,该模型实现了更优的检测性能。
|
关 键 词: | 重复缺陷报告检测 长距离依赖 自注意力机制 语义分析 多特征提取 |
收稿时间: | 2021-05-31 |
|
| 点击此处可从《重庆大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《重庆大学学报(自然科学版)》下载全文 |