融合领域知识图谱的跨境民族文本分类方法 |
| |
引用本文: | 陈春吉,毛存礼,雷雄丽,满志博,陆杉,张勇丙.融合领域知识图谱的跨境民族文本分类方法[J].山西大学学报(自然科学版),2022(4):884-893. |
| |
作者姓名: | 陈春吉 毛存礼 雷雄丽 满志博 陆杉 张勇丙 |
| |
作者单位: | 1. 昆明理工大学信息工程与自动化学院;2. 昆明理工大学云南省人工智能重点实验室;3. 昆明冶金高等专科学校建筑与艺术学院 |
| |
摘 要: | 跨境民族文本分类任务是跨境民族文化分析中的基础性工作,其目的是将跨境民族文化文本进行归类处理。针对跨境民族文化数据分类面临类别交叉的问题,提出融合领域知识图谱的跨境民族文本分类方法,利用跨境民族文化知识图谱对文本中的跨境民族实体进行语义扩展,通过实体在知识图谱中的类别特征来增强文本的类别语义特征。此外,通过掩码自注意力机制分别对文本的词级、句子级进行特征提取以此得到文本中句子的局部特征和全局特征。实验表明,本文方法在跨境民族文化数据集中相比基线模型的F1值提升了11.9%。
|
关 键 词: | 跨境民族文化 文本分类 领域知识图谱 实体语义扩展 |
|
|