首页 | 本学科首页   官方微博 | 高级检索  
     检索      

融合领域知识图谱的跨境民族文本分类方法
引用本文:陈春吉,毛存礼,雷雄丽,满志博,陆杉,张勇丙.融合领域知识图谱的跨境民族文本分类方法[J].山西大学学报(自然科学版),2022(4):884-893.
作者姓名:陈春吉  毛存礼  雷雄丽  满志博  陆杉  张勇丙
作者单位:1. 昆明理工大学信息工程与自动化学院;2. 昆明理工大学云南省人工智能重点实验室;3. 昆明冶金高等专科学校建筑与艺术学院
摘    要:跨境民族文本分类任务是跨境民族文化分析中的基础性工作,其目的是将跨境民族文化文本进行归类处理。针对跨境民族文化数据分类面临类别交叉的问题,提出融合领域知识图谱的跨境民族文本分类方法,利用跨境民族文化知识图谱对文本中的跨境民族实体进行语义扩展,通过实体在知识图谱中的类别特征来增强文本的类别语义特征。此外,通过掩码自注意力机制分别对文本的词级、句子级进行特征提取以此得到文本中句子的局部特征和全局特征。实验表明,本文方法在跨境民族文化数据集中相比基线模型的F1值提升了11.9%。

关 键 词:跨境民族文化  文本分类  领域知识图谱  实体语义扩展
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号