基于语义相似度改进的少样本终身主题模型 |
| |
引用本文: | 曾琪,买日旦·吾守尔,古兰拜尔·吐尔洪,雷恒林,王松.基于语义相似度改进的少样本终身主题模型[J].东北师大学报(自然科学版),2022(4):71-76. |
| |
作者姓名: | 曾琪 买日旦·吾守尔 古兰拜尔·吐尔洪 雷恒林 王松 |
| |
作者单位: | 新疆大学信息科学与工程学院 |
| |
基金项目: | 新疆维吾尔自治区自然科学基金资助项目(2021D01C118,2018D01C075);;新疆维吾尔自治区高校科研计划项目(XJEDU2017S006,XJEDU2017S005); |
| |
摘 要: | 对于终身主题模型而言,先验知识的正确性对后续的建模任务起到了至关重要的作用.因此,提出了一种基于语义相似度改进的少样本终身主题模型SS-AMC(Semantic Similarity-AMC),利用BERT获取共现词对的词向量,计算其语义相似度,通过设置相似度阈值进而优化知识库中的先验知识,以提升少样本终身主题模型的性能.在中英文数据集上的实验结果表明,SS-AMC模型的主题一致性较基线模型有了明显的提升.
|
关 键 词: | 主题模型 终身学习 少量数据 词向量 语义相似度 |
|
|