首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于预训练模型和图神经网络的藏文文本分类研究
引用本文:胥桂仙,刘兰寅,张廷,董玉双.基于预训练模型和图神经网络的藏文文本分类研究[J].东北师大学报(自然科学版),2023(1):52-64.
作者姓名:胥桂仙  刘兰寅  张廷  董玉双
作者单位:中央民族大学信息工程学院
基金项目:国家社会科学基金资助项目(19BGL241);;国家自然科学基金资助项目(62236011);
摘    要:在少数民族语言信息处理领域,由于文本分类标注数据的稀缺,相关研究工作进展缓慢.为了充分利用有限的标注数据,更有效地挖掘出文本之间的关系,本文对藏文提出一种基于预训练模型和图卷积神经网络的长文本分类方法CINO-GCN.首先利用在实验数据集上经过微调的少数民族多语言预训练模型(Chinese Minority Pretrained Language Model, CINO)得到藏文长文本的初始文档向量和藏文音节向量.然后根据整个数据集范围的音节共现关系与音节和文档间的TF-IDF值来对藏文文本图进行建模.最后将文本图和结点特征一同输入至图卷积神经网络(graph convolutional networks, GCN)层,得到的文档表示经过Softmax得到分类结果.将该方法在公开的TNCC藏文新闻文本分类数据集上与当前几种主流的深度学习模型进行了多组对比实验,分类准确率达到73.51%,远优于其他基线模型;同时设计了消融实验验证模型各部分对分类结果的增益.实验结果表明,该文提出的模型能够结合预训练词向量和图神经网络的优势,显著提高藏文文本分类的准确率.

关 键 词:藏文文本分类  图卷积神经网络  预训练语言模型  低资源文本分类
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号