首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于BERT-BiGRU-ATT的社交媒体用户身份识别研究
作者单位:中国人民公安大学信息网络安全学院,北京100038
基金项目:中国人民公安大学研究生科研项目
摘    要:随着互联网井喷式发展,社交媒体发展迅猛,但是伴随网络匿名特性出现的失范现象时有发生,如何准确判定社交媒体用户从属问题亟待解决。目前社交媒体信息载体多以短文本为主,语法语义过于灵活,难以准确获得文本特征向量。传统短文本作者识别多采用人工建模的方式对文本特征加以提取,设计纷繁复杂。结合深度学习的方法,提出BERT-BiGRU-ATT短文本作者身份识别模型。该模型对中文短文本使用BERT中文预训练模型生成字符向量,利用双向门控循环单元(Bi GRU)结合注意力机制高效捕获序列上下文特征,最终通过A-softmax分类器实现文本作者的识别。在制作的中文微博短文本数据集上的实验结果表明,BERT-BiGRU-ATT模型与其他模型相比,在中文短文本作者识别的准确率上取得较好的成绩,其F1值达到93.6%的精度。

关 键 词:BERT预训练模型  双向门控循环单元  作者识别  注意力机制  短文本
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号