首页 | 本学科首页   官方微博 | 高级检索  
     

机器学习下的新冠疫情新闻文本分类
作者姓名:李海艳  王文东  江丛君
作者单位:延安大学数学与计算机科学学院
摘    要:针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验结果进行对比分析。实验结果表明:同等条件下,基于新冠疫情主题新闻数据集,SVM+TF-IDF模型在几种分类器中效果最好,精确度达到84%,F1值达到83%。

关 键 词:新闻文本分类  机器学习  TF-IDF  支持向量机
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号