首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 125 毫秒
1.
通过微博情感分析掌握网络舆情动态是网络数据挖掘的研究热点,特征选择是基于内容的微博舆情分类的重要环节。为有效提取微博数据的特征,分析CHI特征选择算法应用在微博舆情分类中的特点及不足,给出一种改进的特征评估函数,并进一步用基于蚁群聚类的方法消除微博特征间的冗余。实验结果表明,改进的算法能够有效提高微博舆情分类的效能。  相似文献   

2.
随着微博、抖音、贴吧等新兴网络社交媒体的发展,大量用户开始喜欢使用这些平台进行发布和获取信息,因此累积了大量舆情数据。为了能够及时监测网络舆论动向,更好的维护互联网的安全运营和网络安全,针对实时微博数据,研究设计了一种基于SnowNLP的微博网络舆情分析系统。该系统由舆情数据采集、舆情数据分析和舆情数据可视化组成,能够实现微博数据文本挖掘、网络舆情数据情感分析、舆情数据与关键词匹配结果统计等功能,并能够对微博内容情感分析结果、用户等级、内容分词结果等进行可视化展示。实验测试结果表明:本系统功能运行正常,同时验证了设计方案的可行性和有效性。系统在网络舆情监测领域具有重要的应用价值。  相似文献   

3.
王阳 《创新科技》2016,(12):32-35
互联网的飞跃发展,既孕育着机遇,同时也带来了前所未有的挑战。网络舆情的特点使其成为一把双刃剑。为此,本文通过对微博文本的获取与处理,得到关于该微博热门话题的基于时间序列的离散数据序列,然后采用万有引力算法优化的RBF神经网络对微博舆情进行预测。通过微博舆情的时间序列进行实证研究,在预测性能上与现有的预测模型进行对比,证明该模型在该预测领域的可行性和有效性。  相似文献   

4.
在互联网和社交媒体迅猛发展的背景下,网络中出现了大量的短文本数据,这些数据在舆情监控、情感分析和新闻分类等自然语言处理领域展现出了非常高的经济和学术价值.但短文本数据固有的特征给短文本分类带来了不小的挑战,如文本稀疏和缺乏丰富的上下文语义等.针对这些问题,提出了一种结合多元语义特征和图卷积神经网络(GCN)的短文本分类模型,该模型通过哈尔滨工业大学的语言技术平台获取短文本的多种语义特征,并将这些语义特征同短文本一起构建一个多元异构图,然后将其作为GCN的输入,利用GCN学习短文本更深层特征,最后通过Softmax函数获取每个类别的概率分布,进而实现短文本分类.试验结果表明,本模型在短文本分类的F1评分上比传统单一模型提高了4%.  相似文献   

5.
当灾害发生时,人们经常使用微博、微信等社交媒体发布文本内容,描述伤亡人员、被困人员、车辆受损及基础设施损坏等情况。如果及时有效地处理这些在线信息,构建相应的机器学习模型,对应急响应组织进行态势感知、舆情应对或者救援活动极为有用。然而,目前对于社交媒体信息的有效处理仍存在众多挑战,比如准确分类这些简短和非正式的文本数据。从根本上讲,这些任务均涉及到数据样本问题,特别是国内目前还缺乏人工标注的中文灾害数据。为此,论文收集了2018年发生的与3起自然灾害相关的微博文本数据,并按照多层级分类方法进行了人工标注。该数据集将有助于业界解决自然语言处理时缺少灾害数据样本的现状,为进一步完善灾害危机应对和舆情管理等提供支持。  相似文献   

6.
对微博情感分类,及时掌握微博上发布信息状态是网络舆情监控的重要研究内容。为能有效提取微博样本的特征,结合微博书写时口语化、时代化、含表情等特点,提出基于改进N-Gram的微博的多特征项提取算法,并给出基于聚类的KNN分类模型。实验结果表明,本文提出的算法能够有效提高微博舆情分类性能。  相似文献   

7.
目的 随着公众舆论数据的快速增长,社交网络文本情感识别在网络舆情监控中发挥着越来越重要的作用。由于文本数据的稀疏性、高维性和自然语言的复杂语义,情感分析任务面临巨大的挑战。方法 为提高网络舆情情感识别的效果,设计一种融合双向门控循环单元(BiGRU)和卷积神经网络(CNN)的情感识别模型。首先将社交网络文本转换成特征向量,然后通过BiGRU提取文本的上下文情感特征,最后通过CNN提取文本的局部情感特征,构建中文社交网络文本情感识别模型。结果 以新冠疫情期间网民的微博评论为数据集验证模型的可行性和优越性,模型的精确率、召回率和F1值分别达到86.6%、87.06%和86.85%。结论 实验结果表明,融合BiGRU-CNN的特征向量包含更加丰富文本的情感信息,能够有效提升网络舆情情感识别的性能。  相似文献   

8.
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度.  相似文献   

9.
随着在线视频平台的快速发展,弹幕逐渐成为人们表达观点的一个重要途径,尤其受到年轻人的欢迎.与常规的文本不同,弹幕文本普遍较短,表达随意,网络词汇较多,一些常规的停用词被用于表达情感.提出了一种基于弹幕数据的舆情分析模型,针对弹幕数据生成和存储特点,提出了热点检测循环自适应弹幕数据获取算法;扩充了情感词典来区分弹幕中情感倾向数据和中性数据,以解决弹幕中出现的网络词汇较多的问题;基于卷积神经网络(Convolutional Neural Network, CNN)建立了情感褒贬分类模型,用来区分情感倾向弹幕的正负情感倾向,在此基础上得到了舆情分析的结果.实验表明,本文的舆情分析模型能有效地表达新闻类弹幕数据的舆情分析结果.  相似文献   

10.
微博短文本蕴含着较为丰富的情感信息,基于微博数据的情感分析已成为网络舆情监测的重要任务。为提高中文微博情感分类效果,提出一种基于粒子群优化(PSO)的长短期记忆(LSTM)模型(PSO-LSTM),该模型在LSTM模型的基础上进行了参数优化,能够更有效获取微博信息。实验以新冠肺炎疫情期间的微博数据集构建PSO-LSTM模型,与其它模型进行了比对实验。实验结果表明,PSO-LSTM模型能够有效提升中文微博情感分类的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号