首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
在社交媒体平台已成为大众信息交流的重要载体的背景下,关注和分析大众对于社会热点事件的情感倾向及舆论走势,有利于及时准确了解大众的情感需求,制定相应的措施,引导舆论走向,维护良好的网络环境。提出了基于情感分析和热度预测的网络舆情预测思路,构建了融合多特征的文本情感分析模型和基于时间序列的热度预测模型,并基于真实数据集验证了模型的有效性。对于社交媒体上舆论环境的分析和预测有重要意义。  相似文献   

2.
3.
已有的网络评论情感分类算法都需要手工标注词汇情感倾向,然而网络评论具有表达形式自由、模式多变、词汇更新速度快等特点,手工标注的方式适应能力较低。为解决上述问题,结合限制玻尔兹曼机和相似差异向量运算,通过降低向量相似度,强调其差异性的方式,提出基于限制玻尔兹曼机的无词汇标注情感分类算法。实验表明,该算法虽褒义精确度稍低于支持向量机,但是在贬义精确度上优于支持向量机,并且不需要进行词汇情感倾向标注,降低了算法的复杂度,提高了泛化能力。  相似文献   

4.
随着大数据技术的日趋成熟,利用大数据技术实现对海量的网络舆情数据进行采集、分析和展示,对网络舆情信息感知度得到了很大的提升,可以准确地了解网络舆情的发展态势,把握群众的情绪,对舆情事件做出高效、正确的决策。利用分布式爬虫技术来抓取数据,文本分析技术进行数据预处理和数据清洗,对数据仓库的舆情信息进行处理、分析,实现了舆情的监测、舆情的分析和舆情报告。通过大数据技术挖掘网络舆情事件,能够快速准确地感知舆情信息,可以有效提升网络舆情的管控和预防能力。  相似文献   

5.
基于粗糙集和集成学习的BBS网络舆情分类   总被引:1,自引:1,他引:0  
BBS是网络舆情突发事件产生和传播最重要的场所之一,如何提前发现突发网络舆情是目前网络舆情研究的一个难点和热点问题,目前的研究仍处于探索阶段.利用粗糙集结合集成学习的方法建立网络舆情分类模型,能够在短时间内发现突发网络舆情,为用户和论坛管理人员及时、准确和方便地提取重要的主题信息,以便更好地对论坛进行管理.  相似文献   

6.
在传统的文本情感分类中,通常假设数据是独立同分布的,但对于舆情时序数据,文本的情感分布处在一个不断变化的环境中,未必都服从独立同分布的假设,因此,仅在历史数据上训练的分类器无法在新到来的数据上取得令人满意的分类效果.针对这一问题,文章提出一个基于特征融合的时序文本情感分类模型.该模型在多段时间连续的数据上训练多个BER...  相似文献   

7.
分析了高校网络舆情监控的现状,提出了基于高校网络舆情监控系统的设计方案.该系统通过网络爬虫将相关网络新闻、博客和论坛的信息采集下来,采用关键词和敏感词匹配的方式对信息进行过滤,将用户关注的信息呈现出来,从而实现对舆情信息及时准确的发现。  相似文献   

8.
通过模拟人类访问网页的浏览行为,提取定向爬行子页面集限定爬虫的爬行方向;引入页面继承关系,并通过爬行条目的属性继承实现跨页面复合对象的数据关联关系;设计实现了支持深度定向采集的通用爬行流程。面向天涯热帖的舆情采集实验结果表明:该方法可以在整体处理流程不变的前提下,实现复杂对象的数据采集,并具有较高的采集效率。  相似文献   

9.
提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network,CRNN)的弹幕文本情感分析模型ALBERT-CRNN.首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文语境中具有不同的词向量表达;然后利用...  相似文献   

10.
针对舆情监管中数据自动化获取、情感分析和空间可视化显示的相关问题,研究了基于云GIS的网络舆情可视化方法.通过构建基于OpenStack和GeoServer的云GIS平台为舆情数据的采集、分析和显示提供存储和计算支撑;研发了舆情数据自动化采集引擎,根据网页DOM的结构特点,设计了列表项和列表项属性信息获取算法,实现了舆...  相似文献   

11.
在对标准潜在狄利克雷分布(LDA)模型进行改进的基础上,提出了一个主题情感混合最大熵LDA模型对在线评论进行细粒度观点挖掘.首先,在传统LDA模型中加入最大熵组件来区分背景词、特征词和观点词,并对特征词和观点词进行局部和全局的划分;然后,在主题层和单词层之间加入情感层,将传统的LDA三层模型扩展成四层;最后,进行情感极性分析,同时获取整篇评论和每个主题的情感极性,生成细粒度的主题情感摘要.实验验证了所提模型和理论的有效性.  相似文献   

12.
目的结合中文信息处理技术,设计一个网络舆情监控系统;针对网络舆情挖掘研究中存在的问题,提出了一种K-means改进算法,实现Web挖掘基础上的文本聚类与主题发现。方法构建一个基于聚类分析的网络舆情监控系统,并详细介绍系统各个模块用到的关键技术;提出了一种K-means改进算法,对K-means算法中的关键环节(聚类初始值的选择和孤立点的剔除)进行了改进。结果设计的系统能通过对网页、论坛、博客、新闻评论等网络资源的精确采集,并结合网页净化、中文分词、向量模型建立、特征选择、降维处理,文本聚类等中文信息处理技术,实现对网络舆情的监测;改进算法的总体思路是要求用户输入簇的初始个数k和最大值kmax,由改进算法在计算过程中自动计算出聚类的结果数k。结论设计了一个基于聚类分析的网络舆情监控系统;提出了一种K-means改进算法。具体算法实施及将这些关键技术整合实现成一套自动化的网络舆情信息采集、分析、监测与预警系统,是网络舆情挖掘研究工作的下一步重点。  相似文献   

13.
互联网高速发展的今天,网民能方便地在网络上针对各种热点问题进行评论和发表意见,从而形成大规模的舆论效应.如何对网络舆情进行实时的监控已经成为一些部门和机构热切关注的问题.文中针对上述问题,综合搜索引擎、网络监控、页面采集、信息挖掘等热点技术,设计并实现了一种部署简单、功能完整的网络舆论自动监控与分析系统.该系统能对网络...  相似文献   

14.
为解决情感分类中词间的语义关系难以表达和分析的问题,提出了一种基于词向量(word representation)和支持向量机(support vector machine)的情感分类算法,对电子商务在线评论的情感分类问题进行研究.首先使用word2vec聚类相似特征,然后使用word2vec和SVM对情感数据进行训练和分类,并分别使用基于词特征和基于词性标注的方法进行特征选择.在京东评论数据上进行的实验结果表明,与现有方法相比,分类准确率和召回率得到了提高.  相似文献   

15.
基于SVM分类算法和Web服务框架,提出了一种医疗数据分析与疾病预测模型,改进了医疗数据分析系统与医院数据库之间的数据传输协议.采用该模型与长春某三级甲等医院合作,获取了总共1 695条病人电子病历数据与病人疾病信息作为实验数据,并在医疗数据分析系统中进行数据挖掘分析.通过数据条数的变化和对属性的控制来测试设计的数据分析模型和改进的数据传输协议的传输效率.实验表明,在传输数据之前对数据进行预处理并且通过特征选择算法进行降维处理有助于提高整个系统的医疗数据传输效率和预测准确度.  相似文献   

16.
针对目前金融领域文本存在标注资源匮乏的问题,提出一种基于生成对抗网络的金融文本情感分类方法. 该方法以边缘堆叠降噪自编码器生成鲁棒性特征表示作为输入,在生成对抗过程中,通过向文本表示向量添加噪声向量再生成新样本,应用对抗学习思想优化文本特征表示. 在公开的跨领域情感评论Amazon数据集和金融领域数据集上进行实验,并与基准实验对比,结果表明,该方法在平均准确率上有显著提升.  相似文献   

17.
当前互联网已成为公众获取信息、表达观点的重要平台,也带来社会舆情事件易发生的风险,通过对网络舆情走势的提前预测,能够准确判断热点事件的发展态势,为政府相关部门应对舆情危机提供参考.针对单一预测模型预测精度不高和社交媒体对舆情走势影响较大的问题,提出了融合微博热点分析和长短期记忆神经网络(LSTM)的舆情预测方法.利用网络爬虫和PyTorch机器学习平台构建了用于舆情时序数据分析的网络舆情预测系统;在此系统内,考虑微博的强时效性,采用网络热点分析技术计算微博热度分值;改进LSTM网络,设计由2个隐含层组成的MH-LSTM预测模型;将MH-LSTM模型用于舆情事件百度指数的定量预测中,通过试验验证了模型的正确性,证实了该预测模型拥有较好的预测效果.  相似文献   

18.
一种基于极性词典的情感分析方法   总被引:1,自引:0,他引:1  
极性词典是文本情感分析和倾向性分析的基础。本文构建了一个全面、高效的极性词典,包括基础词典、领域词典、网络词词典以及修饰词词典,深入研究了修饰词对极性词的影响,将极性词与修饰词组合成极性短语作为极性计算的基本单元,提出了一种基于极性词典的情感分析方法。实验结果表明,利用本文构建的词典进行倾向性分析效果不错。  相似文献   

19.
当前,社交媒体已经成为人们发布和获取信息的最主要渠道之一。由于大量用户的参与,社交媒体平台上已累计了海量的舆情数据,并且还在以指数级增加。如何发现和跟踪社交媒体中舆情变化是当前数据挖掘领域研究的热点问题之一。基于演化聚类的方法是分析社交媒体舆情的一类主要方法。主要从主题模型和矩阵/张量分解模型两方面来总结当前基于演化聚类的舆情分析方法,并且分析这两类方法的优缺点;最后对下一步研究进行了展望。  相似文献   

20.
为了完整的区分地形数据库中各种地理要素的变化类型,提出了地形数据变化分类所依据的4因子模型,即对象整体、对象组件、对象或对象组件的状态、属性值的逻辑运算结果,这4个因子具有一定的层次结构。变化类型首先根据高层次的因子判断,如果高层次因子无法区分变化,则逐渐降低确定变化的因子类型。基于提出的方法,建立了一个自动化提取和发布变化信息的信息系统。实验结果表明,该模型能满足空间数据生产者发布变化信息的需要。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号