首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
面对新冠肺炎疫情带来的重大影响,通过自然语言处理技术,深入挖掘民众关于新冠肺炎的观点与看法,为疫情期间政府应对网络舆情危机提供参考.针对当前研究中将主题和情感孤立研究的缺陷,首先从微博上收集网络舆情的相关数据,然后通过LDA主题模型和基于Bi-LSTM的情感分类方法进行主题-情感的融合分析.结果表明,Bi-LSTM模型可以较好地识别出喜、怒、哀、惧4类情感,同时LDA主题模型在热门主题挖掘方面也表现良好.  相似文献   

2.
为了辨别在线评论的情感倾向,了解大众舆情对某一事件或产品的看法,采用层叠CRFs模型,把在线评论语句进行主客观分类、极性分类以及评论语句的褒贬强度分类,充分利用极性分类和褒贬强度分类之间的层次关系来改善情感分类的冗余关系,以期借助改进的条件随机场模型实现文本情感倾向及强度的分析,实现篇章级文本集的情感分析.  相似文献   

3.
为对网络舆情数据进行主题挖掘与情感分析,以微博某单位招聘热点事件的舆情演变为研究对象,提出了一种融合主题模型和情感分析的LDA-Attention-BiLSTM模型。运用Python的Scrapy框架爬取该事件文本评论。采用隐含狄利克雷分布(LDA)模型实现了主题识别。使用基于注意力(Attention)机制的双向长短期记忆(BiLSTM)网络进行文本情感分析。研究结果表明,构建的基于LDA与Attention机制BiLSTM的混合模型能够反映舆情中的热点话题与情感时序变化,揭示事件爆发的主要原因,事件传播阶段的主要话题与事件的处理结果等。  相似文献   

4.
基于我国新冠肺炎疫情期间27万余条新闻报道数据,利用语义分析、社会网络分析与聚类分析等方法,借助新兴可视化工具,从时间、空间维度展开新闻舆情主题和情感研究.研究发现,新闻主题起初以疫情信息为主,中期政府举措与社会影响占比上升,后期各类主题呈现平衡态势,反映了新闻主题从集中到发散的过程;新闻情感呈现随时间推演逐渐好转的总体趋势,显示出我国在抗击疫情中及时有效的调控能力;新闻空间方面,新闻报道的情绪表现及热点主题以湖北省为中心向周边扩散,体现了公共卫生事件的地域关联特征.该研究能为今后相关突发公共卫生事件的新闻报道提供借鉴,使相关管理部门更科学地引导新闻舆论.  相似文献   

5.
为研究地理空间距离对网络舆情信息扩散的影响,以新浪微博平台全国范围内关于"九寨沟地震"事件的微博数据为支撑,采用舆情扩散特征指标提取、时间距离空间转换、幂函数模型拟合等方法,先分析网络舆情信息扩散的时空收缩现象,再分别从响应时间、响应强度、传播强度和主题分布等维度上对网络舆情信息扩散中距离的影响进行了研究.结果表明:1)距离对网络舆情信息扩散的响应时间、响应强度、传播强度存在摩擦阻抗作用,但其作用强弱受地理空间的网络基础资源、城市经济发展水平、是否有同类事件发生等因素影响,有地理依赖性;2)距离一定程度上会影响舆情主题的分布,与事件、人员关系较大的主题占比有随距离的增加而减小的趋势,而对事件的认识、情感态度类主题的占比随距离的增加而增大.结论:地理空间距离对网络舆情信息扩散有影响,但对于不同的传播特征,指标的作用存在差异.  相似文献   

6.
微博短文本蕴含着较为丰富的情感信息,基于微博数据的情感分析已成为网络舆情监测的重要任务。为提高中文微博情感分类效果,提出一种基于粒子群优化(PSO)的长短期记忆(LSTM)模型(PSO-LSTM),该模型在LSTM模型的基础上进行了参数优化,能够更有效获取微博信息。实验以新冠肺炎疫情期间的微博数据集构建PSO-LSTM模型,与其它模型进行了比对实验。实验结果表明,PSO-LSTM模型能够有效提升中文微博情感分类的性能。  相似文献   

7.
随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。  相似文献   

8.
目前微博已经成为网络舆论传播和挖掘民意的重要平台,为分析疫情事件对网民情绪的影响,科学高效地做好防控宣传和舆情引导工作,为此融合不同的深度学习方法对2020年初发生的新冠疫情的微博评论进行情感分析。提出一种基于RNN(Recursive Neural Network)和LSTM(Long Short-Term Memory)混合模型并在嵌入层中使用FastText词向量表示方法,以降低词向量中的噪声数据,从而获得语义丰富且噪声少的高质量词向量,并与朴素贝叶斯、支持向量机、 RNN、 LSTM多种情感分析方法进行比较。结果表明,所提出的情感分析模型正确率达到了98.71%,证明了该模型能有效提升情感分析正确率。  相似文献   

9.
意见挖掘在企业智能分析、政府舆情分析等领域发挥着重要作用,为了充分挖掘主观性文本所蕴含的商业价值和社会价值,提出了一种基于情感主题模型的特征选择方法。该方法重点考察极性词及其共现现象,采用主题模型挖掘出正面褒义主题和负面贬义主题中极性词的分布情况,旨在度量情感特征在情感倾向表达中的重要性。实验阶段结合支持向量机分类器进行分析。实验表明该特征选择方法能有效提高跨领域文本情感分类准确性,具有较好的实用价值。  相似文献   

10.
网络舆情安全是社会安全的重要组成部分,识别和追踪热点话题是治理突发事件网络舆情的基础。现有研究具有网络舆情事件表征不全面、对于热点话题的识别和追踪局限于语义信息等问题。该研究基于社交、内容、话题、情感4个维度构造超网络模型,并引入时间特征作为网络的连接关系,用于定量表征时序的网络舆情事件;将话题节点在超网络中的中心性及中心性变化率作为话题热度的度量指标,实现热点话题发现及演化跟踪;应用“甘肃白银马拉松”微博舆情案例对模型和指标进行验证分析。研究结果表明:该时序超网络模型能够清晰表征突发网络舆情事件,中心性及中心性变化率指标能够准确识别和跟踪热点话题,并为实时态势研判预警、舆论引导等提供指导。  相似文献   

11.
通过微博情感分析掌握网络舆情动态是网络数据挖掘的研究热点,特征选择是基于内容的微博舆情分类的重要环节。为有效提取微博数据的特征,分析CHI特征选择算法应用在微博舆情分类中的特点及不足,给出一种改进的特征评估函数,并进一步用基于蚁群聚类的方法消除微博特征间的冗余。实验结果表明,改进的算法能够有效提高微博舆情分类的效能。  相似文献   

12.
对微博情感分类,及时掌握微博上发布信息状态是网络舆情监控的重要研究内容。为能有效提取微博样本的特征,结合微博书写时口语化、时代化、含表情等特点,提出基于改进N-Gram的微博的多特征项提取算法,并给出基于聚类的KNN分类模型。实验结果表明,本文提出的算法能够有效提高微博舆情分类性能。  相似文献   

13.
本文依托2020年1月1日至2月29日期间共计6万条新浪微博博文与1.5万条微博热门评论,基于分布式爬虫技术、分布式数据库系统、SnowNLP情感分析模型以及KMeans文本聚类算法,对与"新冠肺炎疫情"相关的话题展开舆情分析,可视化地展现本次疫情事件中网络舆情的时空演化过程.在时间维度层面,通过文本聚类与情感分析,发现网民对于此次肺炎疫情的态度大致经历了三个阶段,即起伏不定的紧张焦虑期、缓慢攀升的团结振作期以及波动很小的自信平稳期,总体上呈现积极大于消极、正面大于负面的情绪状态.在空间维度层面,通过地理统计分析,发现疫情最严重地区网民评论人数最多,同时情感值也最低.  相似文献   

14.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

15.
为了描述和分析特定微博事件的情感变化,情感时间序列被应用在微博事件分析当中.情感时间序列是根据不同时间段内的情感强度生成的曲线,能够描述用户关于事件的情感随时间变化的趋势.为了使对微博的情感挖掘定位到更为精准的时间片,提出一种基于Shapelet的不相关情感子序列挖掘方法 .首先通过事件和不同类别用户的微博生成相应的情感时间序列,然后利用基于Shapelet的思想将相应序列划分成不同的子序列,最后通过计算不同种类用户的子序列和事件子序列的相似性得到最不相关的情感子序列.通过基于微博事件数据集的实验展示了使用该方法挖掘出的情感子序列结果,并进一步通过情感相似度方法验证了该方法的合理性.  相似文献   

16.
该文研究文本极性分类算法优化问题。目前算法多以计算词的极性进行文本极性分类,由于不能保证词的主题相关性,导致文本情感分析准确率较低。为了提高分类精度,该文提出一种新的文本极性分类方法,首先用tf/idf算法抽取主题词确定文本主题句,然后对句子进行句法分析,并利用核函数设计基于词特征、词义特征以及句法特征等多特征融合的句子极性计算方法,通过分析情感主题句的极性进行文本情感倾向的判断。新方法不仅考虑了词本身的极性,还根据核函数区分词的动态极性,同时避免与主题无关的句子对分析结果的影响,进行实验与其它分类算法作比较,证明新方法能够有效提高文本情感分析的准确率,可为设计提供实用有效的算法。  相似文献   

17.
微博话题的情感分析是分析出微博话题中隐含的情感并实现对微博消息的分类,该研究可以帮助网络监管人员和政府机关人员针对网络舆情及时做出积极有效的决策。微博话题情感分析的核心任务是分析微博话题中每条微博消息的情感倾向。本文提出的中文微博话题的情感分析是在基础情感词典之上,通过提取并构建程度副词、网络用词和否定词等相关词典,实现对基础情感词典的扩充,最后通过权值计算得到微博消息的情感极值,达到对微博消息进行情感分类的目的。实验结果证明所提出的方法的有效性。  相似文献   

18.
从海量微博数据中分析公众对某一社会事件的情感倾向具有重要研究意义,而海量微博文本稀疏规模庞大,导致传统方法处理这一任务时面临诸多挑战.提出一种基于主题聚类的海量微博情感分析方法.首先基于高质量微博数据挖掘频繁项集,设定语义相关阈值,筛选重要频繁项集进行谱聚类,得到主题关键词.基于主题关键词对海量微博数据依据语义相关度归类,最后结合情感词典对每类中的微博检索主题关键词前后修饰距离内情感词及否定词,结合表情符号计算微博情感值.在百万规模中文微博上进行实验,证明该方法能准确按主题归类且能有效在该主题上进行情感分类.  相似文献   

19.
针对自然语言处理的文本情感分类问题,提出一种基于集成学习的文本情感分类方法;基于微博数据的特殊性,首先对微博数据进行分词等预处理,结合词频-逆文档频率(TF-IDF)和奇异值分解(SVD)方法进行特征提取和降维,再通过堆叠泛化(stacking)集成学习的方式进行分类模型融合。结果表明,模型融合对文本情感分析的准确率达到93%,可以有效地判别微博文本的情感极性。  相似文献   

20.
为防范舆情风险,分析网络舆情的细粒度演化,提出一种去冗余的衍生事件内容关联演化分析框架。通过文本挖掘技术从海量文本流中提取主要的衍生事件,将舆情内容压缩到人工可判读的数量级;利用词移距计算相邻两个时间片上的衍生事件相似度,构建反映演化关系的衍生事件链图。以“上海特斯拉自燃”事件为例进行事件链演化分析,得到微博网络舆情事件发展不同阶段涉事主体在各个衍生事件中的话题转移关系,最后鲁棒性分析的结果验证了该分析方法具有降低微博短文本冗余信息的能力,提高了事件演化关联识别分析的准确性。该研究方法为舆情事件的事后复盘、同类舆情事件的预判和介入、衍生事件的科学研判提供了决策支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号