首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
通过微博情感分析掌握网络舆情动态是网络数据挖掘的研究热点,特征选择是基于内容的微博舆情分类的重要环节。为有效提取微博数据的特征,分析CHI特征选择算法应用在微博舆情分类中的特点及不足,给出一种改进的特征评估函数,并进一步用基于蚁群聚类的方法消除微博特征间的冗余。实验结果表明,改进的算法能够有效提高微博舆情分类的效能。  相似文献   

2.
微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点。为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值。综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向。首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术。利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等。但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等。利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等。其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面。微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等。关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面。再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块。情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况。最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用。  相似文献   

3.
针对舆情监管中数据自动化获取、情感分析和空间可视化显示的相关问题,研究了基于云GIS的网络舆情可视化方法.通过构建基于OpenStack和GeoServer的云GIS平台为舆情数据的采集、分析和显示提供存储和计算支撑;研发了舆情数据自动化采集引擎,根据网页DOM的结构特点,设计了列表项和列表项属性信息获取算法,实现了舆情数据的自动化获取;设计了情感分析算法,实现了舆情信息正负面属性的判定.研发了基于云GIS的舆情可视化系统,为基于空间的舆情信息可视化分析提供了实践经验.  相似文献   

4.
对新闻数据可视化技术进行了研究,并充分整合数据挖掘、文本分析、分布式存储及可视化技术,设计实现了一个新闻数据可视化系统.它把采集到的新闻数据进行分类,并结构化存储,在WEB端为用户展示新闻数据的可视化分析成果.系统在交互式设计上提供了强大的用户界面来辅助新闻关注者对网络舆情的直观掌控,并通过对系统性能的测试,证明了系统在大量用户使用及大规模数据呈现的情况下都具有较好的性能.  相似文献   

5.
以网络爬虫方式获取新浪微博用户属性信息及微博内容数据,利用数据挖掘技术从中发现微博用户间的多种显式和隐式关系.在此基础上,提出一种基于半监督学习的用户兴趣匹配预测算法,参照仓室模型的传播个体状态划分方法,基于传播个体间的兴趣匹配度界定各状态之间的转移过程和转移概率,进而构建基于用户兴趣匹配的网络舆情传播模型.研究结果表明,该模型能够较好地描述社交网络中的舆情传播规律,重现网络舆情在社交网络中的真实传播过程链.  相似文献   

6.
在广泛调研以往互联网舆情系统存在的一些问题和不足的基础之上,研发了一套互联网舆情深度分析与引导系统DeepOpinion。该系统从用户、主题、情感三个方面对互联网舆情进行分析,并通过信息检索和内容定制技术对所关注的网络舆情进行适当引导。以天涯杂谈板块为网络舆情来源、以“辱母杀人案”事件为具体案例对系统功能进行了验证,结果表明DeepOpinion系统在互联网舆情深度分析与引导中发挥重要作用。  相似文献   

7.
为了研究微博用户表达情感的特性,从个人化的情感表达和对社会性事件的态度反映两类文本出发,分别对个人情感变化以及热点事件中的用户情绪进行分析,设计并实现了微博情感可视化系统(sentiment visualization system for microblog, SVSM)。个人化情感研究记录用户在时间轴上的情绪波动,并且从性别及地域属性上分析个人情感差异;热点事件情感研究监测用户情绪的群体表达,从时间、空间、热词、用户属性、事件属性以及传播特性等角度进行特性分析。  相似文献   

8.
针对微博短文本提出一种将微博主题与微博情感进行协同分析的方法,利用云南省主流微博媒体数据,研究重大突发公共卫生事件情境下的民众情感极性特征,有助于舆情监测和舆论引导。利用高频词分析研究时间窗口内微博热点主题词,然后训练基于SnowNLP的情感分类模型预测微博情感极性,综合微博信息影响力强度利用隐含狄利克雷分布(LDA)主题模型建模,结合每日疫情实时通报,分析微博情感随时间序列变化趋势。研究发现新冠肺炎疫情爆发以来,多数微博呈现极端正面情感,且微博情感分类结果具有一定的时间聚集性,舆情情感会随公众聚焦事件出现反转,须加以有效引导。  相似文献   

9.
对微博情感分类,及时掌握微博上发布信息状态是网络舆情监控的重要研究内容。为能有效提取微博样本的特征,结合微博书写时口语化、时代化、含表情等特点,提出基于改进N-Gram的微博的多特征项提取算法,并给出基于聚类的KNN分类模型。实验结果表明,本文提出的算法能够有效提高微博舆情分类性能。  相似文献   

10.
以短文本内容发布为主要特点的微博,已经成为重要的信息传播媒介,预测微博流行度对舆情监测、企业营销、热点推送等都具有重要意义.当前对微博流行度预测的研究主要侧重于对所有用户的微博数据进行统一建模预测,鲜有研究考虑不同影响力用户之间的差异.而微博数据的分析显示标签、提及和微博长度等对微博流行度的影响会随发布者的影响力变化显示出明显差异,在流行度预测中充分考虑这些差异,有助于取得更好的预测结果.为此,在流行度预测中引入多任务学习(Multi-Task Learning,简称MTL),并结合SVM构建SVM+MTL模型,此模型通过同时考虑所有用户的共同特性和不同用户的具体特性来提高预测性能.此外,除了预测常用的用户属性和微博发布行为等特征外,还引入微博内容相似性这一新特征,该特征能明显提高预测准确率.基于微博数据的实验表明,SVM+MTL模型可以有效提高微博流行度预测性能.  相似文献   

11.
概述了网络舆情内容分析的流程以及内容分析阶段需要完成的工作,详细介绍了基于知识技术的网络舆情内容分析系统框架的构建路径,即将知识技术引入网络舆情内容的分析过程,将信息预处理、信息聚类和分类、倾向性分析等关键技术手段与知识组织、知识表示、知识获取和知识挖掘等相关成果充分融合,将本体论和语义计算等技术与舆情分析相结合,建立基于知识技术的网络舆情内容分析框架,以提高网络舆情内容分析的准确度. 实验结果表明,基于知识技术的网络舆情内容分析系统达到了理想效果.  相似文献   

12.
基于微博文本数据分析的社会群体情感可视计算方法研究   总被引:1,自引:0,他引:1  
针对已有的情感分析研究多侧重在情感的倾向性方面, 缺乏对各类情感的详细描述, 不能形象直观地反映社会群体的情感变化的问题, 提出一种基于依存句法和人工标注相结合的情感分析方法。该方法采用三维立体的人脸表情进行情感分析, 形象地呈现社会群体的情感变化。对于不同的社会事件, 以可视化方式来展现不同地区微博群体的情感。实验结果表明, 该模型可以有效地描述人群情感, 研究结果为基于大数据的网络舆情分析提供了一种新思路。  相似文献   

13.
互联网自媒体呈现大数据特征,负能量言行时常爆发,舆情检测已经成为网络监管的重大难点问题.本文基于软件定义网络、蜜罐技术和分布式架构,综合"流量级"检测和"进程级"检测2个层面,通过构造异常行为数据集和敏感文本类型数据集,设计负能量舆情倾向的检验算法,搭建虚拟蜜罐式主动性舆情检测系统.实践证明,虚拟蜜罐式主动舆情检测系统,能较好地完成自媒体圈的主题倾向监测任务,为自媒体圈舆情检测技术提供新的研究视角.  相似文献   

14.
运用系统动力学对影响网络舆情的因素进行分析,绘制因果回路图,建立存量流量图模型,利用Vensim软件对模型进行仿真。结果表明政府公开信息透明度和政府反应时间比其他影响因素作用程度较大,从而确定了影响网络舆情发展程度的关键因素,得出了控制网络舆情发展程度的策略。  相似文献   

15.
随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。  相似文献   

16.
随着互联网技术的迅猛发展,网络已成为社会舆情的重要阵地,而网络舆情是食品风险预警的一个方向。传统舆情预警模型在指标体系的基础上结合反向传播神经网络(back propagation neural network,BP)等神经网络模型进行分析,存在运行不稳定、预测精度不高等问题。为了解决这些问题,采用具有较高预测精度的长短记忆(long short-term memory,LSTM)网络算法,在网络事件指标体系的基础上引入层次分析法(analytic hierarchy process,AHP)并融合食品安全事件指标数据,将融合结果作为LSTM的期望输出,以建立更为稳定、精度更高的风险预警模型AHP-LSTM。实验结果表明,与传统模型相比,AHP-LSTM对于事件指标数据具有较强的处理能力和较高的预警精度。因此构建基于AHP-LSTM的食品安全事件预警方法,可为相关部门有效防范和管理食品安全网络事件提供一定的理论依据和数据支撑。  相似文献   

17.
在分析网络舆情基本内涵的基础上,采用生命周期方法探索了网络舆情的演变机制,并对网络舆情发展过程中所表现出的特征和规律进行了归纳和总结.在此基础上,以BBS为标的对网络舆情的分析技术进行了探究,建立了以BBS为基础的网络舆情技术分析模型,通过BBS舆情热点事件实验,验证了网络舆情的演变机制,揭示了网络舆情的内在衍生规律.  相似文献   

18.
特征抽取是网络舆情分析中最重要的环节之一,优秀的特征抽取算法能够极大的提高舆情分析的效率和准确率.对旅游网络舆情进行分析和监管,能够及时发现云南旅游中的突发事件,可提供给相关部门以便迅速采取正确的应对方式,对云南的旅游业发展有很大的帮助,分析了传统特征抽取算法正确率低下、运行效率不高等方面的不足,将领域本体知识应用在旅游网络舆情分析的特征抽取算法之中,建立旅游网络舆情领域本体,根据领域本体优化特征抽取计算特征词权重,经过多次大数据量试验验证,优化后的方法显著提高了特征抽取的正确率和运行效率,证明基于领域知识的特征抽取的正确率和运行效率得到很大的提升.  相似文献   

19.
随着媒介技术的发展,信息传播环境日新月异。微博平台的出现从根本上改变着人们获取信息的方式、途径和比例,传统教师形象随之被消解。教师形象重构的主体是教师。积极体验微博的使用以提升媒介素养、利用基于微博平台建立的网络学习共同体以提升专业化水平、主动参与微博建构的公共领域话题的讨论,将有助于教师新形象的重构。  相似文献   

20.
突发事件由于前兆不充分,在网络E事件的影响力极易被无限放大,将严重危害社会的和谐与稳定,对突发事件网络舆情热度评价是把握突发事件发展方向的重要内容.笔者在已有突发事件网络舆情热度评价指标体系的基础上,采用定性分析和定量分析相结合的方法,建立了基于灰色评价法和层次分析法相结合的突发事件网络舆情热度评价模型,并以2009年杭州飙车案进行了实证研究.通过实证表明,灰色层次评价法科学合理,简单易行,对突发事件网络舆情热度评价具有良好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号