首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 171 毫秒

1.  面向话题的中文微博观点倾向性分析研究  
   李清敏  张华平  刘金刚《科学技术与工程》,2014年第14卷第12期
   随着微博快速崛起,每天数以千万的人通过微博分享自己对各类话题的观点与情感,如何自动感知微博社区对特定话题的观点倾向性,已经成为中文微博计算亟待解决的问题。由于微博内容短小且不规范,传统的情感分析效率低下且效果很难满足实际需求。现提出一种将情感词典分类的方法进行实验研究,针对腾讯微博20个话题约17 500条微博32 000个句子的数据进行实验,实验结果表明提出的情感词典分类方法效果很好。    

2.  微博分析研究综述  
   刘滨  张静远  刘强  赵静阳  李寒  徐巍巍《河北科技大学学报》,2015年第36卷第1期
   微博,是当前重要的社会信息传播平台之一,具有易操作、传播快等特点,人们可以通过微博直接快速地表达对突发事件、公众人物、热门产品等的观点.为了利用海量微博信息,需要综合多种分析方法挖掘其潜在价值.综述了当前微博分析领域的研究现状,提出了自主研发的微博分析系统,探讨了未来微博分析的研究方向.首先,介绍了微博分析的主要技术方法,包括利用微博开放平台和利用网络爬虫技术.利用微博提供的开放接口,可以方便快捷地获取微博信息,如微博内容、用户评论、用户个人详情、粉丝数、关注数等.但也存在诸多限制,如每小时只能抓取有限次数、微博平台并不开放所有信息资源等.利用网络爬虫技术可以获取更多信息,如基于全网的网络爬虫的信息采集技术可以覆盖更广的范围,基于主题的网络爬虫的信息采集技术可以选择性爬取预先设定的主题等.其次,介绍了目前微博分析的热点问题,包括微博用户行为和微博内容两方面.微博用户行为分析包括:1)传播网络研究,利用Gephi等可视化工具,呈现出微博在传播过程中的传播路径、传播范围、关键转发节点等信息,可用于预测未来传播情况;2)传播因素研究,通过分析用户行为,揭示信息传播的可能原因;3)用户影响力分析,不同学者给出不同的度量方法,而要精准地评价用户影响力需要综合考虑多方面因素,如粉丝数、转发数、被提及数、回复、社会关系等.关于微博内容的分析包括:1)微博文本预处理,包括分词和去停用词2个步骤;2)微博热点话题发现,常用方法包括 基于词频的统计方法和文本聚类方法,这两种方法都有利于提高发现热点话题的效果,但没有考虑到话题动态演变的特性;3)情感分析,也被称为观点挖掘,一直是微博研究领域的热点问题,可以利用微博表情图片抽取情感词,并结合构建语义词典和机器学习的方法对微博进行情感分类,最终判断微博情感极性,可用于舆情监控、商业预测和产品选择等方面.再次,提出了自主研发的微博分析系统——阅微,重点介绍了其情感分析、地域分布和传播图3个模块.情感分析模块,基于情感词典的方法对用户的评论内容进行情感分类;地域分布模块,提取参与用户的地理位置信息并加以统计分析,呈现出微博传播在全国范围内的分布情况;传播图模块,利用可视化手段展现微博信息的传播扩散情况,如转发关系、转发层级、转发范围等情况.最后,归纳全文,从技术和应用2个方面归纳微博分析的挑战问题:可从技术上突破微博接口资源限制,提高微博分析的效率和精准度;同时从微博应用方面发展事件监控、管理和商业方面的应用.    

3.  基于句法与主题扩展的中文微博情感倾向性分析模型  
   陆浩  牛振东  张楠  孙星恺  刘文礼《北京理工大学学报》,2014年第34卷第8期
   微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析.文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.    

4.  基于BTM和加权K-Means的微博话题发现  
   陈凤  蒙祖强《广西师范大学学报(自然科学版)》,2019年第3期
   为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。    

5.  基于LDA模型的中文微博话题意见领袖挖掘  
   冯时  景珊  杨卓  王大玲《东北大学学报(自然科学版)》,2013年第34卷第4期
   有效挖掘微博空间中的话题意见领袖成为亟待解决的热点问题.针对这一问题,提出了基于LDA语义信息和HowNet知识库的短文本子话题分类算法.对分类后的微博从显式、隐式及用户等方面综合衡量微博的影响力,并根据层次分析法对多个因素进行科学地权值分配.实验结果表明,提出的方法较基于支持向量机的方法具有更好的效果,同时提出的影响力度量模型可以有效地挖掘出微博中的话题意见领袖.    

6.  基于动量模型的食品安全事件发现方法  
   蔡莹  於跃成  谷雨  严长春《江苏大学学报(自然科学版)》,2019年第2期
   食品安全是广受民众关注的热点话题,而微博已经成为食品安全事件曝光的主要媒体平台.以微博语料作为数据源,同时使用微博内容和用户的社交网络行为特征,提出了基于动量模型的食品安全事件发现方法.该方法以事件发现作为描述食品安全事件的基本模型,以检测出微博信息流中与食品安全相关的候选特征词,然后采用动量模型实现候选特征词的动量建模和重复特征词的有效过滤.最后,通过K-means聚类将有效的特征词进行归类合并,以实现食品安全事件的发现.试验结果表明:该方法能够有效发现在微博中传播的食品安全事件,并能过滤掉微博中无关的话题.    

7.  微博情感分析综述  
   张强  陶皖  王海燕《安庆师范学院学报(自然科学版)》,2017年第4期
   大数据时代下,微博作为一个开放性的信息传播平台吸引了众多的网民参与其中,与之相关的研究也得到了广泛的开展.本文将微博情感分析任务分为3步:微博语料的获取与预处理、情感特征的标注与选择、主观文本的情感分类.在主观文本分类中,将情感分类分为基于规则的方法和基于机器学习的方法.最后对当前中文微博的情感分析现状做了总结,并阐述了当前微博情感分类还需亟待解决的一些问题.    

8.  基于文本语义和表情倾向的微博情感分析方法  被引次数:1
   王文  王树锋  李洪华《南京理工大学学报(自然科学版)》,2014年第6期
   针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口( API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和HowNet中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于HowNet语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。    

9.  多策略中文微博细粒度情绪分析研究  被引次数:1
   欧阳纯萍  阳小华  雷龙艳  徐强  余颖  刘志明《北京大学学报(自然科学版)》,2014年第1期
   针对中文微博用户的情绪分析问题,提出一种基于多策略融合的细粒度情绪分析方法。首先采用朴素贝叶斯算法对微博的有无情绪分类问题进行研究,然后构建有情绪微博的21维特征向量,最后采用SVM和KNN算法对微博进行细粒度情绪分析。以新浪微博作为实验对象,结果表明多策略集成方法好于单一分类算法。在多策略集成方法中,"NB+SVM"方法略优于"NB+KNN"方法。    

10.  以主体为中心的微博计算方法--微博计算微革命:从“信息”中心到以“人”为本  
   张华平  商建云  赵燕平《复杂系统与复杂性科学》,2012年第4期
   针对以微博为对象的分析挖掘,提出了“以人为本”的微博计算模型,即以微博主体为微博计算的主要对象,研究微博博主个性化表示模型,博主情绪感知算法、及微博内容分析等关键技术,综述了微博计算已有的研究进展.创新之处在于突破了纯粹内容分析的局限,更好地适应了微博计算的需求.    

11.  基于主题标签和CRF的中文微博命名实体识别  
   朱颢东  杨立志  丁温雪  冯嘉美《华中师范大学学报(自然科学版)》,2018年第3期
   近年来,网络媒体微博的迅速发展,为命名实体的识别研究提供了一种全新的载体.针对中文微博文本短、表达不清、网络化严重等特点,论文提出了一种规则与统计相结合的中文微博命名实体识别方法.该方法首先利用中文微博的主题标签对处理后的数据进行筛选,然后再选取合适的特征模板,并利用条件随机场模型(Conditional random fields,CRF)进行实体识别.为了满足实验要求,该文将传统网页爬虫方法与API接口采集方法相结合进行微博数据采集.实验结果表明,该方法能够有效提高中文微博命名实体的识别效果.    

12.  半监督的微博话题噪声过滤方法  
   屠守中  杨婧  赵林  朱小燕《清华大学学报(自然科学版)》,2019年第3期
   社交网络中存在大量营销、招聘等垃圾信息以及无实质内容的短文,为话题建模工作带来很多干扰,更严重影响社交网络方面的学术研究及商业应用。因此,该文提出了一种结合支持向量机与k近邻模型(pSVM-kNN)的半监督话题噪声过滤方法。该方法融合了SVM和kNN算法,在SVM计算得到超平面的基础上使用kNN算法在局部范围内迭代寻找分类超平面的最优解;同时为减少误分类发生,分别在SVM和kNN阶段引入惩罚代价和比例权重,以提高噪声过滤的效果。通过选取新浪微博中不同大小的数据集进行实验与其他方法进行比较,结果表明:该方法只利用了少量的标注样本进行训练,在准确率、召回率和F值方面均优于其他的对比方法。    

13.  中文微博情感倾向性分析特征工程  
   李泽魁  赵妍妍  秦兵  刘挺《山西大学学报(自然科学版)》,2014年第4期
   情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。    

14.  基于三支决策的中文微博观点句识别研究  
   田海龙  朱艳辉  梁韬  马进  刘璟《山东大学学报(理学版)》,2014年第8期
   微博观点句识别是对微博进行观点挖掘和舆情分析的基础,因此观点句识别的准确率对后续研究工作至关重要。提出了一种基于三支决策的中文微博观点句识别方法,采用支持向量机分类器,sigmoid函数计算某条微博属于观点句的概率,并将基于三支决策的中文微博观点句识别方法与传统支持向量机方法进行对比实验,实验结果表明,基于三支决策的中文微博观点句识别方法取得了很好的识别效果。    

15.  基于双重注意力模型的微博情感分析方法  
   张仰森  郑佳  黄改娟  蒋玉茹《清华大学学报(自然科学版)》,2018年第2期
   微博情感分析是获取微博用户观点的基础。该文针对现有大多数情感分析方法将深度学习模型与情感符号相剥离的现状,提出了一种基于双重注意力模型的微博情感分析方法。该方法利用现有的情感知识库构建了一个包含情感词、程度副词、否定词、微博表情符号和常用网络用语的微博情感符号库;采用双向长短记忆网络模型和全连接网络,分别对微博文本和文本中包含的情感符号进行编码;采用注意力模型分别构建微博文本和情感符号的语义表示,并将两者的语义表示进行融合,以构建微博文本的最终语义表示;基于所构建的语义表示对情感分类模型进行训练。该方法通过将注意力模型和情感符号相结合,有效增强了对微博文本情感语义的捕获能力,提高了微博情感分类的性能。基于自然语言处理与中文计算会议(NLPCC)微博情感测评公共数据集,对所提出的模型进行评测,结果表明:该模型在多个情感分类任务中都取得了最佳效果,相对于已知最好的模型,在2013年的数据集上,宏平均和微平均的F1值分别提升了1.39%和1.26%,在2014年的数据集上,宏平均和微平均的F1值分别提升了2.02%和2.21%。    

16.  基于箱线图的微博客热点话题发现  
   郭德清  廖祥文《山西大学学报(自然科学版)》,2014年第1期
   提出了一种基于箱线图原理识别突发词的热点话题发现方法。该方法首先统计了噪声微博的特征,并根据这些特征对微博进行了过滤,然后利用箱线图原理识别突发词,最后通过计算不同时段突发词的权重来发现微博热点话题。实验结果表明,与SSM、EC、ELM方法相比,基于箱线图原理识别突发词的热点话题发现方法在F1值上平均提高了13.8%,而且对噪声不敏感。    

17.  基于微博的个性化社区推荐算法  
   于笑明  李文杰《天津理工大学学报》,2018年第5期
   随着互联网的发展,网络信息正飞速增长.社交网络如Facebook,Twitter,微博等相继出现,用户通过虚拟平台可以获得自己感兴趣的信息,找到爱好相投者.面对海量的内容信息,如何选择各自所需成了当下研究的话题,因此推荐系统应运而生.进一步地,如何更加个性化推荐信息也成为探讨热点.本文以微博社区为平台提出了一种基于微博的个性化社区推荐算法,通过对传统的Jaccrad相似度方法改进,从用户所关注博主以及所参与社区或话题两方面考虑用户之间相似性.继而通过改进的Page Rank算法筛选出具有影响力的对象作为待推荐集.与传统Jaccard和Page Rank算法相比,本算法在平均准确率的平均值MAP上分别提高了42.6%和34.3%.    

18.  中文微博句子倾向性分类中特征抽取研究  
   徐雄飞  徐凡  王明文  左家莉  罗文兵《江西师范大学学报(自然科学版)》,2015年第3期
   针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法。在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法。实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升。    

19.  微博垃圾评论检测与预处理技术  
   胡新海《湖南工程学院学报(自然科学版)》,2014年第24卷第3期
   针对发表在微博上评论信息的特点,尤其是那些广大网民用户不愿看到的垃圾评论信息进行了深入研究.归纳了网络上垃圾评论的存在形式和类型,将垃圾评论分为社会网络垃圾评论和普通垃圾评论.为了有效地检测与过滤微博中评论垃圾,提出了一种微博垃圾评论数据预处理的过程和方法,将预处理后的评论信息作为分类和检测的基础.    

20.  含关键字的新浪微博获取与舆情分析  
   江林升  张春霞《宝鸡文理学院学报(自然科学版)》,2014年第1期
   目的自动从新浪微博中抓取含指定关键词的相关微博,通过对抓取的微博进行分析,得到相关舆情热点。方法首先通过多线程爬虫,自动爬取含有指定关键字的微博,将其保存于数据库中,再采用基于字符串匹配的逆向最大匹配法对微博进行分词,计算各分词项的TF-IDF权重作为文本聚类的输入数据,最后用k-means算法进行聚类分析,得出舆情热点。结果与结论这种方法能自动从新浪微博中抓取含指定关键词的相关微博,通过聚类分析,每一族的微博内容具有较高的一致性和共同的主题,由此可迅速找出热点舆情,对及时了解和引导舆情具有积极的意义。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号