首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
随着微博快速崛起,每天数以千万的人通过微博分享自己对各类话题的观点与情感,如何自动感知微博社区对特定话题的观点倾向性,已经成为中文微博计算亟待解决的问题。由于微博内容短小且不规范,传统的情感分析效率低下且效果很难满足实际需求。现提出一种将情感词典分类的方法进行实验研究,针对腾讯微博20个话题约17 500条微博32 000个句子的数据进行实验,实验结果表明提出的情感词典分类方法效果很好。  相似文献   

2.
情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。  相似文献   

3.
提出一种微博平台上的产品评论情感倾向性分析方法,对特定语料库的产品特征词的词性进行分析,得到特征词的词性重要程度顺序;以情感词典识别的情感词为起点,提出一种依据词性重要程度的"特征观点对"识别规则,并依据该规则进行语义倾向的情感计算。实验结果表明,该方法在产品特征抽取及语义倾向的判断上具有较好的结果。结合微博的转发数和评论数,进行用户观点分析,计算用户对产品的认可度,挖掘产品属性的优缺点,实证分析证明这种方法的可行性。  相似文献   

4.
闻彬 《咸宁学院学报》2010,30(6):56-57,64
中文倾向性研究是针对文本内容获得有用的倾向性信息和知识,它已经成为自然语言处理的研究热点.本文首先分析了国内外关于倾向性的研究现状,然后重点介绍了情感词识别和情感词极性判别的方法和技术.同时在对现有的情感词极性判别技术的基础上,提出了一种基于改进的HowNet处理情感词极性判别的方法.实验结果表明,本方法在词语级上达到了较好的效果.  相似文献   

5.
任小燕 《科技信息》2011,(31):202-203
本文从中文词汇褒贬性判别、文本属性倾向性分析、中文文本的褒贬性判断三个方面对现有中文文本倾向性分析技术进行介绍和概括,比较和分析,以期对后续研究有所助益。  相似文献   

6.
探讨了中文网页倾向性分类的原理和实现方法,利用文本自动分类技术结合Web页面中的结构信息,提出了LSI-KNN-Naive Bayes的褒贬分类模型.并在部分网页数据集上,对上述理论进行了实验验证,取得了较好的成效.  相似文献   

7.
在现有的微博情感倾向性分析任务中,微博标签往往被视为噪声信息,在数据预处理阶段就被剔除.但微博标签蕴含着微博内容的关键信息,所以标签的剔除对于微博的情感倾向性分析是不利的.针对该问题,充分考虑微博的文本特点,提出一种基于双重注意力的情感分析模型.采用Bi-LSTM(Bi-directional Long Short-Term Memory)分别构建微博文本和微博标签的语义表示,采用双重注意力机制同时对微博的正文层和微博的标签层进行语义编码,提取出文本中的关键信息.最后,基于所构建的语义表示训练情感分类模型.实验结果表明,该模型在微博情感倾向性分析上取得了较好的效果.  相似文献   

8.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

9.
针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升.  相似文献   

10.
随着突发事件的频发,对突发事件在线评论进行倾向性分析引起了广泛关注,情感词典是其中重要的资源.对面向突发事件的情感词典自动构建方法进行探讨.基于对大规模评论数据的统计分析,提出采用基于词性标注和snownlp的方法实现突发事件情感词典的自动构建.为验证构建词典的有效性,设计基于情感词典的情感倾向性分析模型.结果表明,词典构建方法在准确率和召回率方面效果较好.基于该词典的情感倾向性分析模型的性能较基础模型性能有较大的提升.  相似文献   

11.
微博情感倾向性分析通常指对中文微博中每个句子褒义、贬义或者中性的情感进行自动分类。针对微博碎片化和情感类别失衡的特点,在半监督学习reserved self-training方法的框架基础上提取了适用于微博情感分类的文本特征,并提出了针对情感倾向性分析通过训练度阈值设定的方法来优化reserved self-training迭代终止的条件,在保留reserved self-training能有效处理微博语料中语料情感不平衡问题的优点基础上,防止了训练过度情况的发生。COAE 2014微博情感倾向性评测结果证明了该方法的有效性。  相似文献   

12.
通过分析微博的结构特点,提出了一种基于语义分析的中文微博情感分类方法。首先构建了表情符号情感词典和网络用语情感词典;然后结合词典资源对微博文本进行依存句法分析并且构建情感表达式树;最后根据制定的规则计算微博文本的情感强度,依据强度值判断微博的情感倾向类别。实验结果验证了该方法的有效性,也表明所构建的表情符号情感词典和网络用语情感词典能够有效增强情感分类器的性能。  相似文献   

13.
根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。  相似文献   

14.
为了能够快速准确地提取出海量文本信息中的情感特征词,提出从情感词语集中通过人工筛选得到种子词并对其情感强度赋值,同时,以这些种子词为基准计算出情感词语集中其他词语的情感强度值,从而得到各特征词在词语级及句子级的倾向性贡献度值。然后,将特征词在词语级、句子级这2种不同粒度情况下计算出的情感倾向性贡献度值有机结合起来,构造出基于双粒度模型的中文情感特征词提取模型。该提取方法考虑了特征词在词语级和句子级2个方面的情感倾向,使最终提取出的情感词的准确率得到了提高。实验表明,只要有一个全面的情感词典系统和一组准确恰当的种子词,提出的方法可以获得良好的准确率和召回率。  相似文献   

15.
利用句法分析模型, 将语句分成若干组合词, 根据组合词的主谓成分中情感词对于句子情感贡献的不同, 分别赋予不同的权重。统计分析该语句的情感分布特征, 利用得到的特征参数训练分类器, 再将训练好的分类器用于测试语料的情感分类。实验结果表明, 与已有的判别方法相比, 该方法的情感分类判别准确率较理想。此方法也可用于语句的比较级判别和否定句的极性判断等。  相似文献   

16.
中文BBS态度倾向分析算法研究   总被引:2,自引:1,他引:1  
作为互联网上网民自由发表言论的重要场所,BBS包含了大量的舆情信息,对其进行分析和舆情监控具有重要意义.本文研究了中文BBS态度倾向的自动识别问题,提出了基于情感词的BBS态度倾向启发式算法以及基于有监督学习的BBS态度倾向识别算法.实验中使用了三种不同的分类模型,并将有监督学习算法与启发式算法进行了实验对比.实验结果表明,有监督学习的BBS态度倾向识别效果明显优于启发式算法的效果.  相似文献   

17.
针对微博短文本存在口语化、简洁化等社交网络特征,充分利用句法依存关系以及条件随机场(conditional random fields,CRFs),抽取候选评价对象,并在基于机器学习的微博情感分类方法的基础上结合情感分析词典,引入情感值、微博标签、主题等特征,优化分类性能。在COAE(Chinese opinion analysis evaluation)微博评测数据集上,以准确率、召回率、F1值为评价指标对所提方法进行验证,证实了基于句法依存分析与CRFs相结合的评价对象抽取方法的有效性,分析了各类特征对情感分类性能的影响,最终在COAE微博观点句识别任务中准确率达91.4%。  相似文献   

18.
情感倾向的分析已经成为当前研究的热点.面向新闻的情感关键句抽取与判定主要运用的技术有对文本进行预处理、计算文本中词项权重、提取情感关键句、用SVM分类器对情感关键句进行情感倾向性分析.实验结果表明:JXNUIIP系统对情感关键句提取问题有良好的效果.  相似文献   

19.
结合RNN和CNN层次化网络的中文文本情感分类   总被引:1,自引:0,他引:1  
中文情感分类; 深度学习; 卷积神经网络; 循环神经网络  相似文献   

20.
有效挖掘微博空间中的话题意见领袖成为亟待解决的热点问题.针对这一问题,提出了基于LDA语义信息和HowNet知识库的短文本子话题分类算法.对分类后的微博从显式、隐式及用户等方面综合衡量微博的影响力,并根据层次分析法对多个因素进行科学地权值分配.实验结果表明,提出的方法较基于支持向量机的方法具有更好的效果,同时提出的影响力度量模型可以有效地挖掘出微博中的话题意见领袖.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号