首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
随着突发事件的频发,对突发事件在线评论进行倾向性分析引起了广泛关注,情感词典是其中重要的资源.对面向突发事件的情感词典自动构建方法进行探讨.基于对大规模评论数据的统计分析,提出采用基于词性标注和snownlp的方法实现突发事件情感词典的自动构建.为验证构建词典的有效性,设计基于情感词典的情感倾向性分析模型.结果表明,词典构建方法在准确率和召回率方面效果较好.基于该词典的情感倾向性分析模型的性能较基础模型性能有较大的提升.  相似文献   

2.
提出了一种基于情感词典和概念层次网络(hierarchical network concepts, HNC)语境框架的文本情感倾向性分析方法,将文本的情感倾向分析分为两个阶段:特征词、语句和句群判定阶段;基于HNC语境框架的句与句群情感分析阶段。首先以HowNet情感词典和自建的形容词配价词典(valency dictionary of English adjective, VDEA)作为基础词典资源进行文本特征词匹配,在此基础上基于HNC语境框架进行文本的情感倾向性判定,融合情感词典资源与HNC语境框架的独特优势,从特征词语情感分析入手,以包含特征词的语句及句群为情感分析重点,进而确定文本的情感倾向性,体现了HNC “有所为有所不为” 的思想。为验证方法的有效性,文本分别对政治、经济、体育与影视评论等领域文本进行测试,从实验结果可以看出商品评论以及影评类的文本情感识别率相对较高,而政治与体育类识别率低,但基本达到了预期实验效果,从而验证了本方法的可行性。  相似文献   

3.
通过基于领域词典的情感分析法,从用户生成的内容中更为准确地分析其情感状态,为民宿业提供一种新的研究视角。以贵阳民宿评论为研究样本,采用SO-PMI算法完成领域词典的构建,并借助LDA主题模型和可视化技术对用户评论进行情感分析。研究发现,构建的领域词典相较基础情感词典而言,性能上得到提升,尤其在负面评论方面,准确率、召回率上分别提升了17%和16%。同时结合LDA主题挖掘,详尽分析民宿评论中的正负面主题并分析其内在原因,这能为民宿管理者做出更好的决策提供数据支持和理论支撑。  相似文献   

4.
5.
使用JST模型对中文新闻文本进行情感分析,相对于评论文本,新闻文本主观性比较弱,而且大多是长文本,会影响JST模型的分类性能.给出一种抽取情感主题句的方法,将抽取得到的情感主题句结合现有的JST模型对新闻文本的情感倾向进行了分析.实验表明,使用情感主题句进行情感分析,避免了与主题情感无关的句子对分析结果的影响,提高了分类准确率.  相似文献   

6.
以情感依存元组(EDT)作为中文情感表达的基本结构,把新闻文本主题情感倾向性判别任务分成主题识别、情感倾向性分析和主客观分类三个逐层递进的子任务。在主题识别前先对TF-IDF方法进行改进,再结合基于交叉熵方法提取主题特征词,同时考虑了新闻文章标题的主题表征作用,将标题词纳入主题特征集;然后基于空间向量模型计算句子与主题特征向量的相似度,在此基础上考虑句子位置、长度及句子与标题的相似度,计算句子的主题相关度以抽取主题句;最后建立情感依存元组判别模型计算主题句的情感,采用主、客观分类规则筛选出新闻倾向关键句。本方法在COAE 2014评测中各项指标皆逼近最好成绩,表明基于情感依存元组的分类方法具有较高的分类性能。  相似文献   

7.
在对旅游景点的评论挖掘中常以多景点横向对比为研究切入点,为景点间的横向比较及游人选择景点服务,而较少针对单一景点深入分析,为景点单要素精准提升服务.以留园为例,按照构成元素构建聚类,并基于领域词典进行整体与分要素聚类的情感分析.结果表明,留园中"山石"要素相关的正面情感占比66%,低于分要素平均正面情感78.3%.可见基于园林构成要素聚类分析可帮助精准提取互联网评论情感分析.研究成果对园林等旅游景点管理方优化、品牌形象提升提供了一种易于操作的、更精准的理论与方法.  相似文献   

8.
一种基于极性词典的情感分析方法   总被引:1,自引:0,他引:1  
极性词典是文本情感分析和倾向性分析的基础。本文构建了一个全面、高效的极性词典,包括基础词典、领域词典、网络词词典以及修饰词词典,深入研究了修饰词对极性词的影响,将极性词与修饰词组合成极性短语作为极性计算的基本单元,提出了一种基于极性词典的情感分析方法。实验结果表明,利用本文构建的词典进行倾向性分析效果不错。  相似文献   

9.
景区评论中蕴含着丰富的情感内涵,如何挖掘出有价值的信息逐渐成为研究人员关注的焦点。运用TF-IDF算法和SO-PMI算法构建了面向延安景点评论的情感词典。实验结果表明,本文所构建的情感词典在情感分类方面准确率达到了89%,召回率以及F1值都有明显提升,从而验证了该词典的有效性和可行性。  相似文献   

10.
针对基于关键词字符匹配和粗粒度情感分析方法的传统不良信息检测方法准确率低的问题,提出一种基于短语级情感分析的不良信息检测方法.该方法制定语法规则来提取敏感词所在短语,结合二次分类的情感词典,通过分析短语的情感倾向来判断表达者对敏感关键词的情感倾向,从而判定内容的敏感性.本文方法克服了字符串匹配方法的缺点,如:传统的字符串匹配方法忽视敏感词上下文,从而导致大量误报的缺点,及粗粒度情感分析方法由于无法准确定位情感对象,只能以文本整体情感倾向代表表达者主观情感,导致不能精准分析与敏感词相关的情感倾向及敏感性.实验表明,本文方法与传统方法相比,准确率有较大的提升.  相似文献   

11.
新闻评论表达了人们对新闻事件的看法与态度, 因此对新闻评论进行分析具有潜在的应用价值. 传统的情感分析方法仅对评论文本进行分析, 忽略了新闻文章主题及语义信息对评论的影响. 针对这个问题, 提出了一种基于支持向量机和 $K$ 均值聚类的情感分析方法, 将新闻文章信息对评论情感的影响因素引入到新闻评论的情感分类中. 实验结果证明了该方法在新闻评论情感分析任务中的有效性.  相似文献   

12.
当前中文微博情感分析的主流做法是将情感极性分类结果的好坏作为评判的标准。从提高微博情感判别准确度的目的出发,尽量多考虑影响微博情感的元素。在统计微博中情感词的基础上,加入了微博表情这一重要元素,采用与文本情感值加权的方式参与微博情感计算,使得对含有表情的微博情感判定结果有了一定程度的提高;在语义规则部分,基本涵盖了汉语中最常用的几种句型规则和句间关系规则,使得对复杂语句的情感分析更加准确。同时,还对每条微博的情感给出了具体的数值,并在正确率、召回率、F 值的基础上,提出合格率这一指标,对微博情感判别方法得到的数值准确性进行评价。通过搭建 Hadoop 平台对测试集的1万条数据进行测试,验证了融合算法的有效性。  相似文献   

13.
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。  相似文献   

14.
基于文本语义和表情倾向的微博情感分析方法   总被引:1,自引:0,他引:1  
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。  相似文献   

15.
为提高情感词库在特定领域情感分析的性能,针对情感词的强度和极性随着领域不同而变化的问题,采用遗传算法构建特定领域专用的情感词库。提出了基于遗传算法的情感词库构建框架,将词库预测特定领域文本情感趋向的准确率作为优化目标,并不断对情感词分值进行调整。利用遗传算法强大的搜索能力,实现对情感词分值的调整,结合情感词对文本的影响,设计并改进了变异策略以提升情感分类的准确率。设计了精英策略以提升算法的收敛速度。通过在中文和英文评论数据集上的对比实验表明,相较于已有的情感词库,构建的词库在特定领域文本情感分类的准确率和F1值都在80%以上,具有明显优势,证明了方法的有效性。该方法构建的情感词库在特定领域具有良好的性能,有效提升了情感词的覆盖率,能很好地扩展到其他领域。  相似文献   

16.
针对目前金融领域文本存在标注资源匮乏的问题,提出一种基于生成对抗网络的金融文本情感分类方法. 该方法以边缘堆叠降噪自编码器生成鲁棒性特征表示作为输入,在生成对抗过程中,通过向文本表示向量添加噪声向量再生成新样本,应用对抗学习思想优化文本特征表示. 在公开的跨领域情感评论Amazon数据集和金融领域数据集上进行实验,并与基准实验对比,结果表明,该方法在平均准确率上有显著提升.  相似文献   

17.
分析了句型结构中的否定句和转折句对倾向词极性的影响,提出一种基于句型结构的领域倾向性词表构建算法.该方法不仅考虑了词与词之间的相关性,也考虑了词与文档之间的相关性信息.该算法利用改进的拉普拉斯平滑方法来计算候选词和基准词之间的语义相关性,同时结合词与文档的相关性信息,加入了对转折句和否定句的处理,最后采用改进的信息瓶颈...  相似文献   

18.
微博作为电子口碑的重要载体,极大影响了消费者的购买决策和商家的产品销售.为此,以新浪微博为平台,研究从微博中挖掘情感信息并利用这些信息对产品销售进行预测的方法.分析影响微博评论的因素,基于已构建的情感本体,建立微博中情感计算方法.然后在传统自回归模型的基础上融入情感因素,提出自回归情感预测模型用于产品销量的预测.对电影数据集进行了广泛地实验,分析参数选择,并与其它预测模型进行比较,实验证实我们提出的方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号