首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 319 毫秒
1.
从语义分析角度出发,对产品评论文本进行情感倾向分析研究。首先在现有的情感词典的基础上整理并构建一个面向产品评论的情感词典;然后以句子为单位对评论文本进行语句分割,根据词频统计提取产品的主要特征词,并构建特征关联词词库,针对不同的特征分别进行情感倾向分析;最后对所有评论文本作加权计算获得其总体情感倾向。实验结果表明,基于语义分析的产品评论挖掘方法具有较好的情感分析效果。  相似文献   

2.
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。  相似文献   

3.
为提高情感词库在特定领域情感分析的性能,针对情感词的强度和极性随着领域不同而变化的问题,采用遗传算法构建特定领域专用的情感词库。提出了基于遗传算法的情感词库构建框架,将词库预测特定领域文本情感趋向的准确率作为优化目标,并不断对情感词分值进行调整。利用遗传算法强大的搜索能力,实现对情感词分值的调整,结合情感词对文本的影响,设计并改进了变异策略以提升情感分类的准确率。设计了精英策略以提升算法的收敛速度。通过在中文和英文评论数据集上的对比实验表明,相较于已有的情感词库,构建的词库在特定领域文本情感分类的准确率和F1值都在80%以上,具有明显优势,证明了方法的有效性。该方法构建的情感词库在特定领域具有良好的性能,有效提升了情感词的覆盖率,能很好地扩展到其他领域。  相似文献   

4.
针对传统在线评论情感分类忽视了用户个性化的问题,提出了一种融合用户个性化特征的在线评论情感分类(PORSC)方法,该方法为每一类型用户构建一个在线评论情感分类器.PORSC模型由2部分构成:一部分是具有学习评论中常见情感信息的全局情感分类模型;另一部分是能捕捉每种类型用户的个性化特征的特定用户类型分类模型.为解决PORSC模型在训练中的数据稀疏问题,引入多任务学习方法,以协同方式训练分类器,以并行方式解决了PORSC模型中参数的优化问题.通过在2个实际中文产品评论数据集和一个公开的英文评论数据集上实验,并与已有基线方法进行比较与综合分析,结果表明PORSC模型在一定程度上提高了在线评论情感分类的精度.  相似文献   

5.
Web中的客户评论信息挖掘是大数据分析中的一项重要内容.分析客户评论中所包含的产品特征情感倾向,不仅可为消费者购买产品提供更具体的决策支持,还能有效帮助企业改进产品质量.针对商业应用的实际需要,提出了一种自动从中文客户评论中抽取产品特征并判断其情感倾向的方案.基于frequent pattern-tree (FP-tree)方法提取产品特征,结合基于语料库的方法和依存句法分析方法识别关于产品特征的主观评论语句、情感词及其情感词的依存关系,综合考虑情感词、否定词、程度词计算产品特征的情感倾向值.采用公开数据中的600篇手机评论作为实验数据,检验了算法的准确性.对比分析的结果说明,算法有很好的应用潜力,能够有效地从网络评论中获取有价值的商业信息.  相似文献   

6.
针对文本情感分类中情感语义特征利用不足、特征降维效果欠佳等影响分类效果的问题,提出了一种通过扩展语义相似的情感词以及引入词语间统计特征的高精度网络评论情感分类方法.该方法利用神经网络Skip-gram模型生成词嵌入,通过词嵌入相似性度量将语义相似的词语扩展为情感特征;再利用词语间的统计特征进行特征降维;通过多个弱分器加权构建Adaboost分类模型实现网络评论情感分类.基于酒店评论和手机评论公开测试集进行实验,结果表明其情感分类的正确率分别达到90.96%和93.67%.方法扩展语义相似情感词有利于丰富文本情感语义特征,引入词语间的统计特征有更好的特征降维效果,可以进一步提升文本情感分类的效果.   相似文献   

7.
目的 随着公众舆论数据的快速增长,社交网络文本情感识别在网络舆情监控中发挥着越来越重要的作用。由于文本数据的稀疏性、高维性和自然语言的复杂语义,情感分析任务面临巨大的挑战。方法 为提高网络舆情情感识别的效果,设计一种融合双向门控循环单元(BiGRU)和卷积神经网络(CNN)的情感识别模型。首先将社交网络文本转换成特征向量,然后通过BiGRU提取文本的上下文情感特征,最后通过CNN提取文本的局部情感特征,构建中文社交网络文本情感识别模型。结果 以新冠疫情期间网民的微博评论为数据集验证模型的可行性和优越性,模型的精确率、召回率和F1值分别达到86.6%、87.06%和86.85%。结论 实验结果表明,融合BiGRU-CNN的特征向量包含更加丰富文本的情感信息,能够有效提升网络舆情情感识别的性能。  相似文献   

8.
景区评论中蕴含着丰富的情感内涵,如何挖掘出有价值的信息逐渐成为研究人员关注的焦点。运用TF-IDF算法和SO-PMI算法构建了面向延安景点评论的情感词典。实验结果表明,本文所构建的情感词典在情感分类方面准确率达到了89%,召回率以及F1值都有明显提升,从而验证了该词典的有效性和可行性。  相似文献   

9.
根据评论内容的特性,提出了一种基于主题-对立情感依赖模型(topic-opposite sentiment dependency model,TOSDM)的虚假评论检测方法。首先构建TOSDM模型,利用该模型提取评论的主题信息以及主题对应的情感信息;然后结合评论的主题以及情感信息,分析并提取6维评论内容特征;最后利用这些评论内容特征,采用有监督学习的分类器对虚假评论进行检测。在大众点评网获取的2009-2012年的5个领域的评论数据集上进行了实验,实验表明,提取评论主题信息以及主题对立情感信息能够提高虚假评论的检测效果,TOSDM的虚假评论检测效果优于其他模型。  相似文献   

10.
鉴于细粒度产品特征挖掘的重要性以及现有产品评论研究中对产品特征语义(上下位特征、同义特征)缺失的问题,根据手机产品说明书构建手机产品特征本体,再采用爬虫程序从电子商务网站获取用户评论信息,并对自然评论语言进行分词、词性标注、去重等预处理,利用Apriori算法提取相应的产品特征,结合HowNet词典,将手机产品特征本体进行语义扩展、完善,便于将来进一步准确地从用户角度对产品进行情感分析.  相似文献   

11.
随着电子商务的发展,在线评论已成为企业分析其产品竞争力的重要数据资源.通过评论文本提取消费者最关注的产品特征维度,采用情感词典法对评论文本进行情感分析得到特征-情感分数对.计算特征维度的重要度和满意度以确定特征维度的机会得分,并绘制机会景观图,分析目标产品自身的竞争力.依据特征维度的满意度,比较目标产品与其竞争产品的竞...  相似文献   

12.
针对在线医疗评论文本具有行业专业性强、差异性大、不够规范等特点,提出一种基于特征加权词向量的在线医疗评论情感分析方法.利用Word2vec方法构建词向量模型,抽取情感词集合完善医疗服务领域情感词典,根据句法关系识别主题词与情感词的依存关系,引入期望交叉熵因子,建立特征加权词向量模型,分析在线医疗评论的情感倾向.实验结果表明扩充的医疗服务情感词典在分析性能上的准确率、召回率以及F1值均高于基础情感词典,引入期望交叉熵因子后,基于特征加权词向量的情感分析方法在SVM分类上表现出更好的效果,体现了其在在线医疗评论挖掘领域的良好效用.   相似文献   

13.
准确分类电商平台中用户评论所包含的多个方面的情感极性,能够提升购买决策的有效性。为此,提出一种融合ChineseBERT和双向注意力流(Bidirectional Attention Flow,BiDAF)的中文商品评论方面情感分析模型。首先,通过融合拼音与字形的ChineseBERT预训练语言模型获得评论文本和方面文本的词嵌入,并采用从位置编码和内存压缩注意力两个方面改进的Transformer来表征评论文本和方面文本的语义信息。然后,使用双向注意力流学习评论文本与方面文本的关系,找出评论文本和方面文本中关键信息所对应的词语。最后,将Transformer和双向注意力流的输出同时输入到多层感知机(Multilayer Perceptron,MLP)中,进行信息级联和情感极性的分类输出。测试结果表明,提出的模型在两个数据集上的准确率分别为82.90%和71.08%,F1分数分别为82.81%和70.98%。  相似文献   

14.
随着大数据时代的到来,电子商务网站规模迅速扩大,产品的种类和数量已成海量规模,消费者需要高效的产品选择方法帮助他们做出决策.为了提出基于在线评论的产品选择方法,首先,确定在线评论的效用,并对产品属性进行提取得到属性集合,在考虑评论效用的情况下确定属性权重;然后,对在线评论中的情感词进行分析,将消费者情感倾向表示为关于评价标度的概率分布;再依据随机占优准则得到两两产品关于每个属性的占优关系;进一步,通过PROMETHEE II方法对备选产品进行排序.最后,通过一个产品选择的实例说明该方法的可行性和实用性.  相似文献   

15.
微博情感新词的极性判定是情感分析研究中的一项基本任务,旨在对新词进行情感分类。针对极性判定的问题,提出一种新的计算特征向量相似度的算法。该方法首先使用特征向量表示情感新词和已有情感词,利用点互信息计算特征权值:然后采用广义Jaccard系数分别计算情感新词与已有的三种极性的情感词集内情感词的相似度,词集内相似度之和即为情感新词与该情感词集的相关度:最后,通过情感新词与三个极性情感词集的相关度的距离差判定其极性。实验结果表明,基于广义Jaccard系数的情感新词极性判定算法得出的F值比COAE 2014参赛队伍的最好成绩高两个百分点。  相似文献   

16.
基于Lasso回归和支持向量机分类器,首先利用Lasso回归具有变量筛选的特点,过滤部分不重要的特征,然后利用支持向量机分类器做情感提取.在某化妆品品牌的评论数据实验中,利用基础情感词典和领域情感词典构建待选择高维特征集,通过对比特征选择前后的G-means,精确度和召回率等,均取得显著效果.  相似文献   

17.
针对基于视频的多模态情感分析中,通常在同一语义层次采用同一种注意力机制进行特征捕捉,而未能考虑模态间交互融合对情感分类的差异性,从而导致模态间融合特征提取不充分的问题,提出一种基于注意力机制的分层次交互融合多模态情感分析模型(hierarchical interactive fusion network based on attention mechanism, HFN-AM),采用双向门控循环单元捕获各模态内部的时间序列信息,使用基于门控的注意力机制和改进的自注意机制交互融合策略分别提取属于句子级和篇章级层次的不同特征,并进一步通过自适应权重分配模块判定各模态的情感贡献度,通过全连接层和Softmax层获得最终分类结果。在公开的CMU-MOSI和CMU-MOSEI数据集上的实验结果表明,所给出的分析模型在2个数据集上有效改善了情感分类的准确率和F1值。  相似文献   

18.
股市中存在与投资者舆情有关的非理性现象,舆情与股市关系的量化研究对发掘股市规律和辅助投资预测具有重要意义.本文基于论坛中的投资者发言,创新性地建立CNN-TLDA混合模型对舆情进行多角度量化分析,从积极度和关注主题两方面探究投资者舆情和股市的相互影响关系,并基于长短时记忆(LSTM)网络对舆情在股市预测中的作用进行探讨.研究表明:中国股市投资者普遍悲观,投资者乐观度和关注主题都与股市高度相关.多角度舆情分析使预测误差下降至41%.研究成果能够辅助投资者的投资决策,也能为股市中个体投资者舆情的分析与利用提供科学参考.  相似文献   

19.
文档级别情感分类旨在预测用户对评论文本的情感极性标签。最近研究发现,利用用户和产品信息能有效地提升情感分类性能,然而,现有大多数研究只关注用户与评论、产品与评论的信息,忽略了用户与用户、产品与产品之间的内在关联,因此,本文提出一种融合图卷积神经网络的文本情感分类模型。首先,根据数据集构建了用户与用户关系图、用户与产品关系图;然后,融合两种关系图形成异质图,并使用图卷积神经网络学习用户与用户、产品与产品之间的内在联系,获得更好的用户和产品表示;最后,使用融合CNN的用户注意力和产品注意力机制的分层网络进行情感分类。实验结果表明,在公开数据集IMDB、Yelp2013和Yelp2014上,本文提出的模型能取得较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号