首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
分析酒店评论数据可以挖掘游客的关注点、意见、建议、情感倾向等有价值的信息.结合对酒店评论数据进行主题挖掘和情感分析的交叉研究,提出一个包含数据采集、数据预处理、主题挖掘、情感倾向研究及可视化分析的集成框架.以Tripadvisor网站上北京地区50家五星级酒店的5万余条中文评论数据为研究对象,进行LDA主题挖掘,同时基于酒店领域扩充情感词典,判定评论文本三元情感极性,并在此基础上实现主题和情感的交叉分析.研究结果可降低潜在游客购买决策的风险,也为酒店管理者制定针对性的管理和营销策略提供重要参考依据.研究方法同样适用于景区及餐饮领域的在线评论数据分析,拓展评论大数据与自然语言处理技术在旅游业的应用范畴.  相似文献   

2.
景区评论中蕴含着丰富的情感内涵,如何挖掘出有价值的信息逐渐成为研究人员关注的焦点。运用TF-IDF算法和SO-PMI算法构建了面向延安景点评论的情感词典。实验结果表明,本文所构建的情感词典在情感分类方面准确率达到了89%,召回率以及F1值都有明显提升,从而验证了该词典的有效性和可行性。  相似文献   

3.
从语义分析角度出发,对产品评论文本进行情感倾向分析研究。首先在现有的情感词典的基础上整理并构建一个面向产品评论的情感词典;然后以句子为单位对评论文本进行语句分割,根据词频统计提取产品的主要特征词,并构建特征关联词词库,针对不同的特征分别进行情感倾向分析;最后对所有评论文本作加权计算获得其总体情感倾向。实验结果表明,基于语义分析的产品评论挖掘方法具有较好的情感分析效果。  相似文献   

4.
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。  相似文献   

5.
研究构建领域情感本体,显式描述产品与产品部件、产品与产品属性之间的语义关系;设计词性模式匹配方法提取特征词和情感词的固定搭配,并采用评论句的极性标签结合否定词典,逆向推测搭配组合的情感极性,建立特征词与情感词的关联关系;进一步设计本体节点匹配规则进行情感分析,提高对电商网站评论文本情感分析的性能. 实验结果表明,领域情感本体的构建有利于消除情感词的领域依赖性及识别评论中的隐性特征.   相似文献   

6.
针对在线医疗评论文本具有行业专业性强、差异性大、不够规范等特点,提出一种基于特征加权词向量的在线医疗评论情感分析方法.利用Word2vec方法构建词向量模型,抽取情感词集合完善医疗服务领域情感词典,根据句法关系识别主题词与情感词的依存关系,引入期望交叉熵因子,建立特征加权词向量模型,分析在线医疗评论的情感倾向.实验结果表明扩充的医疗服务情感词典在分析性能上的准确率、召回率以及F1值均高于基础情感词典,引入期望交叉熵因子后,基于特征加权词向量的情感分析方法在SVM分类上表现出更好的效果,体现了其在在线医疗评论挖掘领域的良好效用.   相似文献   

7.
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。  相似文献   

8.
为了挖掘商品评论中有价值的信息,有效分析用户对商品的直接反馈,文章基于通用的情感词典,以国内某电商平台上的商品评论为研究对象,根据词频共现方法拓展情感词典,基于构建的情感词典对评论进行情感极性分析。根据分析结果,不仅能够帮助商家优化商品属性,更好地满足消费者的需求,还可以指导用户制定合理的购买决策。  相似文献   

9.
手机的普及为生活带来便利,但由于品牌多、定位不同等导致消费者难以快速准确的选择合适的机型。为解决这个问题,提出了一种基于在线评论情感分析的手机推荐方法,用于帮助消费者寻找符合购买意愿的手机。首先,集成基础情感词典,构建程度副词、否定词、手机领域评论用语等相关词典,再根据消费者需求对手机各项参数进行多属性组合,并计算每条手机评论的情感值,将评论文本的情感模糊值转换为准确值,最后结合手机属性和评论的情感值定义特征矩阵,进而使用余弦相似度的方法得到top-k款与消费者需求相似的手机推荐给用户。对比传统的使用单一情感词典的推荐方法,结果表明该推荐方法能够有效的提高推荐结果的采纳度。  相似文献   

10.
为提高情感词库在特定领域情感分析的性能,针对情感词的强度和极性随着领域不同而变化的问题,采用遗传算法构建特定领域专用的情感词库。提出了基于遗传算法的情感词库构建框架,将词库预测特定领域文本情感趋向的准确率作为优化目标,并不断对情感词分值进行调整。利用遗传算法强大的搜索能力,实现对情感词分值的调整,结合情感词对文本的影响,设计并改进了变异策略以提升情感分类的准确率。设计了精英策略以提升算法的收敛速度。通过在中文和英文评论数据集上的对比实验表明,相较于已有的情感词库,构建的词库在特定领域文本情感分类的准确率和F1值都在80%以上,具有明显优势,证明了方法的有效性。该方法构建的情感词库在特定领域具有良好的性能,有效提升了情感词的覆盖率,能很好地扩展到其他领域。  相似文献   

11.
在对旅游景点的评论挖掘中常以多景点横向对比为研究切入点,为景点间的横向比较及游人选择景点服务,而较少针对单一景点深入分析,为景点单要素精准提升服务.以留园为例,按照构成元素构建聚类,并基于领域词典进行整体与分要素聚类的情感分析.结果表明,留园中"山石"要素相关的正面情感占比66%,低于分要素平均正面情感78.3%.可见基于园林构成要素聚类分析可帮助精准提取互联网评论情感分析.研究成果对园林等旅游景点管理方优化、品牌形象提升提供了一种易于操作的、更精准的理论与方法.  相似文献   

12.
基于微博表情符号,提出一种自动构建情感词典的方法。 从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库。 对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典。 这是一种全新的思路。 以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上。   相似文献   

13.
随着民族地区信息化建设的不断推进,中国少数民族语言网络舆情研究也逐渐引起了大家的关注,文本分类和情感分析模块是舆情系统的重要组成部分。传统的文本分类方法主要通过统计字面上的词语重复次数,而对于文字背后的语义关联考虑甚少。该文重点介绍了一种基于LDA模型在少数民族语言(以彝文为例)网络舆情信息情感分析方面的应用,对文字隐含的主题进行建模,通过挖掘少数民族网页上的舆情信息所蕴含的主题,以及对这些主题进行情感分析,在事件全面爆发之前,采取应急措施。  相似文献   

14.
为了更好地挖掘投资者情绪,解决在股市文本情绪分析过程中,现有情感词典构建方法自动化程度低、行业特异性不足和精确度不足等问题。在构建基本情感词典的基础上,Word2vec对自动添加的高频情感词语进行极性判断与赋值,并将情感词典构建改为优化问题,采用改进模拟退火算法对情感词典的词语分值进行优化,提高股市情感词典性能。实验结果表明:该方法所构建的股市情感词典可以有效识别股市文本情绪,提升文本覆盖率,具有更强的行业特异性,提升情绪分析准确性,可更好用于投资者情绪相关研究。  相似文献   

15.
提出了一种基于情感词典和概念层次网络(hierarchical network concepts, HNC)语境框架的文本情感倾向性分析方法,将文本的情感倾向分析分为两个阶段:特征词、语句和句群判定阶段;基于HNC语境框架的句与句群情感分析阶段。首先以HowNet情感词典和自建的形容词配价词典(valency dictionary of English adjective, VDEA)作为基础词典资源进行文本特征词匹配,在此基础上基于HNC语境框架进行文本的情感倾向性判定,融合情感词典资源与HNC语境框架的独特优势,从特征词语情感分析入手,以包含特征词的语句及句群为情感分析重点,进而确定文本的情感倾向性,体现了HNC “有所为有所不为” 的思想。为验证方法的有效性,文本分别对政治、经济、体育与影视评论等领域文本进行测试,从实验结果可以看出商品评论以及影评类的文本情感识别率相对较高,而政治与体育类识别率低,但基本达到了预期实验效果,从而验证了本方法的可行性。  相似文献   

16.
首先, 基于点互信息与信息检索(PMI IR)算法, 提出一种Laplace平滑情感判定(LS-SO)算法, 对情感词典与表情符号情感词典进行自动扩充, 得到了具有一定规模、 高质量的情感词典, 包括基础情感词典、 目标情感词典、 网络用语情感词典、 表情符号情感词典、 否定词词典、 疑问词词典、 程度副词词典和连词词典. 其次, 通过细化文本语义分析规则计算文本情感值. 实验结果验证了该方法的有效性.  相似文献   

17.
针对现有跨领域情感分类方法中文本表示特征忽略了重要单词与句子的情感信息, 且在迁移过程中存在负面迁移的问题, 提出一种将文本表示学习与迁移学习算法相结合的跨领域情感分类方法。首先, 利用低维稠密的词向量对文本进行初始化, 通过分层注意力网络, 对文本中重要单词与句子的情感信息进行建模, 从而学习源领域与目标领域的文档级分布式表示。随后, 采用类噪声估计方法, 对源领域中的迁移数据进行检测, 剔除负面迁移样例, 挑选高质量样例来扩充目标领域的训练集。最后, 训练支持向量机对目标领域文本进行情感分类。在大规模公开数据集上进行的两个实验结果表明, 与基准方法相比, 所提方法的均方根误差分别降低1.5%和1.0%, 说明该方法可以有效地提高跨领域情感分类性能。  相似文献   

18.
基于Lasso回归和支持向量机分类器,首先利用Lasso回归具有变量筛选的特点,过滤部分不重要的特征,然后利用支持向量机分类器做情感提取.在某化妆品品牌的评论数据实验中,利用基础情感词典和领域情感词典构建待选择高维特征集,通过对比特征选择前后的G-means,精确度和召回率等,均取得显著效果.  相似文献   

19.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号