首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Web中的客户评论信息挖掘是大数据分析中的一项重要内容.分析客户评论中所包含的产品特征情感倾向,不仅可为消费者购买产品提供更具体的决策支持,还能有效帮助企业改进产品质量.针对商业应用的实际需要,提出了一种自动从中文客户评论中抽取产品特征并判断其情感倾向的方案.基于frequent pattern-tree (FP-tree)方法提取产品特征,结合基于语料库的方法和依存句法分析方法识别关于产品特征的主观评论语句、情感词及其情感词的依存关系,综合考虑情感词、否定词、程度词计算产品特征的情感倾向值.采用公开数据中的600篇手机评论作为实验数据,检验了算法的准确性.对比分析的结果说明,算法有很好的应用潜力,能够有效地从网络评论中获取有价值的商业信息.  相似文献   

2.
分析酒店评论数据可以挖掘游客的关注点、意见、建议、情感倾向等有价值的信息.结合对酒店评论数据进行主题挖掘和情感分析的交叉研究,提出一个包含数据采集、数据预处理、主题挖掘、情感倾向研究及可视化分析的集成框架.以Tripadvisor网站上北京地区50家五星级酒店的5万余条中文评论数据为研究对象,进行LDA主题挖掘,同时基于酒店领域扩充情感词典,判定评论文本三元情感极性,并在此基础上实现主题和情感的交叉分析.研究结果可降低潜在游客购买决策的风险,也为酒店管理者制定针对性的管理和营销策略提供重要参考依据.研究方法同样适用于景区及餐饮领域的在线评论数据分析,拓展评论大数据与自然语言处理技术在旅游业的应用范畴.  相似文献   

3.
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。  相似文献   

4.
特征抽取是网络舆情分析中最重要的环节之一,优秀的特征抽取算法能够极大的提高舆情分析的效率和准确率.对旅游网络舆情进行分析和监管,能够及时发现云南旅游中的突发事件,可提供给相关部门以便迅速采取正确的应对方式,对云南的旅游业发展有很大的帮助,分析了传统特征抽取算法正确率低下、运行效率不高等方面的不足,将领域本体知识应用在旅游网络舆情分析的特征抽取算法之中,建立旅游网络舆情领域本体,根据领域本体优化特征抽取计算特征词权重,经过多次大数据量试验验证,优化后的方法显著提高了特征抽取的正确率和运行效率,证明基于领域知识的特征抽取的正确率和运行效率得到很大的提升.  相似文献   

5.
要想实现对纷繁复杂的网络舆情的监控和管理,预防舆情危机的突发状况,一个关键的解决方案就是对网络舆情事件的发展趋势进行预测.然而,目前针对舆情演变预测的研究工作却十分有限,尤其是社交网络环境中的舆情演变预测.本文将评论文本的情感值作为演变预测的对象,利用情感词和舆情事件中评论文本的语义相似度,为事件发展的每个时间段都构造一个对应的图结构,再结合门控循环单元(GRU)与图注意力网络(GAT)对情感时间序列进行预测.为了验证模型的有效性,本文以Twitter中弗洛伊德事件的评论文本作为数据集,开展与基于图卷积网络的预测模型的对比实验.实验结果表明,本文提出模型的R2决定系数为0.569,平均绝对误差(MAE)、均方误差(MSE)和均方根误差(RMSE)均小于基于图卷积网络的预测模型,能较好地实现舆情事件中评论文本的情感演变预测.  相似文献   

6.
城市内涝频发造成严重经济损失,危害城市安全和居民生活,影响城市可持续发展,受到广泛关注。采用大数据技术对城市内涝网络舆情进行动态监测,采用网络爬虫等数据挖掘方法动态采集城市内涝舆情数据,深度分析舆情热度演变趋势、关注要点和情感倾向。以"2018.7.16"北京市内涝事件为样本分析城市内涝事件舆情传播特征,揭示其动态演化机理。结果表明:舆情高发时间段与内涝多发期较为吻合,舆情热度与城市内涝事件的影响程度呈正相关。社会对于城市内涝重点关注内容为城市排水管网的建设、内涝灾情及救援进展。城市内涝事件舆情演变过程经历了潜伏期、爆发期、蔓延期、反复期及消退期五个阶段,舆情参与者在不同阶段作用机理动态变化。根据舆情演变特征提出相应对策,为内涝事件舆情应对提供决策支持。  相似文献   

7.
以网络股评舆情数据作为非结构型文本数据研究对象,结合股票市场的相关交易指标,使用文本挖掘技术和机器学习算法确定投资者情绪测度指标,分析舆情数据中潜藏情感倾向对未来短期内股票收益率的预测能力.实证结果表明,舆情文本中挖掘潜藏情感信息能够以较高的准确率实现对股市收益率的预测.分析讨论了对预测结果有一定影响的特征字段与训练样本两个因素,发现在特征字段数量不变的情况下,随着训练数据的增多,预测结果的解释能力会有所提高;而当训练数据维持在一定范围内时,特征词数量的选取对预测结果也有很大的影响.  相似文献   

8.
随着在线视频平台的快速发展,弹幕逐渐成为人们表达观点的一个重要途径,尤其受到年轻人的欢迎.与常规的文本不同,弹幕文本普遍较短,表达随意,网络词汇较多,一些常规的停用词被用于表达情感.提出了一种基于弹幕数据的舆情分析模型,针对弹幕数据生成和存储特点,提出了热点检测循环自适应弹幕数据获取算法;扩充了情感词典来区分弹幕中情感倾向数据和中性数据,以解决弹幕中出现的网络词汇较多的问题;基于卷积神经网络(Convolutional Neural Network, CNN)建立了情感褒贬分类模型,用来区分情感倾向弹幕的正负情感倾向,在此基础上得到了舆情分析的结果.实验表明,本文的舆情分析模型能有效地表达新闻类弹幕数据的舆情分析结果.  相似文献   

9.
从语义分析角度出发,对产品评论文本进行情感倾向分析研究。首先在现有的情感词典的基础上整理并构建一个面向产品评论的情感词典;然后以句子为单位对评论文本进行语句分割,根据词频统计提取产品的主要特征词,并构建特征关联词词库,针对不同的特征分别进行情感倾向分析;最后对所有评论文本作加权计算获得其总体情感倾向。实验结果表明,基于语义分析的产品评论挖掘方法具有较好的情感分析效果。  相似文献   

10.
农产品安全事件的网络舆情是关乎民众健康和社会安定的重大问题。采用改进的元胞自动机模型分析此类网络舆情的演化趋势及导控策略。通过对元胞空间邻域结构、状态转移函数及演化规则的改进体现农产品网络舆情特点,引入导控因子分析舆情导控策略,并通过仿真实验探究网民情感倾向、相互作用以及信息干预对舆情演化趋势的影响。最后对中国近期发生的"非洲猪瘟"事件相关舆情进行实证分析。研究表明:本文模型实现了对该事件网民情感倾向变化及舆情发展的合理预测,并提出科学的舆情干预和监管措施。研究将有助于揭示农产品安全网络舆情特征与演化规律,为网络舆情的有效监管提供参考。  相似文献   

11.
提出了一种基于商品评论的群体用户情感趋势预测方法.首先,提出了基于Boson NLP的情感特征词识别算法,对时间维度下的商品评论信息进行特征选取;其次,使用群体用户多维特征向量构造多层感知器(MLP)模型进行情感分析;最后,融合评论时间和用户情感倾向值构建群体用户时序情感倾向序列,并通过长短时记忆网络(LSTM)模型进行时序情感趋势预测.在大规模真实数据集上的实验结果表明,MLP模型具有较好的分类效果;相比于现有的自回归(AR)模型,LSTM模型的平均均方差降低了79. 06%,能够取得更加精准的预测结果.  相似文献   

12.
为对网络舆情数据进行主题挖掘与情感分析,以微博某单位招聘热点事件的舆情演变为研究对象,提出了一种融合主题模型和情感分析的LDA-Attention-BiLSTM模型。运用Python的Scrapy框架爬取该事件文本评论。采用隐含狄利克雷分布(LDA)模型实现了主题识别。使用基于注意力(Attention)机制的双向长短期记忆(BiLSTM)网络进行文本情感分析。研究结果表明,构建的基于LDA与Attention机制BiLSTM的混合模型能够反映舆情中的热点话题与情感时序变化,揭示事件爆发的主要原因,事件传播阶段的主要话题与事件的处理结果等。  相似文献   

13.
以创新旅游目的地评价方法为目的,基于旅游网络评论数据,从旅游目的地发展规模和质量两个维度构建旅游目的地关注度—满意度分析(ASA)模型.整合国内8大在线旅游平台评论数据,采集全国23 496个景点的1 368 052条有效评论,建立我国大陆31个省市自治区基础数据库.通过模型化和可视化的方法对省域旅游目的地发展水平进行分析,结果显示:1)网络旅游关注度呈现长尾和极化特征,约80%的在线旅游评论集中在10%的核心旅游景点;核心旅游景点空间聚集度呈现出由高到低的“东—中—西”格局;2)不同类型景点在网络关注度和满意度上均有明显差异,且游客对不同类型景点具有不同的正负面情感特征.基于上述特征分析,结合31个省市自治区ASA定位分析结果,提出了我国大陆31个省市自治区旅游发展优化路径.  相似文献   

14.
为了辨别在线评论的情感倾向,了解大众舆情对某一事件或产品的看法,采用层叠CRFs模型,把在线评论语句进行主客观分类、极性分类以及评论语句的褒贬强度分类,充分利用极性分类和褒贬强度分类之间的层次关系来改善情感分类的冗余关系,以期借助改进的条件随机场模型实现文本情感倾向及强度的分析,实现篇章级文本集的情感分析.  相似文献   

15.
随着旅游经济的到来,游客们更加关注旅游体验,本文采用BERT文本情感分析模型以及网络文本分析方法,以苏州拙政园景区为研究对象,爬取并整理携程网中游客对景区的评论信息.利用Python软件建立改进的BERT情感分析模型,训练集与测试集M值达0.94,同时针对负面评论信息使用社会和语义网络,分析游客的旅游体验特征,对景区存...  相似文献   

16.
游客在线评论反映了游客实地旅行之后关于旅游景点和服务的真实感受,本文构建了一个基于景点在线评论文本的游客关注度和情感分析方法。该方法首先从主流旅游网站的评论专区中获取景点的评论文本并进行预处理,然后基于《知网》词汇语义相似度,结合词频分析,通过构建"旅游形象属性-触发词"词表,分别计算评论信息中旅游形象属性的游客关注度。最后建立褒贬义情感词典,对处理后的评论文本情感分析。该方法能够直观显示景点在线评论信息中旅游形象的游客评论关注点和总体情感倾向,为潜在游客的景点选择提供参考依据。以厦门市旅游景点的评论文本为例,验证了该方法的可行性。  相似文献   

17.
提出一种微博平台上的产品评论情感倾向性分析方法,对特定语料库的产品特征词的词性进行分析,得到特征词的词性重要程度顺序;以情感词典识别的情感词为起点,提出一种依据词性重要程度的"特征观点对"识别规则,并依据该规则进行语义倾向的情感计算。实验结果表明,该方法在产品特征抽取及语义倾向的判断上具有较好的结果。结合微博的转发数和评论数,进行用户观点分析,计算用户对产品的认可度,挖掘产品属性的优缺点,实证分析证明这种方法的可行性。  相似文献   

18.
微博话题的情感分析是分析出微博话题中隐含的情感并实现对微博消息的分类,该研究可以帮助网络监管人员和政府机关人员针对网络舆情及时做出积极有效的决策。微博话题情感分析的核心任务是分析微博话题中每条微博消息的情感倾向。本文提出的中文微博话题的情感分析是在基础情感词典之上,通过提取并构建程度副词、网络用词和否定词等相关词典,实现对基础情感词典的扩充,最后通过权值计算得到微博消息的情感极值,达到对微博消息进行情感分类的目的。实验结果证明所提出的方法的有效性。  相似文献   

19.
本文首先利用基础情感词典以及基准词对所需研究领域的评论文本进行分析,以此获得特定领域具有感情倾向的特征词语。而后利用基准词以及获得的特征词语对评论进行分析,对于有感情词的句子,采用计算感情值来判别其感情倾向以及感情程度,对于无感情词的句子,采用连词的方法来进行感情的判别。实验结果表明,该方法能够对不同领域的评论得到较好的感情分类效果。  相似文献   

20.
针对文本情感分类中情感语义特征利用不足、特征降维效果欠佳等影响分类效果的问题,提出了一种通过扩展语义相似的情感词以及引入词语间统计特征的高精度网络评论情感分类方法.该方法利用神经网络Skip-gram模型生成词嵌入,通过词嵌入相似性度量将语义相似的词语扩展为情感特征;再利用词语间的统计特征进行特征降维;通过多个弱分器加权构建Adaboost分类模型实现网络评论情感分类.基于酒店评论和手机评论公开测试集进行实验,结果表明其情感分类的正确率分别达到90.96%和93.67%.方法扩展语义相似情感词有利于丰富文本情感语义特征,引入词语间的统计特征有更好的特征降维效果,可以进一步提升文本情感分类的效果.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号