首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于文本语义和表情倾向的微博情感分析方法   总被引:1,自引:0,他引:1  
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。  相似文献   

2.
基于双重注意力模型的微博情感分析方法   总被引:1,自引:0,他引:1  
微博情感分析是获取微博用户观点的基础。该文针对现有大多数情感分析方法将深度学习模型与情感符号相剥离的现状,提出了一种基于双重注意力模型的微博情感分析方法。该方法利用现有的情感知识库构建了一个包含情感词、程度副词、否定词、微博表情符号和常用网络用语的微博情感符号库;采用双向长短记忆网络模型和全连接网络,分别对微博文本和文本中包含的情感符号进行编码;采用注意力模型分别构建微博文本和情感符号的语义表示,并将两者的语义表示进行融合,以构建微博文本的最终语义表示;基于所构建的语义表示对情感分类模型进行训练。该方法通过将注意力模型和情感符号相结合,有效增强了对微博文本情感语义的捕获能力,提高了微博情感分类的性能。基于自然语言处理与中文计算会议(NLPCC)微博情感测评公共数据集,对所提出的模型进行评测,结果表明:该模型在多个情感分类任务中都取得了最佳效果,相对于已知最好的模型,在2013年的数据集上,宏平均和微平均的F1值分别提升了1.39%和1.26%,在2014年的数据集上,宏平均和微平均的F1值分别提升了2.02%和2.21%。  相似文献   

3.
提出一种微博平台上的产品评论情感倾向性分析方法,对特定语料库的产品特征词的词性进行分析,得到特征词的词性重要程度顺序;以情感词典识别的情感词为起点,提出一种依据词性重要程度的"特征观点对"识别规则,并依据该规则进行语义倾向的情感计算。实验结果表明,该方法在产品特征抽取及语义倾向的判断上具有较好的结果。结合微博的转发数和评论数,进行用户观点分析,计算用户对产品的认可度,挖掘产品属性的优缺点,实证分析证明这种方法的可行性。  相似文献   

4.
游客微博主题情感分析方法比较研究   总被引:2,自引:0,他引:2  
针对饮食、娱乐、购物、景观、交通和住宿6个旅游主题, 基于机器学习方法, 开展游客微博主题情感分析方法比较研究。以人工标注的53140条赴日游客微博为数据基础, 应用两种机器学习模型开展建模实验, 并分析不同特征对建模效果的影响。实验结果显示, 两种模型的建模效果良好, 适用于游客微博主题情感分析, 其中最大熵模型效果略优于支持向量机。研究还表明, 在词特征的基础上引入表情符号和主题词进行特征扩展, 可以提高模型的建模效果。  相似文献   

5.
由于社交媒体的普及和灵活性,微博中涌现出越来越多的新词来表达情感态度,新词的发现和情感倾向已成为微博研究的热点问题。主要介绍COAE2014评测任务3的方法与技术。首先提出了一个广义后缀树的词串抽取方法,利用左右灵活度等指标发现潜在新词。然后根据上下文信息对前一步发现的潜在新词采用多重词典,基于模板,统计情感词共现手段判断其情感倾向。最后利用搜索引擎从语义角度进一步优化情感倾向结果。实验结果表明此方法对新词发现和情感倾向判断问题是有效的。  相似文献   

6.
7.
当前中文微博情感分析的主流做法是将情感极性分类结果的好坏作为评判的标准。从提高微博情感判别准确度的目的出发,尽量多考虑影响微博情感的元素。在统计微博中情感词的基础上,加入了微博表情这一重要元素,采用与文本情感值加权的方式参与微博情感计算,使得对含有表情的微博情感判定结果有了一定程度的提高;在语义规则部分,基本涵盖了汉语中最常用的几种句型规则和句间关系规则,使得对复杂语句的情感分析更加准确。同时,还对每条微博的情感给出了具体的数值,并在正确率、召回率、F 值的基础上,提出合格率这一指标,对微博情感判别方法得到的数值准确性进行评价。通过搭建 Hadoop 平台对测试集的1万条数据进行测试,验证了融合算法的有效性。  相似文献   

8.
微博的使用人群数量基数大,状态信息更新频繁并且信息传播迅速,因此对微博平台上信息的挖掘具有重要意义,但是由于微博数据的海量性、突发性以及微博格式的不规则性,加大了采集数据的技术难度.在分析对比了基于Cookie爬虫微博数据采集方法和基于API接口微博数据采集方法的基础上,提出了一种基于用户影响力的微博用户信息采集方案.将每一个API调用封装成一个Task类嵌入到具有模拟登陆功能的爬虫程序中,通过贝叶斯-Pagerank算法量化微博用户之间的关注关系得到用户的影响力值,依据用户影响力值决定爬取顺序,可以在有限的时间内采集到更多有价值的节点信息.实验结果表明该方案在微博数据采集的效率与性能上都有较大提高.  相似文献   

9.
研究微博用户转发行为,预测微博转发概率,确定影响微博转发概率的因素,在热点挖掘、产品营销、舆情监控、谣言控制等方面有重要的现实意义.本文介绍了影响微博转发的用户特征,其中比较典型的有用户影响力、粉丝平均标签数、粉丝活跃度等特征.通过粉丝数-关注数算法、用户标签数算法、粉丝活跃度算法等分析了它们与微博转发之间的关联关系,并确定各个属性的阈值,这些阈值对微博转发预测起到了至关重要的作用.  相似文献   

10.
信息传播和用户影响力度量是目前微博研究的基础和热点方向。为了定量地研究用户影响力,提出基于用户消息传播范围的用户影响力量化定义,并给出用户影响力的计算方法。在真实数据集上对算法的验证结果显示,与其他用户影响力度量方法相比,本文提出的方法计算复杂性低、指标稳定性高,尤其适合于需要限定数据集、限定时间段的具体应用场景。  相似文献   

11.
用户画像是一个人的虚拟表示,它是基于一系列数据的模型.基于手机感知数据从年龄、性别和人格特征三方面构建用户画像.通过使用手机中的传感器和事件监听器来采集滑屏解锁场景、手机基本信息、应用程序使用情况和屏幕状态场景中的数据.此外,随机森林回归和随机森林分类模型分别用于估计年龄和检测用户的性别.支持向量回归机(support vector regression,SVR)算法用于识别人格特征.通过84个用户进行实验来评估该模型.实验结果表明,我们的方法在年龄估计中的均方根误差为4. 369,在性别检测中实现了91. 70%的精度.对于人格特征的识别,开放性、尽责性、外倾性,宜人性和神经质的均方根误差分别为0. 290、0. 351、0. 465、0. 302和0. 452.  相似文献   

12.
针对在微博情感分析中没有有效地构造情感词典的方法问题,提出基于《同义词词林》和微博检索系统的情感词典的构造方法。利用《同义词词林》对4部基础情感词典进行扩展形成一部情感词典,利用点互信息(PMI)公式计算情感词语的情感倾向值。针对情感分析中特征选择的问题,利用不同的特征组合通过对比实验选取了有效的特征组合。实验证明,构造的情感词典和选择的特征组合有效,能够明显提高微博情感分析的质量。  相似文献   

13.
提出了一种基于卷积神经网络的用户感知评估建模方法,充分利用产品使用数据来定量地建立用户感知评估和产品性能参数之间的映射关系,以支持产品设计改进.首先,利用滑动窗口技术将时间序列形式的使用数据转换为一系列数据单元,并在此基础上建立适用于用户感知评估模型的卷积神经网络结构;然后,通过K-折交叉验证分析确定模型的最优超参数并改善模型的过拟合问题;最后,以智能手机用户感知建模为例验证了方法的有效性.结果表明,所提出的方法能够自动从使用数据中提取出有效特征,用于用户感知评估预测,减少了建模过程中对用户和设计师的依赖,可以帮助设计师及时准确地评估产品表现,为产品设计改进提供决策支持.  相似文献   

14.
程松 《科技信息》2012,(18):283-283,285
文章从WCDMA与2G异系统邻区、切换、重选、WCDMA质量优化以及WCDMA PS业务掉线五个方面阐述了基于用户感知的WCDMA优化思路。  相似文献   

15.
提出了一种基于能效的用户选择协作频谱感知方案.该方案中只有一个认知用户将其本地检测结果进行广播,其他具有不同决策的认知用户上报给融合中心,而同意的认知用户将保持静默;因此,融合中心将得到所有认知用户的感知结果,并做出全局决策.本研究的融合中心也具有感知能力,让其进行初步决策从而避免不必要的感知过程,并通过结合感知历史信息改进了广播用户的选择,使能量效率最大化.仿真和分析结果表明:本文方案在不影响检测概率的情况下提高了能量效率,并减少系统平均检测时间.  相似文献   

16.
微博短文本蕴含着较为丰富的情感信息,基于微博数据的情感分析已成为网络舆情监测的重要任务。为提高中文微博情感分类效果,提出一种基于粒子群优化(PSO)的长短期记忆(LSTM)模型(PSO-LSTM),该模型在LSTM模型的基础上进行了参数优化,能够更有效获取微博信息。实验以新冠肺炎疫情期间的微博数据集构建PSO-LSTM模型,与其它模型进行了比对实验。实验结果表明,PSO-LSTM模型能够有效提升中文微博情感分类的性能。  相似文献   

17.
微博的兴起与传播使得短文本情感分类成为目前的热门研究领域。通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法。首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息。经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩。  相似文献   

18.
从海量微博数据中分析公众对某一社会事件的情感倾向具有重要研究意义,而海量微博文本稀疏规模庞大,导致传统方法处理这一任务时面临诸多挑战.提出一种基于主题聚类的海量微博情感分析方法.首先基于高质量微博数据挖掘频繁项集,设定语义相关阈值,筛选重要频繁项集进行谱聚类,得到主题关键词.基于主题关键词对海量微博数据依据语义相关度归类,最后结合情感词典对每类中的微博检索主题关键词前后修饰距离内情感词及否定词,结合表情符号计算微博情感值.在百万规模中文微博上进行实验,证明该方法能准确按主题归类且能有效在该主题上进行情感分类.  相似文献   

19.
微博作为电子口碑的重要载体,极大影响了消费者的购买决策和商家的产品销售.为此,以新浪微博为平台,研究从微博中挖掘情感信息并利用这些信息对产品销售进行预测的方法.分析影响微博评论的因素,基于已构建的情感本体,建立微博中情感计算方法.然后在传统自回归模型的基础上融入情感因素,提出自回归情感预测模型用于产品销量的预测.对电影数据集进行了广泛地实验,分析参数选择,并与其它预测模型进行比较,实验证实我们提出的方法的有效性.  相似文献   

20.
目的地旅游形象在吸引潜在游客、提升目的地竞争力上发挥着重要作用.该文通过采集游客在西安发布的微博数据,运用内容分析法和ROST词频分析软件深入分析了国内游客对西安旅游形象的感知及其影响因素.研究发现游客对西安旅游形象感知集中在代表性景区,整体形象感知,游客情绪等.整体上游客对西安旅游形象感知良好,但也存在负面感知,其关键影响因素表现在天气、交通、景区人多等方面.运用微博数据对西安旅游形象感知进行系统研究有助于相关管理部门明确西安旅游形象的定位以及针对性地实施旅游形象提升工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号