首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

2.
针对微博短文本提出一种将微博主题与微博情感进行协同分析的方法,利用云南省主流微博媒体数据,研究重大突发公共卫生事件情境下的民众情感极性特征,有助于舆情监测和舆论引导。利用高频词分析研究时间窗口内微博热点主题词,然后训练基于SnowNLP的情感分类模型预测微博情感极性,综合微博信息影响力强度利用隐含狄利克雷分布(LDA)主题模型建模,结合每日疫情实时通报,分析微博情感随时间序列变化趋势。研究发现新冠肺炎疫情爆发以来,多数微博呈现极端正面情感,且微博情感分类结果具有一定的时间聚集性,舆情情感会随公众聚焦事件出现反转,须加以有效引导。  相似文献   

3.
针对传统情感分析方法对微博短文本应用效果不佳的问题,提出将文本情感特征与深度学习模型融合的微博情感分析新机制.通过词向量计算文本的语义特征,结合基于表情字符的情感特征,利用卷积神经网络挖掘特征集合与情感标签间的深层次关联,训练情感分类器.实验结果表明,相比基于词典的机器学习模型,该机制将情感分析准确率与F度量分别相对提升21.29%和19.20%.该机制结合语义和情感特征,利用卷积神经网络的抽象特征提取能力,改善微博短文本的情感分析精度.  相似文献   

4.
针对微博短文本存在的特征提取困难及微博谣言传播浪费网络资源的问题,提出了基于主题和预防模型的微博谣言检测.对微博进行主题提取,按主题分类后提取基于用户、传播结构、内容三方面的统计特征.将样本与官方谣言子集中的微博进行相似度计算,将其值与传统特征进行特征融合之后作为统计特征进入有监督的机器学习.实验结果表明,相对于传统的有监督机器学习,该方法将微博谣言检测的性能提升了3%左右,同时实现了谣言预防.  相似文献   

5.
提出1种基于卷积神经网络的多维特征微博情感分析新机制;利用词向量计算文本的语义特征,结合基于表情字符的情感特征,利用卷积神经网络挖掘特征集合与情感标签间的深层次关联,训练情感分类器;结合微博文本的语义和情感特征,同时利用卷积神经网络的抽象特征提取能力,进而改善情感分析性能。研究结果表明:引入表情字符的情感特征模型可使情感分析准确率提高2.62%;相比基于词典的机器学习模型,新机制将情感分析准确率与F度量分别提升21.29%和19.20%。  相似文献   

6.
情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。  相似文献   

7.
针对现有文本情感分析方法的不足,设计了一种针对中文微博的基于词典的规则情感分类方法和用于机器学习方法的基本特征模板。提出一种机器学习与规则相融合的微博情感分类方法,将用规则方法得到的多样化情感信息进行转化,扩展并嵌入基本特征模板,形成更有效的融合特征模板。通过3种分类模型集成,提高微博情感分类的性能。  相似文献   

8.
传统的文本情感分析主要基于情感词典、机器学习以及传统的神经网络模型等实现特征的提取及情感的分类,但由于语料简短及特征稀疏,使得这类情感分析方法取得的效果不理想。因此,提出采用基于Self-Attention机制的卷积神经网络(CNN)和双向长短时记忆网络(BI-LSTM)相结合的模型结构(SCBILSTM模型)对微博文本进行情感分析,SCBILSTM利用双向循环神经网络对文本上下文进行特征提取,并利用CNN进行局部特征提取,在此基础上添加自注意力机制,在通过网络爬虫抓取的微博数据集上和其他模型进行对比实验,验证本文中所提出的模型有效提升了文本分类的准确率。  相似文献   

9.
该文主要针对中文微博的细粒度情绪识别技术中的关键技术展开研究,分析了中文微博的研究难点和微博情感表达特征,提出了一种微博文本情绪显性特征的多策略集成分析法。最后实验组以新浪微博中某一主题为实验数据,对"乔任梁去世"事件这一热点话题的评论文本数据集进行分析,验证了该文的微博情感分析能力,同时还将情感分析结果进行了可视化展示。  相似文献   

10.
探讨中文情感分析的问题,设计了一个基于Python的机器学习情感分析方法。该方法首先使用连续词袋(CBOW)模型来捕获单词的语义特征,并将单词转换为高维向量。然后,使用堆叠式双向长短记忆(SBLSTM)神经网络对单词向量进行特征提取。接下来应用二元分类器通过语义和上下文特征来进行情感预测分析。最后,采用从新浪微博收集的真实数据集进行实验。实验结果表明,本方法比现有的机器学习模型具有更好的性能。  相似文献   

11.
显示地导出了一类连续时间参数隐马尔科夫模型-马尔科夫调制泊松点过程(MMPP)的熵率和相互信息率.模拟研究表明这类隐马尔科夫模型参数的最大似然估计的精度和效与观测过程和隐过程之间的相互信息率密切相关.一般地,相互信息率可作为MMPP中各个混合分量广义距离(或差别性)的一个度量.  相似文献   

12.
基于统计的自然语言处理模型采用统计方法进行自然语言建模,实际应用过程中可根据具体情况在多种模型中选择适当的模型,本文简要介绍了N-gram模型和最大熵模型,并给出了几种参数估计和数据平滑方法,为自然语言建模提供了一定的参考。  相似文献   

13.
基于最大熵原理的水环境模糊优化评价模型   总被引:6,自引:0,他引:6  
基于最大熵原理,应用工程模糊集理论中的相对隶属度等概念,综合考虑水环境评价的随机性和模糊性,定义了不同的加权广义权距离来表征待评价水样与水质标准的差异,建立了两个水环境相对隶属度模糊优化评价模型,我12个有代表性的湖库营养化评价实例表明:所建模型的评价结果基本一致,与调查结果相符,对比单一考虑模糊性的模型,所建两个模型评价结果的描述要细胞一致,且具有较小的Shannon熵,即此次评价的不确定性小。  相似文献   

14.
传统股价预测模型往往只考虑时序性数据且局限于模型自身机制,而忽略舆情对股价的影响,导致预测精度不高,针对该问题,提出基于 Bert 股吧舆情分析的特征融合预测模型对股价收盘价进行涨跌幅预测。 首先,采用Bert 自然语言处理对股吧舆情以及公司公告政策进行情感分类,并转化为虚拟变量,构建金融舆情情感特征库;然后将金融舆情特征库和时序性数据合并构建特征融合矩阵;最后输入长短期记忆网络模型(LSTM)进行股价收盘价预测,并得出股价的涨跌结果。 以华银电力(600744. SH)为例进行实证分析,实验结果表明:引入股票情感特征后的模型,得到的股价走势准确率上升了 8. 63%,预测收盘价的回归指标 FMAPE FRMSE 分别下降了 23. 59%、22. 9%,R2 提高了 8. 11%,证明引入新的舆情情感特征在实际预测中能提高股价预测的准确率,可以作为精准预测股价走势的手段。  相似文献   

15.
针对现有多模态情感分析模型对模态交互问题的忽视导致其性能受限的问题,提出一种基于模态时序列耦合与交互式多头注意力的多模态情感分析模型(MC-CA)。利用仿射变换耦合模态的情感信息和时序信息,使用交互式多头注意力机制获取模态间的交互信息,利用多通道情感预测方法综合全局与局部信息实现多模态协同训练。在多个公开数据集上的实验结果表明,该模型能够建立多模态数据之间的交互,在多模态情感分析任务中取得优异的性能。  相似文献   

16.
针对传统在线评论情感分类忽视了用户个性化的问题,提出了一种融合用户个性化特征的在线评论情感分类(PORSC)方法,该方法为每一类型用户构建一个在线评论情感分类器.PORSC模型由2部分构成:一部分是具有学习评论中常见情感信息的全局情感分类模型;另一部分是能捕捉每种类型用户的个性化特征的特定用户类型分类模型.为解决PORSC模型在训练中的数据稀疏问题,引入多任务学习方法,以协同方式训练分类器,以并行方式解决了PORSC模型中参数的优化问题.通过在2个实际中文产品评论数据集和一个公开的英文评论数据集上实验,并与已有基线方法进行比较与综合分析,结果表明PORSC模型在一定程度上提高了在线评论情感分类的精度.  相似文献   

17.
一种改进的最大熵方法在船舶辐射噪声盲分离中的应用   总被引:1,自引:0,他引:1  
孔薇  杨杰  周越 《上海交通大学学报》2004,38(12):1962-1965,1971
对于船舶辐射噪声信号的盲信号分离(BSS)问题,由于常用的最小互信息(MMI)方法需要估计输出信号的高阶累积量,这对于非高斯、非平稳的船舶辐射噪声来说信号估计的精度将会降低.为此,本文验证了最大熵(ME)方法在处理此类复杂信号时能作为最佳对比函数的条件,并在此基础上用高斯混合模型来估计信号的概率分布,提高了信号概率密度估计的精度;同时在算法的迭代过程中使用自然梯度下降法代替随机梯度下降法,提高了算法的收敛速度.通过对船舶辐射噪声信号的盲分离实验,证明了此分离算法是有效的.  相似文献   

18.
主要介绍如何建立最大熵模型以及应用最大熵模型实现垃圾邮件过滤的基本原理和方法.  相似文献   

19.
针对目前情感分析中的循环神经网络模型缺乏对情感词的关注的问题,提出一种基于循环神经网络的情感词注意力模型,通过引入注意力机制,在情感分类时着重考虑文本中的情感词的影响.在NLPCC 2014情感分析数据集及IMDB影评数据集上进行试验,结果表明:该模型能够提高情感分析的效果.  相似文献   

20.
本文对车削加工中刀具磨损时声发射信号的谱特征进行了试验研究,运用FFT和ME方法获得了AE信号的谱阵图.分析表明,刀具磨损量与功率谱主峰值具有相应的依存关系;对于相同条件下测得的加速度、声响信号的谱阵图分析,亦得到相类似的变化规律;运用AE信号的谱分析方法,是探寻刀具磨损评估参数的重要途径之一.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号