首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
使用JST模型对中文新闻文本进行情感分析,相对于评论文本,新闻文本主观性比较弱,而且大多是长文本,会影响JST模型的分类性能.给出一种抽取情感主题句的方法,将抽取得到的情感主题句结合现有的JST模型对新闻文本的情感倾向进行了分析.实验表明,使用情感主题句进行情感分析,避免了与主题情感无关的句子对分析结果的影响,提高了分类准确率.  相似文献   

2.
当前全球疫情持续蔓延,周边国家疫情形势严峻,我国防范疫情输入压力不断加大,研究公众对新冠疫苗接种的关注点和情感倾向,对于采取有效措施提高新冠疫苗接种率和加快建立免疫屏障具有重要意义.基于综合性问答社区的回答文本,利用SnowNLP情感分析工具对情感值进行了计算,并将所有回答文本分类为积极和消极,再利用LDA主题模型分别挖掘了不同情感倾向用户回答的潜在主题,并确定了主题关键词,然后分别分析了不同情感倾向公众的关注点并提出了解决措施,指出大部分公众对新冠疫苗接种持积极态度,部分公众(占总样本的27.6%)对此持消极态度,且关注点在疫苗接种的必要性及疫苗的有效性、安全性等.  相似文献   

3.
当前全球疫情持续蔓延,周边国家疫情形势严峻,我国防范疫情输入压力不断加大,研究公众对新冠疫苗接种的关注点和情感倾向,对于采取有效措施提高新冠疫苗接种率和加快建立免疫屏障具有重要意义.基于综合性问答社区的回答文本,利用SnowNLP情感分析工具对情感值进行了计算,并将所有回答文本分类为积极和消极,再利用LDA主题模型分别挖掘了不同情感倾向用户回答的潜在主题,并确定了主题关键词,然后分别分析了不同情感倾向公众的关注点并提出了解决措施,指出大部分公众对新冠疫苗接种持积极态度,部分公众(占总样本的27.6%)对此持消极态度,且关注点在疫苗接种的必要性及疫苗的有效性、安全性等.  相似文献   

4.
本文结合网络虚拟社会中舆情检索的实际需求,提出了一种面向博客群的主题倾向性分析模型.针对博客主题评论篇幅长短不一的结构特点,模型采用不同的文本倾向性处理方法:对于较长篇幅评论文本,分别统计目标评论中赞同、反对字符的倾向字符权重及其分布密度;对于拥有少量文字的主题评论,通过计算评论中字符倾向权重之和,实现评论倾向性评估.实验中通过构建面向“网络文化”的博客主题测试集,对模型的主题评论倾向性计算方法以及语义检索能力进行验证评估.实验结果表明模型具有较好的文本倾向性识别能力.  相似文献   

5.
提出了一种基于LDA-Col模型的无监督主题情感混合(UTSU)模型。采用词序流对文本进行表示,对每个句子采样情感标签,对每个词采样主题标签,得到文本的主题情感分布。这种采样方式既符合语言的情感表达,又不会缩小词之间的主题联系,克服了ASUM模型和JST模型在同一层盘子中采样主题标签和情感标签的缺陷。实验表明,UTSU模型的情感分类性能比有监督的情感分类方法稍差,但在无监督的情感分类方法中效果最好,情感分类综合指标比ASUM模型提高了3%,比JST模型提高了17%。  相似文献   

6.
针对语义情感知识的文本情感分析的局限性,本文提出情感项区分极性可信度的文本情感分类方法.首先,基于核心谓词结构提取修饰主题的情感项.接着,利用改进的互信息方法计算情感项可信度,选取其中可信度前N的情感项.然后,利用改进的词频-逆向文件频率(TF-IDF)算法标记前N个情感项的正或负倾向符号.最后,基于基因表达式编程分类技术和谭松波博士提供的语料集,利用训练集训练分类模型,并使用测试集检验分类精度,实验结果表明本文提出的方法具有良好的效果.  相似文献   

7.
为了提高用户兴趣的提取精度,提出了一种基于情感词对的论坛用户兴趣提取方法.首先,以互信息作为评估标准,利用论坛版面主题与文本主题的相关性提取出文本中的特征.然后,在此基础上提取出文本中的情感词对,并参考语句情感倾向的计算方法计算情感词对中对应特征的情感倾向值.最后,在传统特征兴趣权重计算方法的基础上引入情感倾向值计算特征兴趣权重,以获取最终的用户兴趣.实验结果表明,与利用基于内容的兴趣提取方法获取到的兴趣相比,利用该方法获取到的兴趣在平均精度上提升了7.54%,在分级精度上也有明显的提升.  相似文献   

8.
为解决弱情感倾向语料影响文本情感分类的问题,提出基于全局语义学习的文本情感增强方法。首先设计语料划分方法,将语料划分为强情感倾向语料与弱情感倾向语料,然后,从文本处理全过程及整体语义学习的角度出发,构造均值抽取与最大值抽取的语义提取方式及文档信息向量,改进基于循环神经网络的变分自编码器的语义学习过程,并用于学习强情感倾向语料中文本的词语序列特征与语义特征。基于此,对弱情感倾向语料进行重构,实现情感增强目标,最后,将经过情感增强的语料替换掉原来的弱情感倾向语料,再进行情感分类模型的训练与测试。结果表明:提出的文本情感增强方法能够提升情感分类效果,并使得Bert分类器对IMDb影评数据集的情感分类精确率达到了93.03%。  相似文献   

9.
意见挖掘在企业智能分析、政府舆情分析等领域发挥着重要作用,为了充分挖掘主观性文本所蕴含的商业价值和社会价值,提出了一种基于情感主题模型的特征选择方法。该方法重点考察极性词及其共现现象,采用主题模型挖掘出正面褒义主题和负面贬义主题中极性词的分布情况,旨在度量情感特征在情感倾向表达中的重要性。实验阶段结合支持向量机分类器进行分析。实验表明该特征选择方法能有效提高跨领域文本情感分类准确性,具有较好的实用价值。  相似文献   

10.
维吾尔语是典型的资源稀缺型语言,由于词义消歧标注语料资源和语义分析工具的不足,导致传统的有监督方法难以实现.针对该问题,将篇章文本的词义消歧问题类比为文本主题分类问题,在LDA(latent Dirichlet allocation)主题模型的基础上提出了一种维吾尔语无监督词义消歧模型.为强化主题模型对歧义词语义项的分类性能,加入了3个数据预处理过程:去除停用词,过滤有效词和强化同义词词频权重.实验结果表明,在随机抽取的63组测试样本集中,该模型的词义消歧准确率达到65.08%,在篇章文本采样词任务中词义消歧准确率达到61.2%.  相似文献   

11.
将相关主题模型和神经网络相结合开展文本情感分析研究。首先,为了度量文本的主题相关程度,采用CTM模型对文本进行特征分割,得到主题与词之间的相关矩阵和文本句子的主题特征向量;其次,基于相关性理论,构造蕴含主题相关信息的词向量,采用word2vec模型进行文本词表示;最后,使用BiLSTM模型对文本句子进行表示,实现文本情感特征提取。  相似文献   

12.
针对观点检索问题,把主题检索和情感分析相结合,通过构造情感词典、程度词典等,利用SVM对文本进行主客观分类,构造正则表达式进行中文句式识别,提出了计算文本褒贬倾向的方法,结合主题相关性和情感强度计算置信度.在COAE2009的任务5-观点检索的评测中,取得了较好的结果.  相似文献   

13.
目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明:融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率.  相似文献   

14.
针对文本情感分类任务中,有情感标注的语料在不同语言中的不均衡问题,结合深度学习和迁移学习,提出一种基于对抗长短时记忆网络(ALSTM)的跨语言文本情感分类方法.设置双语各自独立的特征提取网络和共享特征提取网络,把获取到的特征拼接输入到分类器进行分类.在共享特征提取网络中,设置语言分类器,运用对抗思想优化模型,通过投票法决定文本最终的情感极性.实验表明:该方法可以取得跨语言文本情感分类任务更高的准确度.  相似文献   

15.
目前通过深度学习方法进行语言模型预训练是情感分析的主要方式,XLNet模型的提出解决了BERT模型上下游任务不一致的问题.在XLNet基础上增加LSTM网络层和Attention机制,提出XLNet-LSTM-Att情感分析优化模型,通过XLNet预训练模型获取包含上下文语义信息的特征向量,接着利用LSTM提取上下文相关特征,最后引入注意力机制根据特征重要程度赋予不同权重,再进行文本情感倾向性分析.仿真实验中将XLNet-LSTM-Att模型与5种常用的情感分析模型进行对比,结果表明提出的模型优于其他测试模型,模型的精准率达到89.29%.  相似文献   

16.
随着社交网络影响的不断增加,微博作为人类社会交流、发布观点信息的重要载体,其所包含的情感状态具有重要的研究意义。文章通过对微博文本及其包含的情感词汇的分析研究,引入神经网络语言模型和语义向量,结合心理学、情感计算领域相关知识,采用心理学PAD连续维度情感描述模型作为文本情感分析量化的基础,对微博文本所蕴含的情感状态进行分析研究,以获得更加精确的情感分析结果,达到情感分析的目的。同时实现了从个性角度的微博文本情感的可计算性。实验表明,所述方法能较好地提高微博文本情感分析的准确性和精确度,在不同主题不同情感特征中均能够得到很好的应用。  相似文献   

17.
基于大型预训练语言模型的有监督学习方法在可控文本生成任务上取得了优秀的成果,但这些研究都着重于控制生成文本的高级属性(比如情感与主题),而忽略了泛化性问题.现有的基于自监督学习的研究方法则通过句子级别的训练来使模型获得补全整句的能力,使模型做到单词和短语级别的控制生成,但生成与特定属性强相关句子的能力依旧待提升.所以本文提出了一种单词级别(细粒度)与句子(粗粒度)级别相结合的多粒度训练方式:单词级别的主题模型让模型学习主题层面的语义以获得主题到文本的生成能力,句子级别的自监督训练让模型学习整句的表征以获得补全句子的能力.通过主题模型与自监督学习的结合,使模型在单词与短语级别的可控生成阶段取得了更好的效果.实验表明,本文提出的模型在主题契合度以及常规文本生成指标方面优于现有的基线模型.  相似文献   

18.
用文本分类的方法找出中文评教信息的情感倾向,使学生主观评价里蕴含的信息得到有效利用,是对现有评教系统的必要补充.采用基于潜在语义分析的方法对文本向量降维,并用支持向量机的分类方法对目标文本进行分类,得到每一条主观评价的情感倾向.分析了特征选择、特征抽取方法、降维维数、词性、训练集合与测试集合样本的比例等几方面对分类的影响,找到了较好的中文评教文本分类模型.  相似文献   

19.
为了消除传统机器学习中分类方法的限制,提出一种基于主题模型与迁移学习的文本分类方法.将文本集合成由共同主题和特定主题所联合起来的混合模型;然后,通过这两类主题相关性推断出不同领域之间主题的映射关系;最后,融合共同主题以及映射后的特定主题形成一个新的特征空间,并在此特征空间中完成文本的分类.实验结果表明,相较于其他分类方...  相似文献   

20.
游客满意度已成为衡量、管理景区的重要指标.本文采用内容分析法,以网络评论作为研究样本,以山西省3处世界遗产地游客为研究对象,提出了一套包含8个主题的获取遗产旅游地游客满意度的方法.研究表明:(1)主题情感倾向在主题和景区之间均表现出明显差异.正面评价主要集中在总体评价、住宿、游览、交通、其他等主题方面;负面评价主要集中在娱乐、购物、餐饮,且同一主题不同景区的情感倾向也表现出差异.(2)三大遗产地满意度结果为:平遥古城总满意度为36.8,为不满意水平;云冈石窟总满意度为62.1,为满意水平;五台山总满意度为58.0,为一般满意水平;(3)提出提升游客满意度的4种对策及具体操作方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号