期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

柴变芳杨蕾王建岭李仁玲《河北大学学报(自然科学版)》2021,41(2):201

融合卷积神经网络(convolutional neural network,CNN)和双向长短期记忆网络(Bi-directional long short-term memory,BiLSTM)的情感分析模型(CNN_BiLSTM)是一个流行的模型,其学习文本的局部特征和全局特征实现情感分类,但是忽略了特征对分类结果的重要程度,且没充分利用词语间的特征,导致分类准确率不高.提出一种集成基于多卷积核的卷积神经网络和注意力双向长短期记忆网络特征的文本情感分类方法(MCNN_Att-BiLSTM),其集成局部和全局的重要特征作为文本语义特征,该特征进而用于训练文本情感分类器XGBoost(eXtreme gradient Boosting).该方法基于注意力机制的BiLSTM提取对分类影响大的全局关键特征,基于多卷积核的CNN获得更全面的词语间特征,为集成分类器准备了有效分类的特征.实验结果表明,该模型具有更好的情感分类准确率,与CNN_BiLSTM模型相比,在IMDB数据集上准确率提升了1.75%,在txt-sentoken数据集上准确率提升了1.67%,在谭松波-酒店评论数据集上准确率提升了3.81%. 相似文献

2.

基于Word2vec和多分类器的影评情感分类方法

王学贺赵华《宁夏大学学报(自然科学版)》2019,(2):141-144

针对影评数据的情感分析,提出基于Word2vec和多分类器的情感分类方法.首先在对评论数据进行预处理的基础上,训练Word2vec模型,将词表示为词向量;其次结合随机森林和朴素贝叶斯多项式模型完成影评数据的情感分类;最后在Kaggle竞赛公开的影评数据集上进行实验.结果表明,Word2vec可有效捕捉词的语义,显著提高情感分类算法的性能. 相似文献

3.

基于多特征融合的中文评论情感分类算法

《河北大学学报(自然科学版)》2015,(6)

为解决情感分类中词间的语义关系难以表达和分析的问题,提出了一种基于词向量(word representation)和支持向量机(support vector machine)的情感分类算法,对电子商务在线评论的情感分类问题进行研究.首先使用word2vec聚类相似特征,然后使用word2vec和SVM对情感数据进行训练和分类,并分别使用基于词特征和基于词性标注的方法进行特征选择.在京东评论数据上进行的实验结果表明,与现有方法相比,分类准确率和召回率得到了提高. 相似文献

4.

基于双通道融合和BiLSTM-attention的评论文本情感分类算法

颜礼蓉朱小栋陈曦《上海理工大学学报》2021,43(6):597-605

对在线商业评论文本的情感进行挖掘,融合评论文本不同特征为分类器提供更多的信息量,提出了一种新的在线电商情感分类算法。首先,针对传统词嵌入模型无法很好地融合词语情感信息特征的不足,考虑了词嵌入特征和词性特征的多特征融合方法;其次,在两种特征融合方法的基础上采用了双通道和单通道的对比来比较分类的准确性,提出了并行的CNN和BiLSTM-Attention双通道神经网络模型;最后,使用真实的京东电商评论数据集对所提模型进行了评估,并且在实验中与不同分类算法进行对比。实验结果表明,新的混合方法具有更好的分类准确率、召回率和F1指标。相似文献

5.

基于双通道融合和BiLSTM-attention的评论文本情感分类算法

颜礼蓉朱小栋陈曦《上海理工大学学报》2021,1(1):597-605

对在线商业评论文本的情感进行挖掘,融合评论文本不同特征为分类器提供更多的信息量,提出了一种新的在线电商情感分类算法。首先,针对传统词嵌入模型无法很好地融合词语情感信息特征的不足,考虑了词嵌入特征和词性特征的多特征融合方法;其次,在两种特征融合方法的基础上采用了双通道和单通道的对比来比较分类的准确性,提出了并行的CNN和BiLSTM-Attention双通道神经网络模型;最后,使用真实的京东电商评论数据集对所提模型进行了评估,并且在实验中与不同分类算法进行对比。实验结果表明,新的混合方法具有更好的分类准确率、召回率和F1指标。相似文献

6.

基于双层堆叠分类模型的水军评论检测

廖祥文徐阳魏晶晶杨定达陈国龙《山东大学学报(理学版)》2019,54(7):57-67

对于水军评论检测问题,已有方法在提取用户行为关系以及通过神经网络提取特征时复杂度过大,同时由于网络评论属于短文本类,其书写的不规范会导致训练过程中文本特征提取困难;另外,已有方法对数据集不平衡分布情况考虑不足。为此,提出了一种基于双层堆叠分类模型的水军评论检测方法。首先通过三元组形式构造矩阵表示用户间关系,并通过主成分分析得到低维用户关系表示,以此刻画用户在评论数据中的行为差异并且降低计算的复杂度;然后,通过评论的段落向量表示以及计算离散型特征(包括文本相似度、信息熵等)解决文本特征难以提取的问题;最后将三者相联结作为融合文本与行为特征的整体特征表示。利用集成学习的方法构造双层堆叠分类模型对评论分类,以提升模型在非平衡数据集下的检测性能。实验采用Yelp2013评论数据集,结果表明,与目前最好的基准方法对比, F₁值提高了1.7%~5.2%,在非平衡数据集中提升尤为明显。相似文献

7.

TAN分类器及其应用

邓甦付长贺《沈阳师范大学学报(自然科学版)》2007,25(2):150-152

主要介绍了贝叶斯网络分类器中的TAN分类器的模型、构造方法及分类方法.通过对参加2006年6月大学英语四级考试同学的学习情况及考试成绩的问卷调查获得数据,采用Hold-out检测方法,即取出其中2/3的数据集作为训练集,另外1/3数据集作为测试集,构造TAN分类器,检验分类器的分类效果.并通过与朴素贝叶斯分类器分类效果的对比实验,证明TAN分类器是分类效果较好的分类器. 相似文献

8.

基于公共特征空间的自适应情感分类

洪文兴杞坚玮王玮玮郑晓晴翁洋《天津大学学报(自然科学与工程技术版)》2019,(6)

针对情感分类这一项从文章或句子中得到观点态度的任务,常规情感分类模型大多需要耗费大量人力获取标注数据.为解决某些领域缺乏标注数据,且其他领域分类器无法在目标领域直接使用的现状,设计了一种新颖的基于构建公共特征空间方法,使分类模型可从有标注领域向无标注领域进行迁移适应,减少人工标注的成本开销,实现情感分类的领域自适应.该方法以大规模语料下预训练的词向量信息作为以词为元素的特征,在同种语言中表达情感所采用的句法结构相似这一假设前提下,通过对领域内特有的领域特征词进行替换的方式构建有标注数据集与无标注数据集基本共有的公共特征空间,使有标注数据集与无标注数据集实现信息共享.以此为基础借助深度学习中卷积神经网络采用不同尺寸卷积核对词语不同范围的上下文特征进行抽取学习,进而采用半监督学习与微调学习相结合的方式从有标注数据集向未标注数据集开展领域自适应.在来自京东与携程共5个领域的真实电商数据集上进行实验,分别研究了领域特征词选择方法及其词性约束对领域间适应能力的影响,结果表明:相较于不采用领域适应的模型,可提升平均2.7%的准确率;且在来自亚马逊电商的公开数据集实验中,通过与现有方法进行对比,验证了该方法的有效性. 相似文献

9.

基于朴素贝叶斯降噪的协同过滤算法

邓立国何明训《沈阳师范大学学报(自然科学版)》2019,(1)

协同过滤作为推荐系统中应用最为广泛的推荐算法,在如今信息时代的个性化推荐中占据了重要的地位。但是用来进行协同过滤推荐的初始评分数据集中,蕴含着大量的垃圾评分和无效信息。这些噪音数据始终影响着推荐结果的准确性。为了解决垃圾评分带来的推荐误差问题,提出用朴素贝叶斯算法来对数据集中的垃圾评分和无效信息进行数据降噪处理。朴素贝叶斯算法通过构建贝叶斯分类器的训练模型来计算待分类评论为垃圾评论的概率,和为正常评论的概率,并加以比较,来判断是否为垃圾评论。使用除去垃圾评论干扰的数据集进行基于项目的协同过滤推荐。实验结果证明这种方法能有效地满足不同用户、不同偏好的个性化推荐,同时具有更高的推荐精准度。相似文献

10.

用于微阵列数据癌症分类的演化硬件多分类器 总被引：1，自引：0，他引：1

王进陈文冉仟元李钟浩《江苏大学学报(自然科学版)》2013,34(4)

针对单分类器识别率低、稳定性差的问题,提出了一种用于微阵列数据分类的演化硬件多分类器选择性集成方法.首先把经过预处理的原始训练集随机划分为训练集和验证集;然后通过对训练集的学习获得基于演化硬件的基分类器;再用验证集评价基分类器的性能,选择其中一部分较好的基分类器组成最终的分类系统;最后用独立的测试集验证系统的性能.试验结果表明,对急性白血病和结肠癌数据集的识别率分别为95.42％、88.33％,与其他的模式识别方法具有可比性;同时在识别率相当的情况下,该方法的硬件代价远低于全集成的演化硬件多分类器. 相似文献

11.

融合图卷积神经网络的文本情感分类

阴爱英林建洲吴运兵廖祥文《山东大学学报(理学版)》2021,56(11):15-23

文档级别情感分类旨在预测用户对评论文本的情感极性标签。最近研究发现,利用用户和产品信息能有效地提升情感分类性能,然而,现有大多数研究只关注用户与评论、产品与评论的信息,忽略了用户与用户、产品与产品之间的内在关联,因此,本文提出一种融合图卷积神经网络的文本情感分类模型。首先,根据数据集构建了用户与用户关系图、用户与产品关系图;然后,融合两种关系图形成异质图,并使用图卷积神经网络学习用户与用户、产品与产品之间的内在联系,获得更好的用户和产品表示;最后,使用融合CNN的用户注意力和产品注意力机制的分层网络进行情感分类。实验结果表明,在公开数据集IMDB、Yelp2013和Yelp2014上,本文提出的模型能取得较好的分类效果。相似文献

12.

扩展语义相似情感词的文本情感分类方法

罗森林毛焱颖潘丽敏陈倩柔魏超《北京理工大学学报》2018,38(11):1156-1162,1176

针对文本情感分类中情感语义特征利用不足、特征降维效果欠佳等影响分类效果的问题,提出了一种通过扩展语义相似的情感词以及引入词语间统计特征的高精度网络评论情感分类方法.该方法利用神经网络Skip-gram模型生成词嵌入,通过词嵌入相似性度量将语义相似的词语扩展为情感特征;再利用词语间的统计特征进行特征降维;通过多个弱分器加权构建Adaboost分类模型实现网络评论情感分类.基于酒店评论和手机评论公开测试集进行实验,结果表明其情感分类的正确率分别达到90.96%和93.67%.方法扩展语义相似情感词有利于丰富文本情感语义特征,引入词语间的统计特征有更好的特征降维效果,可以进一步提升文本情感分类的效果. 相似文献

13.

基于特征加权词向量的在线医疗评论情感分析

高慧颖公孟秋刘嘉唯《北京理工大学学报》2021,41(9):999-1005

针对在线医疗评论文本具有行业专业性强、差异性大、不够规范等特点,提出一种基于特征加权词向量的在线医疗评论情感分析方法.利用Word2vec方法构建词向量模型,抽取情感词集合完善医疗服务领域情感词典,根据句法关系识别主题词与情感词的依存关系,引入期望交叉熵因子,建立特征加权词向量模型,分析在线医疗评论的情感倾向.实验结果表明扩充的医疗服务情感词典在分析性能上的准确率、召回率以及F₁值均高于基础情感词典,引入期望交叉熵因子后,基于特征加权词向量的情感分析方法在SVM分类上表现出更好的效果,体现了其在在线医疗评论挖掘领域的良好效用. 相似文献

14.

融合ChineseBERT和双向注意力流的中文商品评论方面情感分析

胡晓丽张于贤黄思睿《广西科学》2023,30(1):187-195

准确分类电商平台中用户评论所包含的多个方面的情感极性，能够提升购买决策的有效性。为此，提出一种融合ChineseBERT和双向注意力流(Bidirectional Attention Flow,BiDAF)的中文商品评论方面情感分析模型。首先，通过融合拼音与字形的ChineseBERT预训练语言模型获得评论文本和方面文本的词嵌入，并采用从位置编码和内存压缩注意力两个方面改进的Transformer来表征评论文本和方面文本的语义信息。然后，使用双向注意力流学习评论文本与方面文本的关系，找出评论文本和方面文本中关键信息所对应的词语。最后，将Transformer和双向注意力流的输出同时输入到多层感知机(Multilayer Perceptron,MLP)中，进行信息级联和情感极性的分类输出。测试结果表明，提出的模型在两个数据集上的准确率分别为82.90%和71.08%，F1分数分别为82.81%和70.98%。相似文献

15.

An Empirical Study of Unsupervised Sentiment Classification of Chinese Reviews

Zhongwu Zhai Hua Xu Peifa Jia 《清华大学学报》2010,15(6):702-708

This paper is an empirical study of unsupervised sentiment classification of Chinese reviews. The focus is on exploring the ways to improve the performance of the unsupervised sentiment classification based on limited existing sentiment resources in Chinese. On the one hand, all available Chinese sentiment lexicons — individual and combined — are evaluated under our proposed framework. On the other hand, the domain dependent sentiment noise words are identified and removed using unlabeled data, to improve the classification performance. To the best of our knowledge, this is the first such attempt. Experiments have been conducted on three open datasets in two domains, and the results show that the proposed algorithm for sentiment noise words removal can improve the classification performance significantly. 相似文献

16.

基于双向情感分析的实时性音乐推荐系统设计

毋亚男刘德然许小可《大连民族学院学报》2017,19(1):76-79

目前的音乐推荐系统,一般采用基于个体兴趣的推荐方法,这种方式虽然能满足大部分情景下的用户需求,但无法感知到用户实时性的心情变化。考虑到不同情绪状态下用户对于音乐的需求往往也会发生改变,提出一种基于双向情感分析的算法并构建了实际系统,实时分析用户的情感需求来进行音乐推荐。一方面基于音乐在频域的梅尔倒谱系数构建特征分类器完成歌曲的情感分类;另一方面通过获取用户在社交网络中的实时文本信息,基于自然语言理解分析出用户当前的情感需求,最终为用户产生音乐推荐列表,实现基于情境感知的实时音乐推荐。实验表明,使用该个性化推荐算法具有更高的准确性,用户群体可以获得更为满意的用户体验。相似文献

17.

基于At-LSTM的产品创新特征识别

闫康黄训江张强王登《东北大学学报(自然科学版)》2022,43(10):1506-1512

针对在线评论信息挖掘领域，既有研究尚存在上下文信息缺乏、重要内容捕获不足、噪音大、多是文本级粗粒度情感分析等问题，设计了基于注意力机制的LSTM(long short term memory)产品创新特征识别流程框架模型.通过有用性评论的筛选、特征词库和情感词库的构建、At-LSTM情感分析模型的构建及细粒度特征情感与Kano模型的结合，为企业产品的创新改进提供了明确方向.京东、淘宝购物平台有关智能手机评论的实验表明，At-LSTM模型的准确率、精确率和召回率分别为91.52%，91.73%，91.53%，相较KNN，NB，SVM等模型均有提升，产品特征不同需求层次的划分也有利于手机产品的创新改进. 相似文献

18.

基于网络评论语言学结构的情感倾向识别模型

张素智樊得强李宝燕《郑州大学学报(自然科学版)》2011,(1):80-84

展示了一种新的基于网络评论语言学结构的情感倾向识别模型,固定情感词元模型（fixed sentiment terms model）.该方法利用基于固定情感词元的3种特定搭配模式来构造识别算法,通过基于增量的tf-idf模型的相关用户反馈不断更新特征词元集合.通过与传统的情感识别方法相比较,此方法可以较为明显地提高情感分类的效率和准确率. 相似文献

19.

在线社交网络中用户伪装攻击检测方法研究 总被引：1，自引：0，他引：1

高东伟《科学技术与工程》2017,17(7)

当前用户伪装攻击检测方法无法适应动态环境,实时性不高;且需要准确的先验知识,检测精度较低。提出一种新的在线社交网络中用户伪装攻击检测方法,介绍了k最邻近节点(KNN)算法的基本思想,给出KNN算法的实现过程。分析了用户伪装攻击检测与分类的关系,确定在线社交网络中用户伪装攻击检测就是对被检测的未知行为进行分类的过程。针对用户行为,将训练集中正常用户行为的邻居进行排列,通过和k相似的邻居的分类标签对新用户行为类别进行判断,从而实现用户伪装攻击检测。实验结果表明,所提方法不仅检测精度高,而且开销小。相似文献

20.

基于粒子群优化算法的支持向量机研究

谷文成柴宝仁滕艳平《北京理工大学学报》2014,34(7):705-709

基于粒子群优化算法提出了一种通过优化支持向量机模型参数,建立更佳的支持向量机数学模型的方法. 针对双螺旋分类问题,分别利用基于粒子群优化算法所建立的支持向量机分类器和标准支持向量机分类器进行了仿真实验,利用所建立的评价体系对仿真实验所获得的实验数据进行了评估,评估结果表明基于粒子群优化算法的支持向量机分类器明显优于标准支持向量机分类器,其分类结果表明基于粒子群优化算法的支持向量机分类器提高了分类结果的准确性,同时也验证了基于粒子群优化算法的支持向量机分类器在数据分类中的有效性. 相似文献