首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
以中文情绪语料库(Ren-CECps)为基础,重点研究了句子级情绪识别方法.比较了不同特征以及不同机器学习分类方法(NB,SVM,ME)对情绪识别的影响.此外,针对情绪文本和非情绪文本在语料中的分布非常不平衡问题,通过集成学习的算法来实现不平衡情绪识别,用以提高情绪识别的整体性能.实验结果表明:使用基于样本的集成学习方法能够有效解决不平衡问题,明显提高情绪识别的分类性能.  相似文献   

2.
基于两步策略的中文短文本分类研究   总被引:3,自引:0,他引:3  
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二维空间,根据该空间内错误文本的分布将测试文本集分为3部分:能被KNN可靠分类的文本集A,不能被KNN可靠分类但能被NB可靠分类的文本集B,其他文本集C.(2)用KNN、NB分别对文本集A和B进行分类,根据训练语料的类别分布,直接给属于文本集C的文本分配标签.与NB、KNN和支持向量机(SVM)的对比实验表明,该方法可获得较高的分类性能.  相似文献   

3.
该文主要针对中文微博的细粒度情绪识别技术中的关键技术展开研究,分析了中文微博的研究难点和微博情感表达特征,提出了一种微博文本情绪显性特征的多策略集成分析法。最后实验组以新浪微博中某一主题为实验数据,对"乔任梁去世"事件这一热点话题的评论文本数据集进行分析,验证了该文的微博情感分析能力,同时还将情感分析结果进行了可视化展示。  相似文献   

4.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率。实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%。  相似文献   

5.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率.实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%.  相似文献   

6.
中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。  相似文献   

7.
中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。  相似文献   

8.
门户网站、博客和论坛中的新闻性文章很多具有情感关键句,而情感关键句识别是对新闻进行舆情分析和观点挖掘的基础,其识别的准确率对后续的研究工作非常重要。将三支决策技术分别与传统的三种机器学习算法NB、SVM和KNN相结合,提出了基于三支决策的新闻情感关键句识别方法,并与传统的机器学习算法进行对比实验。实验表明,本文提出的方法能有效提高新闻情感关键句识别的准确率,比传统的机器学习方法 NB、SVM、KNN分别提高准确率20%、27%、18%。  相似文献   

9.
为了解决单个SVM可能产生的泛化能力恶化问题以及当SVM采用一对多组合策略解决多类分类时可能产生的误差无界情况,本文采用Bagging方法构造了一个基于SVM的多类分类集成模型,利用MIT KDD 99数据集进行仿真实验,通过实验探讨了其中的两个参数——训练样本数和单分类器个数对集成学习效果的影响,并将其与采用全部样本进行训练及部分样本进行训练的单分类器检测进行了比较。结果表明:集成学习算法能够有效降低采用全部样本进行训练所带来的计算复杂性,提高检测精度,而且也能够避免基于采样学习带来检测的不稳定性和低精度。  相似文献   

10.
文本情绪多标签分类是一种细粒度的文本情感分析,通过挖掘文本中蕴含的多种情绪信息,为文本分配多种所属的情绪标签。文章提出一种基于标签特征的卷积神经网络(CNN)情绪多标签分类方法,首先利用word2vec模型对文本进行词向量表示,然后利用标签特征来强化文本情绪和标签之间的联系,将其融合于CNN模型中,用于对文本情绪进行深层次的表示和多标签分类。为了验证方法的有效性,选取了CLR和LPLO两个多标签分类方法作为基准方法,在NLPCC2014的中文微博情绪分析数据集进行比较实验。结果表明,使用标签特征的CNN模型,可以提升微博情绪的分类性能。  相似文献   

11.
针对在线评论信息挖掘领域,既有研究尚存在上下文信息缺乏、重要内容捕获不足、噪音大、多是文本级粗粒度情感分析等问题,设计了基于注意力机制的LSTM(long short term memory)产品创新特征识别流程框架模型.通过有用性评论的筛选、特征词库和情感词库的构建、At-LSTM情感分析模型的构建及细粒度特征情感与Kano模型的结合,为企业产品的创新改进提供了明确方向.京东、淘宝购物平台有关智能手机评论的实验表明,At-LSTM模型的准确率、精确率和召回率分别为91.52%,91.73%,91.53%,相较KNN,NB,SVM等模型均有提升,产品特征不同需求层次的划分也有利于手机产品的创新改进.  相似文献   

12.
支持向量机算法用于癌症数据建模   总被引:1,自引:0,他引:1  
吴疆  董婷 《科学技术与工程》2007,7(20):5363-5365
支持向量机算法(Support Vector Machine)是基于统计学习理论(SLT)发展起来的新一代机器学习方法,并被成功地应用到很多模式识别问题中。文中支持向量机分类算法用于卵巢癌病变与非卵巢癌病变质谱数据建模。对卵巢癌数据进行判别预测,预报正确率达到98%。通过与KNN、神经网络等算法的预报结果相比较,其预报能力强于KNN、神经网络算法在这个问题中的应用,为支持向量机算法可以应用于癌症疾病辅助检测提供一例证。  相似文献   

13.
针对语音识别性能提高的问题,提出了一种基于多分类器融合的语音识别方法,该方法使用支持向量机(support vector machine,SVM),RBF神经网络与贝叶斯网络作为成员分类器,根据样本库中抽取的校验集计算各成员分类器的权值,以加权评分的投票策略进行决策融合.实验结果表明,通过多分类器融合的识别结果明显优于...  相似文献   

14.
Microblog is a social platform with huge user community and mass data. We propose a semantic recommendation mechanism based on sentiment analysis for microblog. Firstly, the keywords and sensibility words in this mechanism are extracted by natural language processing including segmentation, lexical analysis and strategy selection. Then, we query the background knowledge base based on linked open data(LOD) with the basic information of users. The experiment result shows that the accuracy of recommendation is within the range of 70%-89% with sentiment analysis and semantic query. Compared with traditional recommendation method, this method can satisfy users’ requirement greatly.  相似文献   

15.
支持向量机(SVM)较一般的机器学习方法显示出更好的泛化能力.然而,在实际的数据中经常存在着大量冗余、噪声或者不可靠的特征,这严重影响到SVM的性能.因此,有必要减低特征复杂性以获取更好的SVM结果.本文提出了一种基于遗传算法(GA)的嵌入式框架下的特征优化算法,以构造改进SVM.针对选择的UCI成人数据库的实验表明,与原始的SVM相比,提出的改进SVM方法获得了更少的支持向量数目和更好的分类精度.  相似文献   

16.
中文文本数据的半结构化甚至非结构化的特点使得其分类存在着特征高维的问题,传统单一的特征降维方法难以满足大数据时代的文本分类需求.基于此,提出了一种基于卡方统计(Chi-square statistics,CHI)和主成分分析(principal component analysis,PCA)的混合特征降维方法(CHI-...  相似文献   

17.
针对在线医疗评论文本具有行业专业性强、差异性大、不够规范等特点,提出一种基于特征加权词向量的在线医疗评论情感分析方法.利用Word2vec方法构建词向量模型,抽取情感词集合完善医疗服务领域情感词典,根据句法关系识别主题词与情感词的依存关系,引入期望交叉熵因子,建立特征加权词向量模型,分析在线医疗评论的情感倾向.实验结果表明扩充的医疗服务情感词典在分析性能上的准确率、召回率以及F1值均高于基础情感词典,引入期望交叉熵因子后,基于特征加权词向量的情感分析方法在SVM分类上表现出更好的效果,体现了其在在线医疗评论挖掘领域的良好效用.   相似文献   

18.
针对广州智能公交调度的优化问题,提出一种基于无监督学习的实时公交动态调度算法,结合乘客利益和公交公司利益总体最优为目标,通过无监督学习方法学习到公交客流出行特征表达的提取,利用吸引子传播(affinity propagation,AP)聚类算法的优化数据集与支持向量机(support vector machine,SVM)的训练样本集相结合建立预测模型训练,运用公交线网发车间隔和加权系数的目标函数优化调度数学模型,将多源信息融合及多策略的实时公交动态调度算法引入到求解模型中,利用深度学习的异常突发事件分类检测方法实现调度优化模型的实时调整。实验结果表明,AP聚类算法程序运行耗时16 s、高峰发车间隔5 min,比遗传算法运行效率更高、时间间隔更精确,实例证明模型和算法具有实用性和可靠性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号