首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对样本基数较大、维数较高、特征较复杂的数据集训练问题,将支持向量机与蚁群优化算法相融合,提出一种自适应多核学习算法.利用吸引子传播聚类算法自适应地发现相似特征,并据此利用蚁群算法自适应地选择核函数参数,从而快速选择最优核函数.通过UCI数据集的5组数据实验表明,该算法相比于传统的支持向量机分类准确率和F1值更高,验证...  相似文献   

2.
基于稀疏编码和多核学习的图像分类算法   总被引:1,自引:0,他引:1  
提出了一种基于稀疏编码和多核学习的图像分类算法.首先从图像中提取Dense-SIFT(Dense Scale Invariant Feature Transform)和Dense-SURF(Dense Speeded Up Robust Feature)2种特征,使用稀疏编码对特征点进行处理,得到一系列高维向量,然后对这些高维向量应用max-pooling算法,将图像表示成单个向量.最后,使用改进的多核学习方法对这些向量进行分类,对于不同的特征,使用不同核的组合以达到最好的分类效果.实验结果表明,该算法作为词袋(BoW)模型的改进,能够提高分类准确率.
  相似文献   

3.
针对新颖的问答形式的文本展开研究,提出了基于网络表示的半监督问答文本情感分类方法,通过构建异构网络的联合学习提升半监督问答文本的情感分类性能。首先,通过分析标注和未标注样本构建一个异构网络,具体包括词-词网络、问题和答案文本-词网络、情感标签-词网络;其次,利用该异构网络学习获得词向量;最后,将学习到的词向量应用于目前性能最优的分层匹配情感分类模型(hierarchical matching network,HMN)中。实验结果表明,提出的方法在处理问答文本情感分类任务上具有一定优势。  相似文献   

4.
针对实际应用中经常出现的异类数据源,采用多核学习的支持向量机受到关注.然而随着核函数数量的增多,计算量也随之大大增加.为了解决这一问题,该提出了一种利用协同聚类对多核支持向量机的训练数据进行简化的方法,可以减少支持向量机的数目,从而减少计算量.实验结果显示,提出的方法可以提高多核支持向量机的效率,同时还不会影响分类精度.  相似文献   

5.
提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求和,以作为文本向量表示。以上述词向量或文本向量作为情绪分类器的输入,采用机器学习的分类方法(LR、SVM、CNN),验证本文情绪词向量在情绪分类任务上的实验效果。实验表明,情绪词向量与原始CBOW词向量相比,在准确率、召回率、F值等各项指标上都有更好的表现。  相似文献   

6.
针对词袋模型中的聚集算法对编码矢量之间空间关系信息或者概率分布信息单独建立数学模型,将马尔可夫随机场模型中的拟合参数矢量集合视为编码矢量的聚集矢量集合,计算每个聚集矢量对应的两两图像之间的核矩阵,然后使用基于支持向量机的多核学习方法求解核矩阵的最优线性组合系数以及支持向量系数,最后使用所得训练模型对测试图像进行分类.对于15类场景数据集和Caltech 101数据集,本文算法的分类正确率达到82.67%和62.94%,与其他算法相比具有更高的平均分类正确率.  相似文献   

7.
通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.  相似文献   

8.
将K型核函数和指数径向基核函数分别与径向基核函数组合成多核函数,并利用其构造出性能更加优越的支持向量域描述(SVDD)算法.将提取的遥感图像各波段光谱特征组成特征向量,分别用基于径向基核函数和多核函数的SVDD算法进行遥感图像分类.仿真实验结果表明:改进核函数的SVDD分类算法提高了分类精度,缩短了训练时间.  相似文献   

9.
通过提出一种多路融合卷积神经网络(multi-mixed convolutional neural network,MMCNN)对网购商品评论数据进行文本情感分类。采用skip-gram模型进行词向量的训练,并用训练好的向量表示评论数据。针对评论数据长短不一的情况,提出了循环词向量填充和随机词向量填充算法,有助于提升模型分类的准确率。针对传统卷积神经网络特征提取方式单一的问题,将多路卷积特征和池化特征在全连接层进行了特征融合,以此提升网络的文本分类效果。选择京东网站上45 000条婴儿奶粉的评论数据进行试验,并与支持向量机、最大熵模型、朴素贝叶斯等传统机器学习方法以及经典卷积神经网络方法进行对比。试验结果表明,提出的多路融合卷积神经网络具有较高的分类正确率。  相似文献   

10.
基于词向量空间模型的中文文本分类方法   总被引:4,自引:0,他引:4  
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。  相似文献   

11.
由于word2vec、Glove等静态词向量表示方法存在无法完整表示文本语义等问题,且当前主流神经网络模型在做文本分类问题时,其预测效果往往依赖于具体问题,场景适应性差,泛化能力弱.针对上述问题,提出一种多基模型框架(Stacking-Bert)的中文短文本分类方法.模型采用BERT预训练语言模型进行文本字向量表示,输...  相似文献   

12.
为了解决大规模生长环境变量所带来的计算复杂度较高的问题,采用细菌觅食优化多核支持向量机算法对农作物产量进行预测分析,从而实现作物生长环境的最优控制;首先,采用高斯核函数、多项式核函数和Sigmoid核函数组合方式建立多核支持向量机,其输入为作物生长环境,采用细菌觅食优化算法优化核函数关键参数;其次,利用多核函数的参数构建菌群进行训练,设置作物产量作为细菌觅食优化算法适应度;最后,通过菌群位置更新优化后的最优核函数参数进行多核支持向量机优化求解,获得空气温度、湿度,土壤温度、湿度等生长环境特征数据。结果表明,选择合适的多核函数组合,并合理设置细菌觅食优化算法的引力和斥力系数、迁徙概率阈值等参数,能够获得最高产量所对应的作物生长环境特征数据。  相似文献   

13.
局部多核学习算法(LMKL)是一种变系数的多核支持向量机算法,其利用选通函数局部的选取合适的合成核函数;但是其选通函数有严重的参数沉余的问题,为此提出了改进的局部多核学习算法(ILMKL),在其目标函数中加入正则项,区别于LMKL中选通函数的l1范数形式,使用选通函数的lp范数形式,增强核函数间的“互补”作用;采用该算法在模拟数据集和UCI数据集上实验,结果表明该算法取得较高的分类能力.  相似文献   

14.
为进一步提高文本情感倾向性分类效果,提出基于文本特征和语言知识融合的卷积神经网络模型MI-CNN.使用Word2Vec表示词语信息,将词性和情感词语等语言知识嵌入词向量中,将文本特征和语言知识融合到情感倾向性分类模型,经过参数优化提升文本情感倾向性分类模型的准确率.在数据集上进行实验,结果表明所提出的模型准确率达到93...  相似文献   

15.
提出一种基于多核加权支持向量机的水质预测方法.核函数及其参数选择与数据分布的情况密切相关,采用单一的核函数应对水资源质量评价指标的整个数据分布难以达到很好的预测结果.采用多核加权学习的核函数避免了核函数设计的盲目性和局部最优等非线性优化问题.实例表明,该方法的预测结果是合理可行的,且与以往同类预测方法相比,有着更为客观...  相似文献   

16.
在基于深度学习的文本情感分类研究领域中,目前传统的模型主要是序列结构,即采用单一的预训练词向量来表示文本从而作为神经网络的输入,然而使用某一种预训练的词向量会存在未登录词和词语语义学习不充分的问题。针对此问题,提出基于并行双向门控循环单元(gated recurrent unit,GRU)网络与自注意力机制的文本情感分类模型,利用两种词向量对文本进行表示并作为并行双向GRU网络的输入,通过上下两个通道分别对文本进行上下文信息的捕捉,得到表征向量,再依靠自注意力机制学习词语权重并加权,最后对两个通道的输出向量进行向量融合,作为输入进入全连接层判别情感倾向。将本文模型与多个传统模型在两个公共数据集上进行实验验证,结果表明本文模型在查准率、查全率、F1值和准确率等性能指标上相比于双向门控循环单元网络模型、双向长短时记忆网络模型和双向门控循环单元网络与自注意力机制的单通道网络模型均有所提升。  相似文献   

17.
为进一步利用高光谱图像在同一区域内像素点的相似特性完成地物分类,提出了一种基于核方法协同表示与绝对距离融合的分类算法。通过核函数将原始数据投影到高维核空间,在特征空间中用全部训练样本表示待测样本,再计算吉洪诺夫正则化下待测像元的重构残差和每个类别表示系数绝对值向量,使用不同权重予以融合作为分类依据。在实验中使用Indian Pines和Pavia University两种高光谱图像数据对该方法进行实验验证,实验结果表明:与原协同表示(CRC)及支持向量机(SVM)相比,改进后分类算法总体分类精度和平均分类精度都有更好的表现,均达到94%以上,具有较好的鲁棒性。  相似文献   

18.
网页分类技术   总被引:17,自引:0,他引:17  
网页分类是使用机器学习的方法实现网页类别的自动标注.回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法.使用纯文本分类技术处理网页是不合理的.基于概率模型的方法和关系学习方法计算量大,关系学习方法学习结果的可解释性好,支持向量机方法分类准确率高,但核函数的构造和大规模数据集的训练都是该算法的难题.应该采用多种指标对网页分类算法进行评价.  相似文献   

19.
自然语言处理中,文本情绪分类目前以情感极性分类居多,更加细粒度的情绪分类却很少,并且基本上都为英文文本情绪分类。本文针对中文文本情绪分类,设计并实现了一种双通道多核卷积神经网络中文文本情绪分类方法。在特征提取部分,设计了双通道特征提取方法,采用word2vec预先训练词向量的词袋方式并引入注意力机制,提取的特征向量在关注局部特征信息的基础上加入了文本上下文之间的关系信息,能够涵盖文本全局特征;在卷积部分,设计了多种不同卷积核分别卷积池化后再组合的方式,从而得到更加全面的文本特征。理论分析和实验结果表明,双通道多核卷积神经网络中文文本情绪分类方法分类准确率达86%,比单层卷积神经网络的分类准确率提高了4%,同时解决了单层卷积神经网络特征提取不够全面和多层卷积神经网络特征提取过于抽象的问题。  相似文献   

20.
提出一种选择支持向量分类(Support Vector Classification,SVC)最优核参数的算法,称为MI(Maximum Isolation)算法,通过定义样本间的独立性,可以获得最优核参数和相应的最优学习模型。该算法可以在支持向量机训练之前得到最优的核参数,计算代价较小,实验证明所提出的算法简单有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号