首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于稀疏编码和多核学习的图像分类算法   总被引:1,自引:0,他引:1  
提出了一种基于稀疏编码和多核学习的图像分类算法.首先从图像中提取Dense-SIFT(Dense Scale Invariant Feature Transform)和Dense-SURF(Dense Speeded Up Robust Feature)2种特征,使用稀疏编码对特征点进行处理,得到一系列高维向量,然后对这些高维向量应用max-pooling算法,将图像表示成单个向量.最后,使用改进的多核学习方法对这些向量进行分类,对于不同的特征,使用不同核的组合以达到最好的分类效果.实验结果表明,该算法作为词袋(BoW)模型的改进,能够提高分类准确率.
  相似文献   

2.
针对样本基数较大、 维数较高、 特征较复杂的数据集训练问题, 将支持向量机与蚁群优化算法相融合, 提出一种自适应多核学习算法. 利用吸引子传播聚类算法自适应地发现相似特征, 并据此利用蚁群算法自适应地选择核函数参数, 从而快速选择最优核函数. 通过UCI数据集的5组数据实验表明, 该算法相比于传统的支持向量机分类准确率和F1值更高, 验证了该算法的有效性和可行性.  相似文献   

3.
针对新颖的问答形式的文本展开研究,提出了基于网络表示的半监督问答文本情感分类方法,通过构建异构网络的联合学习提升半监督问答文本的情感分类性能。首先,通过分析标注和未标注样本构建一个异构网络,具体包括词-词网络、问题和答案文本-词网络、情感标签-词网络;其次,利用该异构网络学习获得词向量;最后,将学习到的词向量应用于目前性能最优的分层匹配情感分类模型(hierarchical matching network,HMN)中。实验结果表明,提出的方法在处理问答文本情感分类任务上具有一定优势。  相似文献   

4.
针对实际应用中经常出现的异类数据源,采用多核学习的支持向量机受到关注.然而随着核函数数量的增多,计算量也随之大大增加.为了解决这一问题,该提出了一种利用协同聚类对多核支持向量机的训练数据进行简化的方法,可以减少支持向量机的数目,从而减少计算量.实验结果显示,提出的方法可以提高多核支持向量机的效率,同时还不会影响分类精度.  相似文献   

5.
提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求和,以作为文本向量表示。以上述词向量或文本向量作为情绪分类器的输入,采用机器学习的分类方法(LR、SVM、CNN),验证本文情绪词向量在情绪分类任务上的实验效果。实验表明,情绪词向量与原始CBOW词向量相比,在准确率、召回率、F值等各项指标上都有更好的表现。  相似文献   

6.
针对词袋模型中的聚集算法对编码矢量之间空间关系信息或者概率分布信息单独建立数学模型,将马尔可夫随机场模型中的拟合参数矢量集合视为编码矢量的聚集矢量集合,计算每个聚集矢量对应的两两图像之间的核矩阵,然后使用基于支持向量机的多核学习方法求解核矩阵的最优线性组合系数以及支持向量系数,最后使用所得训练模型对测试图像进行分类.对于15类场景数据集和Caltech 101数据集,本文算法的分类正确率达到82.67%和62.94%,与其他算法相比具有更高的平均分类正确率.  相似文献   

7.
通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分析,将主流词向量训练方法用于不同的文本语料集,包括英文维基百科语料、新闻语料、论坛语料和Web语料进行训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.  相似文献   

8.
将K型核函数和指数径向基核函数分别与径向基核函数组合成多核函数,并利用其构造出性能更加优越的支持向量域描述(SVDD)算法.将提取的遥感图像各波段光谱特征组成特征向量,分别用基于径向基核函数和多核函数的SVDD算法进行遥感图像分类.仿真实验结果表明:改进核函数的SVDD分类算法提高了分类精度,缩短了训练时间.  相似文献   

9.
通过提出一种多路融合卷积神经网络(multi-mixed convolutional neural network,MMCNN)对网购商品评论数据进行文本情感分类。采用skip-gram模型进行词向量的训练,并用训练好的向量表示评论数据。针对评论数据长短不一的情况,提出了循环词向量填充和随机词向量填充算法,有助于提升模型分类的准确率。针对传统卷积神经网络特征提取方式单一的问题,将多路卷积特征和池化特征在全连接层进行了特征融合,以此提升网络的文本分类效果。选择京东网站上45 000条婴儿奶粉的评论数据进行试验,并与支持向量机、最大熵模型、朴素贝叶斯等传统机器学习方法以及经典卷积神经网络方法进行对比。试验结果表明,提出的多路融合卷积神经网络具有较高的分类正确率。  相似文献   

10.
基于词向量空间模型的中文文本分类方法   总被引:4,自引:0,他引:4  
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。  相似文献   

11.
局部多核学习算法(LMKL)是一种变系数的多核支持向量机算法,其利用选通函数局部的选取合适的合成核函数;但是其选通函数有严重的参数沉余的问题,为此提出了改进的局部多核学习算法(ILMKL),在其目标函数中加入正则项,区别于LMKL中选通函数的l1范数形式,使用选通函数的lp范数形式,增强核函数间的“互补”作用;采用该算法在模拟数据集和UCI数据集上实验,结果表明该算法取得较高的分类能力.  相似文献   

12.
提出一种基于多核加权支持向量机的水质预测方法.核函数及其参数选择与数据分布的情况密切相关,采用单一的核函数应对水资源质量评价指标的整个数据分布难以达到很好的预测结果.采用多核加权学习的核函数避免了核函数设计的盲目性和局部最优等非线性优化问题.实例表明,该方法的预测结果是合理可行的,且与以往同类预测方法相比,有着更为客观...  相似文献   

13.
为进一步利用高光谱图像在同一区域内像素点的相似特性完成地物分类,提出了一种基于核方法协同表示与绝对距离融合的分类算法。通过核函数将原始数据投影到高维核空间,在特征空间中用全部训练样本表示待测样本,再计算吉洪诺夫正则化下待测像元的重构残差和每个类别表示系数绝对值向量,使用不同权重予以融合作为分类依据。在实验中使用Indian Pines和Pavia University两种高光谱图像数据对该方法进行实验验证,实验结果表明:与原协同表示(CRC)及支持向量机(SVM)相比,改进后分类算法总体分类精度和平均分类精度都有更好的表现,均达到94%以上,具有较好的鲁棒性。  相似文献   

14.
由于word2vec、Glove等静态词向量表示方法存在无法完整表示文本语义等问题,且当前主流神经网络模型在做文本分类问题时,其预测效果往往依赖于具体问题,场景适应性差,泛化能力弱。针对上述问题,提出一种多基模型框架(Stacking-Bert)的中文短文本分类方法。模型采用BERT预训练语言模型进行文本字向量表示,输出文本的深度特征信息向量,并利用TextCNN、DPCNN、TextRNN、TextRCNN等神经网络模型构建异质多基分类器,通过Stacking集成学习获取文本向量的不同特征信息表达,以提高模型的泛化能力,最后利用SVM作为元分类器模型进行训练和预测。与word2vec-CNN、word2vec-BiLSTM、BERT-texCNN、BERT-DPCNN、BERT-RNN、BERT-RCNN等文本分类算法在网络公开的三个中文数据集上进行对比实验,结果表明,Stacking-Bert集成学习模型的准确率、精确率、召回率和F1值均为最高,能有效提升中文短文本的分类性能。  相似文献   

15.
在基于深度学习的文本情感分类研究领域中,目前传统的模型主要是序列结构,即采用单一的预训练词向量来表示文本从而作为神经网络的输入,然而使用某一种预训练的词向量会存在未登录词和词语语义学习不充分的问题。针对此问题,提出基于并行双向门控循环单元(gated recurrent unit,GRU)网络与自注意力机制的文本情感分类模型,利用两种词向量对文本进行表示并作为并行双向GRU网络的输入,通过上下两个通道分别对文本进行上下文信息的捕捉,得到表征向量,再依靠自注意力机制学习词语权重并加权,最后对两个通道的输出向量进行向量融合,作为输入进入全连接层判别情感倾向。将本文模型与多个传统模型在两个公共数据集上进行实验验证,结果表明本文模型在查准率、查全率、F1值和准确率等性能指标上相比于双向门控循环单元网络模型、双向长短时记忆网络模型和双向门控循环单元网络与自注意力机制的单通道网络模型均有所提升。  相似文献   

16.
网页分类技术   总被引:17,自引:0,他引:17  
网页分类是使用机器学习的方法实现网页类别的自动标注.回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法.使用纯文本分类技术处理网页是不合理的.基于概率模型的方法和关系学习方法计算量大,关系学习方法学习结果的可解释性好,支持向量机方法分类准确率高,但核函数的构造和大规模数据集的训练都是该算法的难题.应该采用多种指标对网页分类算法进行评价.  相似文献   

17.
针对信息安全风险评估中训练数据数目少、方法主观性大、求解最优值困难等问题,提出了基于支持向量机(SVM)的信息安全风险评估方法.与传统学习方法相比,SVM分类器对小样本测试环境的适应能力强,具有较好的分类准确率,能有效防止过学习.通过分析影响信息系统安全的主要因素,结合支持向量机思想,设计并实现了基于支持向量机的信息安全风险评估模型,通过多类核函数构造出不同的分类面以及分类函数,然后对样本数据进行测试,最终得到问题的最优分类解.  相似文献   

18.
提出一种选择支持向量分类(Support Vector Classification,SVC)最优核参数的算法,称为MI(Maximum Isolation)算法,通过定义样本间的独立性,可以获得最优核参数和相应的最优学习模型。该算法可以在支持向量机训练之前得到最优的核参数,计算代价较小,实验证明所提出的算法简单有效。  相似文献   

19.
现有的电商垃圾评价检测方法大多基于对评价文本信息进行分析,难以有效检测带有图片的多模态垃圾评价,为充分利用评价的图片和文本内容,提出了基于Transformer双向编码表示(bidirectional encoder representa-tions from transformer,BERT)和宽残差网络(wide residual networks,WRN)的图文融合决策检测方法.该方法利用评价文本对经过预训练的BERT模型进行微调训练,经过表示学习分类得到文本评价类别向量,使用宽残差网络对评价图片进行特征提取和分类并输出图片类别向量,将得到的对应评价图文类别向量共同输入启发式决策融合分类器,对多模态评价整体进行预测分类.使用真实电商评价数据集进行实验表明,相比面向评价文本的分类方法,图文融合决策检测方法对多模态评价分类的精准率提高4.44%,召回率提高2.12%,Micro-F1提高3.67%,结果证实该方法能够对多模态垃圾评价进行有效检测.  相似文献   

20.
针对微博观点句识别及情感极性分类任务,提出了基于增强字向量的微博观点句情感极性分类方法.使用单字作为句子表示的基本单元,同时在单字中嵌入了该字所在的词信息以及该词的词性信息,以此训练得到字向量替代传统的词向量融合的句子表示方法.使用基于K-means的方法对向量化的句子进行情感判别,仅需要对文本进行分词和词性标注,无需额外的语言学资源.在COAE2015任务2的微博句子数据集上进行测试,取得了较好的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号