首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 192 毫秒
1.
提出了一种基于LPA和Tri-Training算法的半监督文本倾向性分类框架.通过LPA对初始样本进行快速分类,获得更多可信的有标签数据,优化分类框架的训练过程.引入Tri-Training算法,提高分类框架的泛化能力和可用性.实验结果表明,在不同标注比例的样本集上,该框架都有较好的分类性能,相较有监督学习算法和单一的半监督算法提高了分类精度,并有较强的鲁棒性,为解决有标签样本比例较少情况下的文本倾向性分类提供了一个新的思路.  相似文献   

2.
基于马氏距离和模糊C均值聚类算法提出了一种数字彩色图像抠图算法.该算法首先对彩色图像像素的红绿蓝三种彩色分量进行正则化处理;然后在正则化图像背景中选取适当的掩膜作为样本集,计算各像素与样本集之间的马氏距离;再利用模糊C均值聚类算法对计算出的马氏距离进行分类;最后利用填洞操作提高抠图质量.对八幅彩色数字图像进行对比实验,结果显示本算法可以自动抠图,且结果优于马氏距离算法、Grow-Cut算法和正则化线性回归算法的相应抠图效果.  相似文献   

3.
增强LLE特征分类性能的人脸识别   总被引:1,自引:1,他引:0  
为了增强局部线性嵌入(LLE)特征的可分类性,提出一种应用LMNN算法改善LLE特征分类性能的人脸识别方法.LMNN算法寻求一个线性变换,变换空间的欧氏距离等价于原始空间的马氏距离,马氏距离增强了LLE特征的kNN分类性能.在ORL数据库和扩展的YaleB数据库上进行实验,并与其他方法进行了比较.实验结果验证了该算法的有效性.  相似文献   

4.
提出一种基于马氏超椭球学习机的多类文本分类算法。对每一类训练样本,训练马氏超椭球学习机,使其包含该类尽可能多的样本,同时将噪音点排除在外。对于待分类样本,通过待分类样本的映射到每个超椭球球心的马氏距离确定其类别。实验结果表明,该算法提高了分类精度和分类速度。  相似文献   

5.
针对主动学习算法能主动从大量未标记样本中选择最能提高分类器性能的样本加入训练集,可从小的非最优训练集建立高性能的分类器这一特点,以及传统主动学习算法熵值装袋查询的多值偏置问题,提出了改进的均值熵值装袋查询算法,引入权值函数保证了取样的多样性.通过对高光谱遥感图像分类的实验表明:主动学习只需大约20%的样本即可达到使用全部数据集作为训练集的分类效果,而且均值熵值装袋查询方法具有较高的分类精度,同时拥有较快的收敛速度.  相似文献   

6.
为了进一步提高高分辨率遥感图像的分类精度及效率,融合支持向量机SVM及局部支持向量机KNNSVM算法,借助主动学习相关理论,提出了基于距离的局部支持向量机算法(DLSVM).该算法通过对未标记样本和超平面之间的距离与预先设定的距离阈值相比较,判断是否需要进一步建立局部支持向量机KNNSVM来确定样本的类标.对实际的高分辨率遥感图像分类的实验结果显示:在合适的距离阈值与K值的设置下,该算法能够提高支持向量机SVM的分类精度,同时大大降低KNNSVM算法的时间消耗.  相似文献   

7.
在基于解决单类问题的支持向量数据描述算法基础上提出了基于聚类分布信息的c-SVDD算法.该算法对带野值的SVDD算法中的C值重新定义.通过增加核空间下测试样本的聚类分布信息。为每个样本定义一个特定的c值.c-SVDD算法适应于解决类别不平衡学习问题.该算法在保证少类样本高分类精度前提下,还有效提高了全样本的分类精度,更符合现实不平衡问题中对少类样本的处理要求.对UCI数据集和人工样本集进行实验.改进后的c-SVDD算法比带野值的SVDD算法AUC值平均提高0.14以上;比AdaBoost算法在正类查全率上平均提高40%,精确度也提高了至少5%.  相似文献   

8.
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度.  相似文献   

9.
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力.  相似文献   

10.
一种新颖的基于马氏距离的文本分类方法的研究   总被引:1,自引:0,他引:1  
KNN(k最近邻算法)是文本挖掘领域最成熟最简单的分类方法之一.该方法对文本分类中的距离参数的选取敏感,错误的选择将导致分类精度降低,影响最终分类效果,该缺陷限制了KNN分类器在文本数据挖掘中的应用.因此,本文将马氏距离引入到文本分类领域,并将其与KNN算法相结合,提出了一种基于马氏距离的新的文本分类方法(Mahala...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号