首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
【目的】针对协同训练算法不能直接应用于单视图数据,且在迭代过程中加入的无标记样本隐含有用信息不够的问题,提出基于核均值漂移聚类的改进局部协同训练算法。【方法】该算法先在有标记样本集中利用改进局部协同训练算法训练一个完整视图分类器h1,同时挑选出价值高的特征子集来训练局部视图分类器h2,然后在无标记样本集中采用核均值漂移算法选择聚类过程中指定带宽范围内的样本,交由分类器h2标记类别后再加入分类器h1的训练中,以此来优化分类模型。【结果】在UCI数据集上的3组对比实验证明了该算法的有效性,实验结果表明该算法具有更高的模型评价能力。【结论】改进局部协同训练算法将数据集划分为局部视图和完整视图,解决了单视图数据的视图划分问题。利用核均值漂移算法选出较好表现数据空间结构的无标记样本,降低了无标记样本带来的误差。  相似文献   

2.
【目的】针对在标准协同训练中不具有充分冗余的视图分割,致使分类器错误累计过多,以及一对基分类器标记样本类别不一致的问题,提出了基尼指数结合K均值聚类的协同训练算法。【方法】该算法首先计算已标记样本中各特征的基尼指数,将该指数升序排列后均等划分到两个视图,然后在基分类器所标记的样本中,运用K均值聚类确定标记不一致样本的类别后加入标记样本。【结果】通过9个UCI数据集在3组实验上的结果表明,所提算法相较于对比算法提升了分类效果。【结论】运用基尼指数均等划分关键特征于两个视图,有利于改善视图分割不充分冗余的缺陷;K均值聚类法对分类不一致样本进行重新标记,降低了协同训练算法中的误标记率。  相似文献   

3.
【目的】针对标准协同训练中视图分割不充分冗余导致两个分类器误差累积加大,且两个分类器对同一个未标记样本分类不一致的问题,提出了结合信息增益率和K-means聚类的协同训练算法。【方法】该算法先根据有标记样本计算出数据中每一个特征的信息增益率,将信息增益率高的特征平均划分到两个视图,再在每次分类过程中应用K-means聚类确定标记不一致样本点的最终类别。【结果】通过在9个UCI数据集上的3组实验表明,与对比算法相比,所提算法中两视图分类器的平均正确率差值降低了2.9%,有效均衡了分类器性能,同时在分类准确率和算法稳定性上也有较大提升。【结论】利用信息增益率将关键特征均衡划分到两个视图,有效解决了视图分割不充分冗余问题;K-means聚类重新分类标记不一致的样本,降低了样本被误分类的概率。  相似文献   

4.
半监督学习是机器学习近年来的热点研究方向,而协同训练(Co-training)则是半监督学习中的重要范式,它利用双视图训练两个分类器来互相标记样本以扩大训练集,以此借助未标记样本提升学习性能.在实际应用中,视图通常会受到属性退化和噪声的影响而变得不充分(即视图不能提供足够的信息来正确预测样本的标记).在不充分视图下,两个视图上的最优分类器变得不再兼容,一个视图中的分类器标记的样本可能不利于另一个视图学得最优分类器.针对这一问题,提出一种改进的协同训练算法Compatible Co-training,它记录学习过程中每个未标记样本被赋予的标记,通过比较更新后的分类器对样本预测的标记与其初始标记,动态地删除标记不一致的样本,从而除去不利于学得最优分类器的样本.实验结果显示出Compatible Co-training比协同训练具有更好的泛化能力和更快的收敛速度.  相似文献   

5.
刘美春 《科学技术与工程》2013,13(19):5508-5512
针对如何提高有标签样本不足时的分类精度问题。提出脑-机接口系统(BCI)的类协同半监督学习算法(LCTSSL),采用有监督和无监督两种算法提取双特征训练双分类器协同扩充有标签样本集。在训练前后阶段设置不同置信度度量,选择两分类器分类结果一样的高置信度样本进行标记,保持每类每次新标记样本数目一样,提高有标样本集的可信度及识别系统的鲁棒性。迭代更新两分类器、有监督提取系统及相应特征,充分利用新标签信息。最后利用BCI竞赛2005的数据I证明LCTSSL算法的有效性。  相似文献   

6.
为了提高半监督分类性能,提出了一种多分类器协同的半监督分类算法SSC_MCC.算法采用双层结构集成,使用多条件判断挖掘未标记样本信息,扩充有标记样本.第一层中,采用三分类器协同投票一致策略实现对未标记样本进行标记,第二层中采用基于正确分类率的分类器加权投票决策标记未标记样本,扩充有标记样本,用最终生成的有标记样本训练分类器,实现半监督分类.最后,使用UCI数据集模拟半监督实验,结果表明SSC_MCCL较好地提高了半监督分类性能.  相似文献   

7.
针对主元成分分析(PCA)在网络故障特征提取过程中可能丢失分类信息的问题,提出了一种中心距离比值加权主元成分分析(CDRWPCA)算法。算法计算样本每维特征的中心距离比值来衡量特征间的差异,并根据特征差异构造权重因子,对更具有鉴别性的特征赋予更大的权重,得到加权数据集;然后对加权数据集运用PCA进行特征提取后将提取后的数据集送入支持向量机(SVM)验证算法的有效性。算法相比较与PCA算法增加了时间复杂度,但相对于PCA算法本身的时间复杂度,增加不多。在网络故障诊断中的实验结果表明算法能在提取特征维数更少的情况下,提高了故障识别率。  相似文献   

8.
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力.  相似文献   

9.
基于主成分分析人脸识别算法,提出一种基于全局特征和局部特征的加权算法,并且在嵌入式(Tiny6410)上完成系统的设计与实现.利用主成分分析提取人脸全局特征,根据特征值贡献率获取降维后的人脸子空间,采用欧氏距离匹配测试样本;用人眼检测算法、鼻子检测算法等提取每个样本的左眼、右眼、鼻子、嘴,分别建立样本集,采用主成分分析;分别计算全局和局部特征的离散度,根据离散度进行自动加权算法,给出最终的人脸识别结果.实验表明,该系统具有一定的稳定性,识别效果优于单一模块的识别.  相似文献   

10.
手写数字识别中组合式神经网络的构建方法   总被引:3,自引:0,他引:3  
将聚类技术和遗传算法相结合, 提出一种基于相似度传播算法和遗传算法的神经网络集成方法应用于手写数字识别问题. 先分别利用主成分分析和Fisher线性判别分析对数据集进行特征提取, 得到两类特征数据集, 再利用Bagging方法分别为这两类特征数据集训练简单的BP神经网络, 然后采用相似度传播算法对这些BP神经网络进行聚类, 找到作为类簇中心的网络(中心网络), 最后利用遗传算法对所有中心网络的权值进行训练, 将中心网络进行加权线性集成作为最终分类器. 在标准手写数字数据集MNIST上进行测试的实验结果表明, 该方法的识别率优于单个神经网络的识别率, 并兼顾了分类效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号