首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 890 毫秒
1.
主动学习能够在有标记样本较少的分类任务中得到较好的分类结果,其中熵值装袋算法最为常用,其利用熵值来衡量样本的不确定性,但熵值并不能完全地代表样本的不确定度.针对这一问题,本文提出二次样本筛选的分类算法,通过超像素分割进行边缘区域样本筛选,选择出不确定度较高的样本.利用熵值装袋算法对区域筛选样本进行二次筛选,选择信息量较...  相似文献   

2.
在基于解决单类问题的支持向量数据描述算法基础上提出了基于聚类分布信息的c-SVDD算法.该算法对带野值的SVDD算法中的C值重新定义.通过增加核空间下测试样本的聚类分布信息。为每个样本定义一个特定的c值.c-SVDD算法适应于解决类别不平衡学习问题.该算法在保证少类样本高分类精度前提下,还有效提高了全样本的分类精度,更符合现实不平衡问题中对少类样本的处理要求.对UCI数据集和人工样本集进行实验.改进后的c-SVDD算法比带野值的SVDD算法AUC值平均提高0.14以上;比AdaBoost算法在正类查全率上平均提高40%,精确度也提高了至少5%.  相似文献   

3.
【目的】针对协同训练算法不能直接应用于单视图数据,且在迭代过程中加入的无标记样本隐含有用信息不够的问题,提出基于核均值漂移聚类的改进局部协同训练算法。【方法】该算法先在有标记样本集中利用改进局部协同训练算法训练一个完整视图分类器h1,同时挑选出价值高的特征子集来训练局部视图分类器h2,然后在无标记样本集中采用核均值漂移算法选择聚类过程中指定带宽范围内的样本,交由分类器h2标记类别后再加入分类器h1的训练中,以此来优化分类模型。【结果】在UCI数据集上的3组对比实验证明了该算法的有效性,实验结果表明该算法具有更高的模型评价能力。【结论】改进局部协同训练算法将数据集划分为局部视图和完整视图,解决了单视图数据的视图划分问题。利用核均值漂移算法选出较好表现数据空间结构的无标记样本,降低了无标记样本带来的误差。  相似文献   

4.
传统的KNN缺失值填充算法存在没有利用样本间属性的相关性,也没有考虑到保持样本数据本身的结构和去除噪声样本的问题。本文提出利用训练样本重构测试样本从而进行最近邻缺失值填充的方法,该方法重构过程充分利用样本间的相关性,也用到LPP(保局投影)保持数据结构在重构过程中不变,同时引入l2,1范式用于去除噪声样本。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN填充算法以及基于属性信息熵的Entropy-KNN算法有更高的预测准确度。  相似文献   

5.
针对原始局部保持投影(LPP:Local Preserving Projection)算法难以准确获取非均匀高维数据的局部流形结构且未利用样本类别信息的缺陷,提出一种多信息融合的局部保持投影算法(MIF-LPP:Multi-Information Fusion Local Preserving Projection)。该算法使用改进后的标准欧氏距离获取样本的近邻和互邻信息,降低了样本点分布不均和不同维度数据量纲差异的影响。通过融合样本的类别信息构造权值矩阵,进而获得数据的低维本质流形。最后,分别在CWRU(Case Western Reserve University)数据集和本实验室轴承数据集上验证该算法的有效性。实验结果表明,MIF-LPP算法的特征提取性能明显优于其他算法,并且对邻域值具有鲁棒性。  相似文献   

6.
一种基于属性贡献度的决策树学习算法   总被引:3,自引:1,他引:2  
文章提出一种基于属性贡献度的决策树算法ICD,该算法利用信息熵理论构建基于样本类别信息分布确定的属性贡献度函数模型,从属性选优上消除了多值属性选择的偏向,将ICD算法与ID3、C4.5算法进行实验对比,数据结果表明该算法具有良好的性能.  相似文献   

7.
在不平衡数据分类问题中,为了更注重学习原始样本的概率密度分布,提出基于梯度惩罚生成对抗网络的过采样算法(OGPG)。该算法首先引入生成对抗网络(GAN),有效地学习原始数据的概率分布;其次,采用梯度惩罚对判别器输入项的梯度二范数进行约束,降低了GAN易出现的过拟合和梯度消失,合理地生成新样本。实验部分,在14个公开数据集上运用k近邻和决策树分类器对比其他过采样算法,在评价指标上均有显著提升,并利用Wilcoxon符号秩检验验证了该算法与对比算法在统计学上的差异。结果表明该算法具有良好的有效性和通用性。  相似文献   

8.
针对协同表示算法在小样本情况下识别率较好,但在样本充足情况下识别率偏低的问题上,通过研究协同表示算法中字典构成,提出利用多尺度二值(MB-LBP)算子构造伪样本来改进字典构成的方法,使其识别率得到提高。实验结果表明,在不同数量样本情况下,该优化算法识别率比协同表示算法高1%~3%,与稀疏表示算法相比正确识别率提高了2%~18%;在遮挡情况下比较协同表示算法其识别率提高了3%~10%。  相似文献   

9.
针对样本基数较大、 维数较高、 特征较复杂的数据集训练问题, 将支持向量机与蚁群优化算法相融合, 提出一种自适应多核学习算法. 利用吸引子传播聚类算法自适应地发现相似特征, 并据此利用蚁群算法自适应地选择核函数参数, 从而快速选择最优核函数. 通过UCI数据集的5组数据实验表明, 该算法相比于传统的支持向量机分类准确率和F1值更高, 验证了该算法的有效性和可行性.  相似文献   

10.
针对目标图像利用导向滤波算法进行图像抠图时参数需要根据不同图像进行人为设定的问题,提出了一种利用隐藏的支持向量机LSVM(latent support vector machine)自动设定参数的潜在半径优化的数字图像抠图算法.该方法首先是应用LSVM潜在性的思想,利用已知数据库模板训练输入目标图像的样本集,再利用样本集将导向图像和二值图像以不同半径进行分块并进行判定,确定半径值,从而能够自动产生合理参数.最后利用导向滤波器对图像进行抠图,从而优化抠图算法,最终实现抠图算法的智能化和灵活化.  相似文献   

11.
将数字图像处理中模糊锐化算子与三支聚类进行结合,提出了一种基于图像处理的三支聚类算法。该算法通过逆多元二次核函数将数据集的密度量化为灰度值,对数据总体采用模糊与锐化操作,提取锐化后灰度值较高的数据区域,将低密度区域从原始数据中删除。对灰度值较高的数据采用传统的聚类算法得到不同的类簇,然后对每个类簇利用图像模糊算子得到类簇的核心域,锐化算子得到类簇数据边界域,从而获得每个类簇的三支表示。试验采用不同的UCI数据集,通过比较聚类指标Adjusted Rand Index(ARI),Normalized Mutual Information(NMI)和Adjusted Mutual Information(AMI),验证了该聚类算法的有效性。  相似文献   

12.
针对现有的人脸检测算法,需要样本数量大、训练与学习时间长等缺点,提出了一种基于投影曲线特征的遮挡人脸检测算法。该算法利用了人脸二值化的水平投影,确定人眼区域,减小了数据量和其他面部特征的影响;得到眼部区域二值化的垂直投影,利用投影曲线的特征,对眼部是否有遮挡进行判断。该算法思想简单,无需训练与学习,提出新的判断指标-归一化灰度差有明确的物理意义,有效的提取了眼部区域的特征。仿真结果证明了该算法的有效性,且与同类算法相比,缩短了检测时间,提高了检测率。  相似文献   

13.
一种鲁棒的子空间聚类算法   总被引:2,自引:1,他引:1  
针对聚类分析常面临的维数灾难和噪声污染问题,将样本加权思想与子空间聚类算法相结合,提出了一种鲁棒的子空间聚类算法.该算法结合现有子空间聚类方法,为每个类簇计算一个反映各维度聚类贡献程度的权矢量,并利用该权矢量对各维度加权组合,得到各类簇所处的子空间.此外,算法还为每个样本分配一个反映离群程度的尺度参数,以区分正常样本和离群点在聚类过程中的地位,保证算法的鲁棒性.在二维数据集、高维数据集以及基因数据集上的对比实验结果表明,对于具有不同噪声比例的各种维度数据集,该算法均能取得较高的聚类精度,表现出较好的鲁棒性.  相似文献   

14.
为了有效地利用大数据中的无类别标签样本,将最小二乘支持向量机的思想和方法运用到半监督学习中,利用有类别标签和无类别标签样本构造支持向量机模型,通过Lagrange数乘法将其转化为一个线性规划问题,得到了一种适用于大数据的最小二乘半监督支持向量机.该算法有效地提高了支持向量机的测试准确率,具有较好的推广能力.  相似文献   

15.
基于上下边缘点匹配的连通域搜索算法   总被引:6,自引:0,他引:6  
基于上下边缘点匹配的连通域搜索算法利用连通域的上下边缘点是一一对应的这一基本原理,设计出新的高效二值图像连通域搜索方法,该算法能在行扫描图像过程中提取连通域。给出了实验分析数据,并与行程标记法进行了时间复杂度的比较,验证了该算法的有效性。  相似文献   

16.
为提高少量样本情况下分类器的性能,提出一种基于多分类器协同的半监督样本选择方法,利用未标注样本实现样本增强,提高分类器泛化能力.依靠多分类器的互相监督和多分类器标签一致的原理,将已标记样本作为训练集,利用SVM和RF两个分类器协同训练,多分类器的类别标签和确定度值作为约束条件,从未标记样本集中筛选出最有代表性的样本构成增强样本集,以准确率为评价标准,验证本算法对分类器泛化性能的影响.本算法在手写数字数据集(Mnist字符库)和Landsat土壤数据集上测试,实验结果表明相比少量原始训练样本构建的分类器,增强样本构建分类器预测的全部类别准确率都得到提升.两个数据集的总体准确率分别提升5.97%和7.02%,Mnist数据集中数字5这类准确率提升最高(提升11.9%,从79.3%到91.2%),Landsat土壤数据集中土壤3这一类准确率提升最明显(提升15.8%,从73.5%到89.3%),结果证明了该算法显著提高了分类器的泛化性能.同时与经典的KNN、Co-training和Co-forest算法对比,所提出的算法能够最大限度地利用未标记样本信息,具有最好的精度表现,证明了该研究提出算法的优越性.  相似文献   

17.
为了更快速地得到属性约简结果,对现有F2HARNRS算法的正域计算进行了改进。采取保留策略,利用矩阵保留样本间的度量计算值的平方,使得增维后的度量计算量减少,并据此提出了一种快速属性约简算法。最后通过多个UCI数据集验证了该算法,实验结果表明该算法是有效的、可行的。  相似文献   

18.
综合考虑对海雷达目标识别的高实时性和强泛化能力要求,提出一种利用模拟退火算法(SA)进行集成间隔优化的静态选择集成(SSE)算法.该算法首先利用SA基于集成间隔最大化搜索出不同大小的最优基分类器子集,然后利用集成分类精确度从中筛选出最终的集成分类器系统.进而提出一种分类器权值、样本权值的迭代求解算法,并考虑这两类权值以及基分类器的分类置信度,给出了8种集成间隔定义.在自建全极化高分辨率距离像(HRRP)分类数据集和17个UCI数据集上分析了集成间隔定义对集成算法性能的影响,通过对比实验验证了该算法的有效性.  相似文献   

19.
基于半监督K-means的K值全局寻优算法   总被引:3,自引:0,他引:3  
提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.  相似文献   

20.
基于加权超球支持向量机算法的超文本分类研究   总被引:3,自引:0,他引:3  
为提高超文本分类算法的性能,降低算法的复杂度,提出一种适用于超文本分类的加权超球支持向量机算法.该算法综合文档内容信息和超链接信息作为文档特征向量,针对传统超球支持向量机算法在不同类别样本数目不均衡时训练分类错误倾向于样本数目小的类别的问题,利用加权因子补偿了类别差异对算法推广性能造成的不利影响.在基准数据集上的测试结果表明,该算法降低了二次规划的复杂度,提高了分类器的分类性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号