首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
 针对大规模数据集上的模式分类任务, 提出基于Parzen 窗核密度估计的模式分类隐私保护算法。利用Parzen 窗算法对原始大规模训练集服从的概率密度进行估计, 根据估计的概率密度函数构造la 个替换训练样本, 其中l 为原始样本的数目, a 通过10 折交叉验证方式确定。最后发布替换训练样本进行模式分类, 以实现原始数据上的隐私保护。在Adult 数据集上的仿真实验充分验证了算法的有效性。  相似文献   

2.
针对葡萄酒的物理化学成分冗余数据,提出了一种基于主成分分析(PCA)和粒子群优化—支持向量机(PSO-SVM)的模型用于葡萄酒的分类.首先,对葡萄酒的物理化学成分进行主成分分析,提取主要影响因素,减少输入维数,再利用粒子群优算法寻找支持向量机的最佳参数,并用支持向量机完成对训练集样本的学习和测试集样本的预测分类.结果表明,该模型与其他模型相比较,具有较高的准确性,有一定的适用价值.  相似文献   

3.
针对在人脸图像高维数据降维时单纯使用主成分分析(PCA)算法的提取精度和速度受限问题,  提出一种基于小波变换和改进PCA的混合特征提取算法. 该方法首先对人脸图像进行小波分解, 选取低频分量对人脸图像进行特征提取;然后利用改进的PCA算法进行主成分提取, 获得代表人脸特征的特征向量; 最后将该算法应用于Olivetti Faces人脸库数据集的图像分类. 实验结果表明, 经过该混合算法处理后的图像特征数据, 由卷积神经网络(CNN)算法分类识别时准确率提升10%, 识别速度提高约37%.  相似文献   

4.
基于PCA改进的快速Adaboost算法研究   总被引:1,自引:1,他引:0  
针对传统的Adaboost算法可能出现在应对较大训练数据集训练时间过长的问题,提出了一种改进的Adaboost算法——PCAdaboost。改进算法利用PCA方法的降维技术,对训练样本特征提取主要成分,去除输入样本特征间的相关性,提高分类精度。同时,从样本阈值搜索角度考虑了特征值等分和特征值空间维数,给出了阈值快速搜索方法。实验结果表明,该算法在UCI数据集上取得较好的效果。  相似文献   

5.
针对主元成分分析(PCA)在网络故障特征提取过程中可能丢失分类信息的问题,提出了一种中心距离比值加权主元成分分析(CDRWPCA)算法。算法计算样本每维特征的中心距离比值来衡量特征间的差异,并根据特征差异构造权重因子,对更具有鉴别性的特征赋予更大的权重,得到加权数据集;然后对加权数据集运用PCA进行特征提取后将提取后的数据集送入支持向量机(SVM)验证算法的有效性。算法相比较与PCA算法增加了时间复杂度,但相对于PCA算法本身的时间复杂度,增加不多。在网络故障诊断中的实验结果表明算法能在提取特征维数更少的情况下,提高了故障识别率。  相似文献   

6.
在保证分类性能的前提下,如何从大量的训练样本集合中选择重要样本子集,是模式分类中的一个重要问题.基于该问题提出了一种新的样本选择算法,并将该算法应用于文本分类,在标准文档集Reuters-21578、复旦文档集和20newsGroup新闻组文档集上进行了实验.实验结果表明:该方法能有效地选取边界样本,且采用SVM和KNN分类能得到较好的分类结果,尤其是在不均衡文档集上效果更佳.  相似文献   

7.
特征提取和小样本学习的电力工程造价预测模型   总被引:3,自引:0,他引:3       下载免费PDF全文
通过特征提取和小样本学习的结合,提出一种全新的基于混合算法的电力工程造价预测模型。利用主成分分析对原始指标进行预处理,消除原始指标之间的相关性,并提取潜在的综合独立指标,将新指标作为输入集构造基于最小二乘支持向量机的预测学习模型,将其预测结果和神经网络模型预测对比分析。并通过不同主成分数目预测结果的比较,确定最优的主成分个数,达到理想的预测效果。实例预测结果表明:该方法可以有效提取原始指标的信息量,在小样本学习方面表现突出,能够达到期望的预测效果。  相似文献   

8.
随着大数据技术的迅猛发展,健康医疗大数据突破性增长,且具有多源异构、多类型、多关联性.健康医疗大数据也具备特有的5V特征:volume, velocity, variety, value, veracity.然而健康医疗数据的安全问题也随之产生,如何保护病患的隐私数据不被泄露成为一项研究热点.该文针对病患隐私保护及其数据分析问题进行研究和探讨,以PCA-GRA Datafly算法为研究对象,为了解决传统算法的QI属性过度泛化的问题及K-means算法的局部最优问题,提出PCA-GRA-BK算法(主成分分析灰度关联分析BiK-means K匿名算法).首先通过PCA算法对医疗数据进行降维分析,利用少量数据揭示医疗数据之间的内在联系,并选择出QI属性;再使用GRA算法对QI属性进行关联度分析,确定与敏感属性的关联度,构建QI属性的泛化层次,使用手肘法确定聚类算法的最佳k值,并通过聚类算法完成健康医疗数据集相似等价类的聚类;最后借助K匿名算法完成对健康医疗数据的匿名化.通过将Datafly算法、PCA-GRA Datafly算法、PCA-GRA-KK算法和PCA-GRA-BK算法进行医疗数据...  相似文献   

9.
针对目前零样本图像分类均采用图像底层视觉特征训练属性分类器而导致分类精度较低的问题,提出一种基于稀疏编码空间金字塔模型的零样本学习方法,给出系统结构流程图.首先从原始视觉图像中提取SIFT特征,并进行SIFT特征点提取;然后构建空间金字塔最大池化模型,对已提取的SIFT中间特征进行稀疏编码;最后建立间接属性预测模型.给出基于稀疏编码的空间金字塔最大池化模型的零样本学习算法步骤,完成对目标图像的属性预测,从而达到零样本图像分类的目的.在Shoes数据集与OSR数据集上进行了对比试验.结果表明:试验证实了文中算法的有效性;相对于传统算法,试验耗时减少,图像属性预测精度增加,图像分类识别率提高.  相似文献   

10.
为了处理张量数据,传统的学习算法常常把张量展成向量,但会造成破坏原始数据固有的高阶结构和内在相关性,导致信息丢失,或产生高维向量,使得后期学习过程中容易出现过拟合、维度灾难和小样本问题.近年提出了许多基于张量模式的分类算法,而支持高阶张量机算法是张量分类算法中最有效的方法之一.考虑到张量的高维性和高冗余性,本文提出基于多线性主成分分析的支持高阶张量机分类算法(Multilinear Principle Component Analysis Based Support High-Order Tensor Machine,MPCA+SHTM).该算法首先利用多线性主成分分析对张量进行降维,然后利用支持高阶张量机对降维后的张量进行学习.在12个张量数据集上的实验表明:MPCA+SHTM在保持测试精度的情况下有效地降低了SHTM的计算时间.  相似文献   

11.
岩爆类型预测是防治和控制硬岩矿山岩爆灾害的有效方式。基于国内外397组岩爆案例数据,规范训练集与测试集的数据预处理方式,采用模型参数优化及交叉验证技术获得最近邻、支持向量机与决策树模型最佳参数;对比分析主成分分析法(PCA)与过采样SMOTE对3种机器学习算法预测准确率的影响,并采用准确率、精确率、召回率、F1等指标对模型预测性能进行评估。结果表明:主成分分析对3种机器学习模型的预测准确率并无提升,不同岩爆类型的样本之间不具有较为明显的决策边界;过采样SMOTE算法仅对决策树模型有明显的提升,基于过采样建立的SMOTE-DT模型预测准确率为77.50%,高于仅对原始数据集进行标准化处理的KNN、SVM模型的68.75%与57.50%;SMOTE-DT在高估与低估岩爆类型表现优于KNN与SVM模型,对于四种岩爆类型的F1值均大于0.7,岩爆预测性能稳定可靠。此外,采用本文构建的3种机器学习模型对山西紫金金矿进行了岩爆类型预测,模型预测结果与现场观测结果相一致。本文构建的三种用于岩爆类型预测的机器学习模型避免了训练集信息泄露对测试集造成影响,研究结果为岩爆类型预测及规范机器学习模型训练过程提供了理论支撑。  相似文献   

12.
为了提高滚动轴承故障诊断的准确率,提出一种基于主成分分析(principal component analysis,PCA)和支持向量机(support Vector machine,SVM)模型的滚动轴承故障诊断方法.通过比较不同方法计算的标准差和拉依达准则对数据进行误差分析,利用MATLAB软件中的PCA函数对数据进行主成分分析,将8个原始变量降维成3个综合变量,分别从降维前和降维后的输入属性数据中随机选取70%的数据作为训练集来建立SVM分类模型和PCA-SVM分类模型,而把剩余的30%作为测试集来对模型的性能进行仿真测试.MATLAB仿真测试的结果表明,PCA-SVM模型的分类效果更好,其预测正确率对于绝大多数故障诊断来说是可以接受的,可以作为一种故障诊断的评价标准.  相似文献   

13.
为充分挖掘人脸模式样本之间的鉴别信息、强化不同样本之间的区分性,以利于增强识别系统鲁棒性、提高人脸正确识别率,提出一种新颖的基于四元数的彩色人脸识别算法.将定义于实数域的PcA方法以及Fisher鉴别分析法向四元数体作合理推广,得到定义于体上的广义主成分分析方法及广义线性鉴别分析法,将这2种方法用于彩色人脸识别,从而得到全新的识别算法.该算法巧妙地将彩色像素的R、G、B3个分量结合在一起,从数学上有机融合具有丰富鉴别信息的肤色成分以及反映人脸轮廓形状信息的灰度成分,较传统仅利用灰度信息的识别方法,具有更稳定的性能以及更高的正确识别率.提出的关于共轭四元数矩阵正交特征矢量集的获取方法,数学上有详细的推导证明,该方法在理论上合理,同时在自己建立的彩色人脸库上进行的实验表明,该方法可行且实用.  相似文献   

14.
在分析大肠早癌荧光数据属性约简方法的基础上,提出一种基于容错关系信息熵的粗糙主成分属性约简方法.该方法首先针对数据的不完整特性,建立容错关系粗糙集模型.然后,引入随信息量减小而单调下降的信息熵,建立基于信息熵的容错关系粗糙集模型,并进行初步数据属性处理.最后,结合主成分分析方法,形成基于容错关系信息熵的粗糙主成分分析方法,在进行数据降维处理的同时提取数据特征.以大肠早癌荧光光谱为实验数据的分析处理结果表明,该方法可以有效地降低荧光光谱数据的处理维数,提取影响医疗诊断的特征数据,减少后续数据处理的复杂度.  相似文献   

15.
一种改进的ASM人脸特征点定位方法   总被引:1,自引:1,他引:0  
传统主动形状模型(active shape model, ASM)利用主成分分析(principal component analysis, PCA)获得形状,根据主成分并结合形状参数建立起统计模型,该方法不能有效更新图像特征空间,会导致模型匹配失败。为了克服上述缺点,提出一种改进的特征提取方法。首先采用增量主成分分析(incremental principal component analysis,IPCA)更新图像集合的特征空间,并采用一种新的模型匹配算法定位目标特征点。改进的新方法不断更新图像特征空间且有效地描述训练样本间的相似性或差异性,新的匹配算法能避免计算协方差矩阵的逆矩阵,能有效降低计算误差。实验结果表明,改进的方法有效提高了定位精度,并降低了匹配的像素偏移值。  相似文献   

16.
针对主成分分析(PCA)算法对数据进行向量化,破坏初始数据的局部结构信息的缺点,提出了将局部线性嵌入(LLE)与PCA相结合的人脸识别算法。先采用LLE提取的初始数据保留了人脸局部结构信息的低维特征,再利用PCA计算低维数据的主要成分,最后根据各人脸的主要成分之间的欧式距离判断是否匹配。对比实验表明,该算法在明显提升算法效率的同时,保证了较高的识别率。  相似文献   

17.
基于PCA和KPCA特征抽取的SVM网络入侵检测方法   总被引:6,自引:0,他引:6  
提出一种新颖的基于特征抽取的异常检测方法,应用主分量分析(PCA)和核主分量分析(KPCA)抽取入侵特征,再应用支持向量机(SVM)检测入侵。其中PCA对输入特征做线性变换,而KPCA通过核函数进行非线性变换。利用KDD 99数据集,将PCA-SVM、KPCA-SVM与SVM、PCR、KPCR进行比较,结果显示:在不降低分类器性能的情况下,特征抽取方法能对输入数据有效降维。在各种方法中,KPCA与SVM的结合能得到最优入侵检测性能。  相似文献   

18.
基于局部线性嵌入与主成分分析的人脸识别方法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对主成分分析(PCA)算法对数据进行向量化,破坏初始数据的局部结构信息的缺点,提出了将局部线性嵌入(LLE)与PCA相结合的人脸识别算法。先采用LLE提取的初始数据保留了人脸局部结构信息的低维特征,再利用PCA计算低维数据的主要成分,最后根据各人脸的主要成分之间的欧式距离判断是否匹配。对比实验表明,该算法在明显提升算法效率的同时,保证了较高的识别率。  相似文献   

19.
分析了主成分分析(PCA)与核主成分分析(kPCA)的基本原理,比较了两者在处理数据方面的性能,得出了kPCA比PCA在处理非线性可分数据方面具有优势的结论.依据几何绕射理论(GTD),通过Matlab仿真方法得到HRRP(高分辨距离像)数据,并以这些数据作为训练和测试样本,结合SVM分类方法,分别测试比较了基于4种不同核函数的分类识别性能,得出基于高斯核函数主成分分析的自动目标识别系统性能明显好于其他3种核函数的结论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号