首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对基于仿射包的图像集人脸识别方法(AHISD)对于异常值数据的敏感性,提出了一种鲁棒性更强的方法(R1-AHISD).以仿射包模型对图像集建模,通过R1-PCA算法获得仿射子空间的正交基,进而计算定义的仿射包之间的距离,以最近邻分类器得到分类结果.在Honda/UCSD数据库上的仿真实验表明,本方法可以有效地提高识别率和对异常值数据的鲁棒性.  相似文献   

2.
非负矩阵分解方法(non-negative matrix factorization,NMF)广泛应用于图像聚类、计算机视觉、信息检索等领域。但是,现有的NMF方法还存在一些不足之处:①NMF方法直接在高维原始图像数据集上计算它的低维表示,而实际上原始图像数据集的有效信息常常隐藏在它的低秩结构中;②NMF方法还存在对噪声敏感以及鲁棒性差的缺点。为了提高NMF算法的鲁棒性和可解释性,提出一种稀疏图正则化的非负低秩矩阵分解算法(sparse graph regularized non-negative low-rank matrix factorization,SGNLMF)。通过低秩约束和图正则化,SGNLMF算法同时利用了数据的几何信息和有效低秩结构;此外,SGNLMF算法还对基矩阵加以稀疏约束,使得其鲁棒性和可解释性均有一定的提升。还提出了一种求解SGNLMF的迭代算法,并从理论上分析了该求解算法的收敛性。通过在ORL和YaleB数据库上的实验结果表明SGNLMF算法的有效性。  相似文献   

3.
一种鲁棒的子空间聚类算法   总被引:2,自引:1,他引:1  
针对聚类分析常面临的维数灾难和噪声污染问题,将样本加权思想与子空间聚类算法相结合,提出了一种鲁棒的子空间聚类算法.该算法结合现有子空间聚类方法,为每个类簇计算一个反映各维度聚类贡献程度的权矢量,并利用该权矢量对各维度加权组合,得到各类簇所处的子空间.此外,算法还为每个样本分配一个反映离群程度的尺度参数,以区分正常样本和离群点在聚类过程中的地位,保证算法的鲁棒性.在二维数据集、高维数据集以及基因数据集上的对比实验结果表明,对于具有不同噪声比例的各种维度数据集,该算法均能取得较高的聚类精度,表现出较好的鲁棒性.  相似文献   

4.
传统的核方法如支持向量机在迭代时间、推广能力和鲁棒性等方面不够理想。针对上述问题,给出了基于半无限线性规划(SILP)的多核学习算法,并将其应用在UCI机器学习数据库的二分类和多分类数据集中。该算法用列生成和块算法的方法,固定次优参数并确定工作集后求解优化问题,提高了算法的速度。实验表明,该算法的分类效果比传统支持向量机算法结果更优,具有更好的鲁棒性和普遍适用性。  相似文献   

5.
混合属性数据聚类融合算法   总被引:5,自引:0,他引:5  
混合属性数据集是现实世界特别是商业金融数据库中最普遍的数据集类型,但适用于这类数据集的聚类算法极少。该文根据聚类融合的方法体系,针对混合属性数据集的特点,提出了基于聚类融合的混合属性特征聚类算法(CEM C),建立了算法框架,列出了算法目标函数和算法主要步骤,并分析了算法复杂度。该算法可以有效处理混合属性海量数据集。用真实数据集验证了算法,并将此算法应用于实际的客户关系管理数据分析中,得到了较好效果。  相似文献   

6.
针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。  相似文献   

7.
介绍了 k -means 和 DBSCAN 聚类算法的基本原理和优缺点,针对传统聚类算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进,在 k -means 和 DBSCAN 聚类算法的基础之上,结合增量聚类的思想和数据之间相异度的计算方法,提出了基于密度的增量 k -means 聚类算法,有效处理具有高维混合属性的数据集,改进了数据相异度的计算方法。  相似文献   

8.
将数据集进行合理的维数约简,对于提高一些机器学习算法的效率起着至关重要的影响.本文提出了一种自适应全局—局部集成判别分析算法(Adaptive integrated global and local discriminant analysis,AIGLD).AILGD利用数据集的全局判别结构和局部判别结构,将线性判别算法(Linear Discriminant Analysis,LDA)与提出的局部判别算法自适应的相结合.在UCI数据库及标准人脸数据库上的识别实验证明,相比于现有算法,AIGLD具有更高的识别准确率及更强的鲁棒性.  相似文献   

9.
提出了利用过程历史数据自动进行数据挖掘的PID参数在线自整定算法。算法以PID回路的动态响应特性为依据,通过给定ε-不敏感损失函数、辨识信任度函数,从可行数据集中选取有效数据集,以此作为回路参数自整定的有效数据。为确保PID控制尽可能达到最佳性能和鲁棒性,提出了基于对象组进行IMC-PID参数整定的方法。算法已应用于多个生产装置上,实际的投运结果表明,这种算法具有简便易用,推广能力强等特点,是PID参数整定算法中一种切实可行的算法。  相似文献   

10.
针对特征选择算法对不同类型的数据集性能不稳定的问题,提出一种基于概率模型与改进Shapley权力指数的通用特征选择算法.首先,计算特征对类簇表征与类簇判别的重要性值;然后,计算特征对类簇的不确定度;最终,合并特征的重要性值与不确定度,提取合适的特征.因为概率模型对数据类型、数据缺陷具有较好的鲁棒性,所以对不同的数据集获得了稳定、高性能的特征选择效果.基于人工合成数据与benchmark数据集的实验结果表明,本算法对不同的数据集保持了稳定的特征选择效果,优于其他算法.  相似文献   

11.
针对特征选择算法对不同类型的数据集性能不稳定的问题,提出一种基于概率模型与改进Shapley权力指数的通用特征选择算法.首先,计算特征对类簇表征与类簇判别的重要性值;然后,计算特征对类簇的不确定度;最终,合并特征的重要性值与不确定度,提取合适的特征.因为概率模型对数据类型、数据缺陷具有较好的鲁棒性,所以对不同的数据集获得了稳定、高性能的特征选择效果.基于人工合成数据与benchmark数据集的实验结果表明,本算法对不同的数据集保持了稳定的特征选择效果,优于其他算法.  相似文献   

12.
粗糙集模型作为一种重要的粒计算模型,是处理数据的重要工具.在实际生活中,由于数据来源的多样性,信息系统常出现集值型数据,这些信息系统被称为集值信息系统.由于信息的更新,集值信息系统中的属性集会发生动态变化,因此,基于局部相容粗糙集模型,研究用矩阵来表示其上、下近似的方法,讨论随着属性集的动态变化局部关系矩阵的变化以及上、下近似的变化,并通过具体实例说明提出的更新方法在处理集值型数据时的有效性.最后给出与增量方法对应的算法,并在UCI数据库中选取了几组数据进行实验.实验结果证明,这种通过矩阵表示上、下近似并对其进行更新的方法是有效的,可以提高计算效率,降低时间复杂度.  相似文献   

13.
为了更为有效地挖掘复杂网络中综合影响力高的节点集、提高重要节点集挖掘算法的准确性,针对节点集中各节点在信息传播中不同程度的相互促进和相互抑制作用,基于DynamicRank算法设计了一种新的级联概率计算模型。通过增强贪心策略,优先从种子集邻居以外的节点中选取备选节点,减小种子集内重叠邻居对信息传播引发的抑制作用;利用级联概率计算模型,增强种子集对信息传播的级联促进作用。在4个实际网络上采用SIR模型进行了测试,实验结果表明,相较于已有重要节点挖掘方法H-index、Degree、DynamicRank、VoteRank和EnRenew,提出的算法挖掘出的节点集具有更高影响力。特别地,在Grid数据集上,本文方法挖掘出的种子集的传播范围比对比算法平均提升了49.3%。提出的算法针对信息传播概率和贪心策略的改进有利于重要节点集的挖掘和识别。  相似文献   

14.
针对现有推荐算法鲁棒性差的问题,提出一种融入个体特征差异的鲁棒协同过滤推荐算法.首先,根据用户评分信息的分布情况,给出用户评分个数偏离度和用户近邻平均相似度两个个体特征计算方法;然后基于真实用户和攻击用户个体特征的差异性,提出一种可疑用户标记算法;最后将可疑用户标记算法与矩阵分解技术相结合,对目标用户进行推荐.在Movie Lens数据集上通过实验比较了提出的算法和其他相关算法的性能,实验结果表明算法不仅能够提高推荐精度,而且具有较强的鲁棒性.  相似文献   

15.
现有的步态识别方法对行人轮廓匹配的鲁棒性差,导致识别率不高.文章提出了基于Hausdorff距离的行人步态自动识别方法.首先提取了行人二值轮廓序列;然后采用轮廓参考点分布直方图间的距离、参考点集之间Hausdorff距离度量轮廓形状问的匹配度;继而通过步态的周期性分析选取关键姿态,计算出的关键姿态轮廓集间Hausdorff离结合窗口搜索策略实现了步态的分类和识别.分别在小型CASIA室外步态数据库和大型Soton室内库上进行了实验,提出算法的正确识别率分别可达到91.25%和88.16%.与相关文献的比较分析表明算法是有效的.  相似文献   

16.
许多已提出的规则提取算法不适用于混合数据,而混合数据广泛存在于实际应用中.针对上述问题,提出了一种基于多粒度一致覆盖约简的规则学习方法.首先,在不同粒度下导出每个样本的多粒度表示,从而获得所有粒度下每个样本的最大一致规则;其次,基于一致性的原则计算每个最大一致规则的权重;最后,提出了一种基于最大一致规则权重的覆盖约简算法以获得最小规则集.实验结果表明:所提出的算法能够有效地选择一组最小规则集,相比一些常见的规则提取技术,所提出的算法具有更好的分类性能.另外,所提算法在噪声扰动下具有更好的鲁棒性.  相似文献   

17.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

18.
CCCV2017发布遥感图像飞机数据集,用于评测飞机检测算法.针对该遥感图像数据集中的飞机朝向不确定、图像覆盖范围广、图像背景复杂度高,导致飞机检测难度大、检测算法准确率和算法泛化能力低等问题,提出了基于Faster-RCNN的飞机检测改进算法.首先,通过对图像采用翻转以及角度旋转等方式对数据集进行合理的扩增;然后,在扩增后的数据集上,使用深度残差网络对图像进行特征提取,针对数据集中飞机目标的长宽比特点优化区域建议网络;同时,为了防止训练集中正负样本不均衡,采用在线困难样本挖掘方法对数据进行训练.在CCCV2017数据集上评估表明,改进后的Faster-RCNN算法极大提高了初始的Faster-RCNN算法性能,在测试集上m AP达到了89.93%.在NWPUVHR-10、NWPU-RESISC45、UCAS-AOD遥感图像飞机数据集测试表明,该改进模型同样具有良好的性能,从而验证了该模型具有良好的鲁棒性和泛化能力.  相似文献   

19.
针对现有大部分车辆检测与跟踪数据集通常存在的采集场景单一、数据集长尾分布以及图像采集环境简单等问题,本文构建一个车辆数据集VeDT-MSS,用于城市以及乡村监控场景下4种车辆类别(小汽车、卡车、公交车和摩托车)的检测以及跟踪研究。该数据集具有交通场景多样化、卡车的类内多样性大、摩托车标注实例占比高以及背景复杂程度高4个显著特性。为了验证该数据集的有效性,在目标检测以及多目标跟踪任务上进行了大量的基线实验。实验结果表明,VeDT-MSS数据集在评估现有算法的鲁棒性和泛化性方面具有实用性。该数据集的提出对促进车辆检测与跟踪研究具有相当的潜力,并为计算机视觉社区评估算法性能提供一个新的数据选择。  相似文献   

20.
针对传统Mashup服务推荐在网络构建方式的成本和计算复杂性过高问题, 提出一种基于半监督层次聚类描述的Mashup服务推荐算法. 首先, 利用网爬工具收集ProgrammableWeb上的Mashup服务信息, 并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式, 以此作为研究分析的数据集; 其次, 为提高聚类精度, 提出一种半监督层次描述聚类算法, 通过植入层次聚类算法顶层核心集方式, 有效解决了传统层次描述聚类因顶层分类集构造失败而影响Mashup服务推荐算法的准确度. 通过在聚类数据集和网爬Mashup服务数据库上的实验表明, 该算法的Mashup服务推荐准确率优于对比算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号