首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统吸引子传播算法(AP)聚类性能受偏向参数影响较大的问题, 提出一种改进的吸引子传播算法, 即基于稳定阈值的吸引子传播聚类算法(STAP). 该算法通过稳定阈值, 衡量获得真实类数时的收敛状态, 然后捕捉该状态下的偏向参数; 为加快算法的收敛速度, 采用S型函数作为收敛因子调节阻尼系数. 仿真模拟实验结果表明, 与传统吸引子传播聚类算法相比, 基于稳定阈值的吸引子传播聚类算法聚类精度更高, 收敛速度更快.  相似文献   

2.
传统吸引子传播聚类算法对数据类型敏感,文中提出一种改进的吸引子传播聚类算法,将JACCARD系数引入对象间属性分布相似度,并与吸引子传播聚类算法结合。仿真实验结果表明,该算法收敛速度快,聚类精度高,明显提高高维稀疏数据的聚类性能。  相似文献   

3.
针对样本基数较大、维数较高、特征较复杂的数据集训练问题,将支持向量机与蚁群优化算法相融合,提出一种自适应多核学习算法.利用吸引子传播聚类算法自适应地发现相似特征,并据此利用蚁群算法自适应地选择核函数参数,从而快速选择最优核函数.通过UCI数据集的5组数据实验表明,该算法相比于传统的支持向量机分类准确率和F1值更高,验证...  相似文献   

4.
基于信息熵改进的 K-means 动态聚类算法   总被引:3,自引:2,他引:1  
初始聚类中心及聚类过程产生的冗余信息是影响K-means算法聚类性能的主要因素,也是阻碍该算法性能提升的主要问题.因此,提出一个改进的K-means算法.改进算法通过采用信息熵对聚类对象进行赋权来修正聚类对象间的距离函数,并利用初始聚类的赋权函数选出质量较高的初始聚类中心点;然后,为算法的终止条件设定标准阈值来减少算法迭代次数,从而减少学习时间;最后,通过删除由信息动态变化而产生的冗余信息来减少动态聚类过程中的干扰,以使算法达到更准确更高效的聚类效果.实验结果表明,当数据样本数量较多时,相比于传统的K-means算法和其他改进的K-means算法,提出的算法在准确率和执行效率上都有较大提升.  相似文献   

5.
针对基于特征分布校准的小样本分类算法无法准确揭示新类特征分布的问题,提出一种融合隐空间变换和密度聚类的改进算法,以解决N way-K shot任务模式下的小样本图像分类问题.首先,通过广度残差神经网络提取基类和新类图像的深度特征;其次,采用隐空间变换方法约束新类特征分布,使其更接近正态分布;再次,利用密度聚类方法为新类选取合适基类,将基类统计信息迁移到新类,并通过多元正态分布矩阵实现样本扩充;最后,构建基于集成学习的分类器,完成小样本图像分类任务.实验结果表明,相比于传统特征分布校准方法,该算法的分类准确率更高.  相似文献   

6.
对于多模型软测量建模,聚类效果、子模型的建模和融合方式对其模型精度有重要影响。对此,该文提出一种基于改进仿射传播聚类的多模型软测量建模方法。为提高聚类精度,在仿射传播聚类算法划分样本数据的基础上,采用人工鱼群算法对仿射传播聚类算法的偏向参数和阻尼系数寻优,同时针对距离较近类别边界处的样本再建立重叠类,采用支持向量机建立各类样本的回归子模型。分别用标准数据集仿真和工业双酚A生产装置的现场数据建模仿真,结果证明该方法是有效的。  相似文献   

7.
针对谱聚类算法在处理较大规模的样本时,在存储空间和计算时间上都存在瓶颈问题,文章分析了目前常见的两种解决方式,即基于稀疏化t近邻的谱聚类和基于Nystr9m矩阵低秩逼近的谱聚类方法.为了进一步提高这两种谱聚类算法的准确度,提出了采取基于信息熵属性赋权的欧式距离来计算样本间的相似度的方法.首先,计算样本各属性的权重;然后,计算样本间的相似度矩阵并应用到稀疏化t近邻的谱聚类和Nystr9m矩阵低秩逼近的谱聚类方法中;最后,在多个数据集上进行了验证.实验结果表明该方法在一些数据集上的聚类精确度要比原来谱聚类算法高,尤其在Pendigits数据集上,基于信息熵赋权的稀疏化t近邻谱聚类比稀疏化t近邻谱聚类方法精确度提高15.11%.  相似文献   

8.
针对特征权重未知且具有直觉模糊数的特征信息的聚类分析问题,提出一种改进的基于直觉模糊集的模糊C均值聚类算法.首先,定义区域密度参数,选择高密度区域中相距最远的样本为初始聚类中心;然后,利用直觉模糊熵计算聚类样本的特征权重,对样本特征值进行加权处理.给出改进的FCM聚类算法的具体步骤,并进行了算例验证.研究结果表明,该算法不仅克服了FCM算法易陷入局部极小值的问题,同时大大减少迭代次数,加快了收敛速度,提高了聚类性能.  相似文献   

9.
基于图的标签传播算法是半监督学习中的研究热点之一,其性能很大程度依赖于图的质量.为了应对这一问题,文章提出了基于聚类的标签集成传播算法.该算法对样本集进行多次聚类,在每次聚类产生的簇中,利用互补熵度量簇内样本标签的混乱程度,并在混乱程度较小的簇中进行标签传播,当一个未标记样本获得某个标签的次数与聚类次数的比值大于50%...  相似文献   

10.
用聚类支持向量机模型监测环保设备运行状态   总被引:2,自引:0,他引:2  
针对环保设备多状态监测与识别问题,提出了一种基于多分类聚类支持向量机的分类算法模型.该算法模型充分利用多个相关联被监测设备及其状态属性特征,采用神经网络聚类分析获得关联特征的聚类子空间,再对聚类子空间构造二叉树支持向量机进行多分类识别.该算法模型避免了盲目分类,与单纯的支持向量机算法比较具有更好的分类性能.通过对日本大晃船用污水处理装置实测样本的训练、检验表明,该算法具有98%以上的分类识别率.  相似文献   

11.
针对宏观路网区域交通状态预报需要首先产生路网区域的需求,提出了一种新的基于交通指数聚类的路网区域动态划分方法.首先对整个城市路网进行网格化划分,将路段划分为从属于某个网格的子路段;然后,计算每个网格的交通指数,提取网格特征,从而得到样本特征矩阵;接着,利用k-means++聚类算法对样本特征矩阵进行聚类,得到初始聚类标...  相似文献   

12.
针对传统的以k-means为代表的分割聚类算法认为所有的聚类样本对聚类中心的影响都是相同的这一观点,提出基于样本加权的聚类算法,并采用实际数据集验证算法的有效性.实验表明,该算法比传统的k-means聚类算法具有更高的精确度.  相似文献   

13.
特征选择是机器学习和模式识别领域中的一个重要问题.本文提出一种非监督的特征选择算法,称为基于密度聚类和样本加权信息熵的特征选择算法(DCWIE).不同于传统的基于信息熵的特征选择算法,DCWIE使用一种加权的信息熵计算方法,增加对分类贡献大的样本的权值,并通过与聚类结合,实现无监督学习.实验结果表明了本文算法的有效性.  相似文献   

14.
随着大数据时代的到来,大量的高维数据在生活中无处不在.聚类是分析描述数据并按照某种相似性将数据归类的一项技术.传统聚类算法在面对高维数据时,往往无法进行有效的聚类处理.软子空间聚类是通过分配权重,描述样本隶属于不同簇的不确定性来进行聚类,然而,当数据残缺或信息不准时,现有的软子空间聚类的准确度和效率会受到很大的影响.从软子空间聚类面临的问题出发,提出一种改进的软子空间聚类算法;同时针对数据残缺不足的问题,引入迁移学习来削弱数据量不足对聚类分析的影响;通过引入信息熵的概念,用信息熵确定高维数据权重.实验证明,通过结合迁移学习和信息熵,有效地提高了软子空间聚类算法精确度和准确度.  相似文献   

15.
一种基于层次树的高效密度聚类算法   总被引:2,自引:1,他引:1  
基于密度的聚类算法具有挖掘任意形状聚类和处理"噪声"数据等优势,同时也存在时间消耗大、参数问题局限及输入顺序敏感等缺陷.为此,文章提出一种基于层次树的密度聚类算法DCHT(Density Clustering Based on Hierarchical Tree),以层次树描述子聚类信息,动态调整密度参数,基于密度探测树结构中相邻子聚类得到最终的聚类簇.理论分析和实验结果表明,该算法适用于大规模、高维数据,并具有动态调整参数和屏蔽输入顺序敏感性的优点.  相似文献   

16.
为提高噪声模型的估计精度,改善系统率失真性能,文中提出了一种基于残差子带分组聚类的自适应噪声模型估计方法.首先根据频率高低对残差子带进行分组,然后由组内子带残差样本生成特征矢量,进而利用改进的模糊c-均值聚类算法对当前解码子带进行聚类,最后计算出每类残差系数的噪声参数.实验结果表明,相比于相邻子带聚类-方差估计算法,文中所提算法能够更加准确地匹配残差分布特征,率失真性能平均提升0.60 d B,且解码时间平均节省40.59%.  相似文献   

17.
针对传统模糊聚类算法需提前设置参数和初始聚类中心, 导致聚类结果不稳定的问题, 提出一种基于权重差异度的动态模糊聚类算法. 首先引入样本特征权重向量和样本间差异度的概念, 对数据集分布情况进行描述, 并采用新的评价指标获取候选聚类中心; 然后根据最小差异度准则, 对剩余样本点进行分类; 最后结合Davies-Bouldin指数(DBI)评价准则对候选聚类中心做进一步筛选与合并. 实验结果表明, 该算法在不同测试数据集上的性能明显优于传统聚类算法, 具有更高的自适应性和稳定性.  相似文献   

18.
通过研究基于距离的孤立点发现算法(Cell-Based),指出其存在的问题,提出了一种基于核映射空间距离的入侵检测算法.该算法通过检测孤立点的方法进行入侵检测,首先将样本通过核函数映射到高维特征空间,重新定义特征空间中的数据点之间的距离.然后经过初始聚类算法确定聚类数目和初始类中心,再通过迭代优化目标函数来实现数据点的再聚类,最终得到聚类中心,超出聚类中心点半径r外的点即为孤立点.试验结果表明,该算法能有效突出样本之间的差异,克服传统基于距离的孤立点发现算法易随参数变化而需调整单元结构的缺点,且具有更准确的检测率和较快的收敛速度.  相似文献   

19.
一种鲁棒的子空间聚类算法   总被引:2,自引:1,他引:1  
针对聚类分析常面临的维数灾难和噪声污染问题,将样本加权思想与子空间聚类算法相结合,提出了一种鲁棒的子空间聚类算法.该算法结合现有子空间聚类方法,为每个类簇计算一个反映各维度聚类贡献程度的权矢量,并利用该权矢量对各维度加权组合,得到各类簇所处的子空间.此外,算法还为每个样本分配一个反映离群程度的尺度参数,以区分正常样本和离群点在聚类过程中的地位,保证算法的鲁棒性.在二维数据集、高维数据集以及基因数据集上的对比实验结果表明,对于具有不同噪声比例的各种维度数据集,该算法均能取得较高的聚类精度,表现出较好的鲁棒性.  相似文献   

20.
提出了一种新的谱聚类算法:基于K-Medoids的SSKM聚类,不仅利用距离指数变换函数及稀疏化算法构建了分块对角矩阵以重新解释样本之间的相似度,还结合PAM算法取代传统谱聚类中的k-means算法对特征向量聚类以提高算法的聚类稳定性.为了使SSKM算法能够有效地处理高维数据,引入了高相关系数过滤及主成分分析降维技术,提出了SSKM算法的新版本HSSKM,能够识别高维数据结构以减少原始数据的特征规模.模拟数据及高维基因表达数据结果表明新算法具有聚类稳定、聚类结果更精确等显著性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号