期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于核的自组织映射聚类 总被引：1，自引：0，他引：1

肖云韩崇昭王选宏张俊杰《西安交通大学学报》2005,39(12):1307-1310

将核学习的方法应用于自组织映射聚类中,提出了一种核自组织映射聚类算法.该算法以核函数代替原始数据在特征空间中映射值的内积,并且神经元权值向量的初始化和更新都可由其组合系数向量表示,从而获得了直观而简单的迭代公式.分析了算法中学习速率过高会降低学习稳定性、学习速率过低又会降低收敛速度等参数选择问题,给出了一组折中考虑学习稳定性和收敛速度要求的参数初始值.实验结果表明,核自组织映射聚类对于非椭圆型的类分布数据,如环形数据,聚类正确率也能够达到99.886 4%.对IRIS数据集和入侵检测报警数据的聚类也证明了核自组织映射聚类方法的良好性能. 相似文献

2.

基于可分性的多类目标特征选择算法 总被引：1，自引：0，他引：1

任双桥高勋章黎湘庄钊文《自然科学进展》2007,17(4):520-528

对于多类目标识别,首先通过扩展类别标示符编码,给出了特征线性可分定义,基于Farkas引理推导了多类目标线性可分的充要条件．然后,借鉴支撑矢量机原理,在特征可分条件的基础上,定义了特征有效率并提出了一种新的多类目标特征选择方法．实测数据实验结果表明,与经典的Relief特征选择算法相比,文中算法的推广性能优于前者．特别地,对于小样本数据效果更为明显．相似文献

3.

K-均值算法聚类分析及其在人力资源管理中的应用 总被引：2，自引：0，他引：2

刘艳丽刘希玉孟岩《山东科学》2008,21(2):33-38

本文提出了一种改进的K-均值聚类算法,在基本K-均值算法的基础上运用基于密度选择初始中心点并且通过学习特征权值改进聚类效果,克服了基本K-均值算法初始中心点难以确定、聚类结果不稳定的缺点;然后建立了一种基于改进的K-均值算法的人事管理系统聚类分析模型,本模型采用SQL Server2000数据库实现并成功运用于国内一家知名软件企业的人力资源管理系统中,为该企业选聘人才和用好人才提供了有益的参考。相似文献

4.

一种基于核的模糊聚类算法 总被引：4，自引：2，他引：4

曲福恒马驷良胡雅婷《吉林大学学报(理学版)》2008,46(6):1137-1141

结合核技术与改进的模糊c均值算法聚类准则提出一种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、空间复杂度与较好的聚类性能. 相似文献

5.

自动权值的马尔科夫彩色图像纹理分割方法

岳同森王大海《佛山科学技术学院学报(自然科学版)》2014,(3):80-84

为准确获得目标图像,提出一种自动权值的马尔科夫彩色图像纹理分割方法。在HSV颜色空间中以颜色直方图作为颜色特征．设计Gabor滤波器提取图像纹理特征,对马尔科夫算法进行研究．设计自动权值算法。实验证明．该方法能有效降低算法复杂度,减少了分割过程中人为设置参数的主观性．较好地屏蔽图像噪声影响,可以很好地提取出目标图像。相似文献

6.

一种改进的SOFM聚类算法研究 总被引：2，自引：0，他引：2

下载免费PDF全文

樊劲辉陆薇李争《河北科技大学学报》2012,33(6):514-518

针对常规SOFM(self-organizing feature map)无监督的神经网络,提出了一种改进的自组织特征映射SOFM神经网络算法。在常规SOFM网络数据聚类算法基础上,分析了其在实际应用中存在的不足,对初始权值设定以及邻域范围选择等方面进行了算法的优化和改进,进而提高了SOFM神经网络聚类算法的正确率、收敛速度和实时性,并利用仿真实验进一步对提出的改进算法进行了验证。相似文献

7.

基于自组织特征映射聚类的协同过滤推荐算法

高琳琦李从东《天津大学学报(自然科学与工程技术版)》2006,39(Z1):279-282

个性化推荐系统是电子商务系统的一个重要研究内容,计算顾客之间的相似性或顾客聚类是产生良好推荐的关键．通过分析个性化推荐的应用特征,即顾客评分数据稀疏及其影响；在开放的电子商务环境中,新顾客不断加入和顾客偏好的迁移,使顾客簇不断发生变化,提出了一种基于自组织特征映射聚类的协同过滤推荐算法,对高堆稀疏的样本进行动态聚类．它具有下列特点：①在自组织特征映射聚类中,引入抑制函数,使其能够适应顾客评分数据的稀疏性；②设置神经元的分裂和合并过程,使其能够满足顾客聚类的动态变化．通过实验分析,表明该算法能够适应顾客评分数据稀疏和顾客聚类的动态变化特征,从而提高推荐质量．相似文献

8.

混合测量子空间聚类算法的研究

金利英赵升吨《西安交通大学学报》2018,(3)

针对闵可夫斯基子空间聚类算法对特征权重分配的问题,提出了一种混合测量子空间聚类算法(iMWK-HD),以实现调节特征权重因子和提高算法性能的目的。利用闵可夫斯基距离与余弦相结合的混合测量来分配特征权重,构造新的目标函数;在聚类迭代过程中,采用智能K-means进行初始化来解决选择正确类数的问题;根据新的目标函数,使用拉格朗日乘子法求解新的隶属度和特征权重更新公式,使类中心更加稳定,从而促进特征空间转换,获取数据集最优聚类结果。采用UCI数据集设计了对比实验,实验结果表明,iMWK-HD算法优于iK-means、iWK-means、iMWK-means这3个现有的聚类算法,所提算法能有效提升聚类精确度和聚类结果的稳定性。相似文献

9.

基于数据场的Kohonen聚类神经网络

姜伟《辽宁师范大学学报(自然科学版)》2007,30(1):8-11

Kohonen聚类神经网络（KCN）在处理数据集的聚类问题时具有良好的准确性.但KCN算法在随机选取初始权值时存在不足,而且在处理存在孤立点和“噪声”时算法鲁棒性和可靠性较差.使用数据场的概念对KCN聚类算法进行了有益的改进.实验表明,改进后的算法相对于随机选取初始权值具有较高的准确率。摘要：Kohonen聚类神经网络（KCN）在处理数据集的聚类问题时具有良好的准确性．但KCN算法在随机选取初始权值时存在不足，而且在处理存在孤立点和“噪声”时算法鲁棒性和可靠性较差．使用数据场的概念对KCN聚类算法进行了有益的改进．实验表明．改进后的算法相对于随机选取初始权值具有较高的准确率．相似文献

10.

面向高维特征故障数据的进化软子空间聚类算法

夏虎庄健于德弘《西安交通大学学报》2013,47(5):115-120

针对复杂机械设备故障诊断中特征量众多且对各种故障敏感程度不同的现象,提出了采用软子空间聚类算法来实现故障的识别方法。同时,针对传统软子空间聚类易陷入局部最优,目标函数设计受限制的缺点,又提出了采用进化计算实现聚类的方法。利用同类样本在相关特征维上方差小的假设,新的目标函数能更好地评价聚类结果的质量。在该算法中,通过设计类中心和权重值的混合编码以及聚类导向搜索算子,使算法更适于聚类问题的优化,而且设计的修复算子可有效地去除不合理的聚类结果。采用5组UCI数据集、2组轴承滚珠故障数据集和3组往复式压缩机气阀故障数据集对算法进行了测试,结果表明:该算法明显好于几种的软子空间聚类算法,在Rand指标上最多可高出0.226 6,并且对2组不同工况下一级缸气阀故障可实现100%的故障识别。相似文献

11.

一种广义加权模糊聚类算法 总被引：2，自引：0，他引：2

包志强吴顺君韩冰《华中科技大学学报(自然科学版)》2007,35(Z1)

提出了一种广义的加权模糊聚类新算法来处理具有不同特征贡献和不同数据分布的混合属性数据.分别利用样本概率密度思想和ReliefF算法为每一个样本和每一维特征分配权值,通过样本和特征的加权,将模糊c均值算法、模糊c-modes算法、模糊c-原型算法以及样本加权聚类算法统一为一个通用的框架.不同测试数据集的实验结果证明,这种广义的模糊聚类新算法对于处理不同分布以及具有不同特征贡献的大数据集是相当有效的. 相似文献

12.

降噪分层映射算法在多维聚类分析中的优化研究

刘云张轶郑文凤《四川大学学报(自然科学版)》2022,59(1):013001-86

为了在多维聚类分析中运用有效的深度特征选择方法排除冗余和无关的特征属性,学习数据元素的非线性关系提取最佳特征,提出一种降噪分层映射算法(DHM).首先,基于降噪自动编码器构建非循环神经网络,容错数据经过隐藏层加权和激活函数的训练获取输入数据的非线性关系得到特征空间,实现特征重构选取最佳特征.其次,特征空间用于调整自组织特征映射神经网,通过计算最小化加权平方欧式距离寻找匹配的获胜神经元.最后,结合特征选择网络和无监督聚类网络为降噪分层映射神经网,通过整体模型迭代训练,使权重参数和偏差向量同时得到优化,实现有效的无监督聚类方案.在真实数据集上的实验结果表明,同AESOM,DCSOM和S-SOM算法相比,DHM算法在提高聚类质量及准确性方面有更好的表现. 相似文献

13.

基于高维特征聚类优化的随机森林算法研究

下载免费PDF全文

王博庄暨军熊军罗小臣《井冈山大学学报(自然科学版)》2022,43(5):52-56

针对传统的随机森林算法（RF）在对高维特征数据集计算速度慢、聚类效果不佳的缺陷,提出了一种基于高维特征聚类的随机森林算法（HDFC-RF）,首先用传统RF方法对初始高维数据集聚类后,使用K均值聚类（KM）和模糊C-均值（FCM）结合,计算样本相似度,并对聚类特征划分族群,最后通过计算DBI指标,并与相关性阈值δ比较和排序,得到最终的高维特征序列。将HDFC-RF算法应用于高维特征数据集Colon Tumor,与传统的RF和FSRF算法比较。实验结果表明,HDFC-RF算法对于高维特征的数据集具有更好的聚类效果、训练速度也更快,具备良好的可行性。相似文献

14.

一种基于概率的快速聚类算法

李婧《渝州大学学报(自然科学版)》2014,(2):61-65

在聚类算法和特征向量维数确定的模式样本集中,各样本的每一维表示一个对应特征;鉴于此在基于层次算法的基础上,提出了一种基于概率的快速聚类算法;该算法先对各个特征进行分类,然后按照概率准则,每个向量先自成一类,将其对应概率最大的特征向量合并,减少类别数,直至达到要求为止;用UCI中的Iris和Wine数据集对该算法进行仿真实验,实验数据表明：用该算法进行聚类,能获得较好的聚类结果,说明算法具有一定的有效性. 相似文献

15.

考试成绩的频数分布统计算法评述与实验研究

解敏赵永华王险峰《云南大学学报(自然科学版)》2011,(Z1)

为了对考试分析中频数分布统计算法的选择提供参考,分析了3类考试分析算法的特点与应用条件,即分组算法(传统、正态特征和斯特杰斯)、改进划分点算法(划分聚类)和频数统计算法(简单、模糊频数统计)的分析,并针对考试分析任务的需要提出对划分聚类、模糊频数统计法的改进算法;通过在实际考试样本和模拟样本上组合运用分组算法和频数统计算法,提出从分组质量、分组有效性、算法执行时间、算法适应性4个维度对算法的9种组合进行实验评估.结果表明斯特杰斯(Sturges)法分组效果较好,划分聚类法分组质量较高,模糊频数统计能在一定程度上改善频数统计的效果. 相似文献

16.

基于特征融合的说话人聚类算法

郑艳姜源祥《东北大学学报(自然科学版)》2021,42(7):952-959

针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将MFCC特征参数和LPCC特征参数相结合,从而完善说话人的个性信息.并在k-means... 相似文献

17.

基于自适应邻域互信息与谱聚类的特征选择

孙林梁娜徐久成《山东大学学报(理学版)》2022,57(12):13-24

借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。相似文献

18.

文本聚类中的特征降维方法研究

毛嘉莉《西华师范大学学报(哲学社会科学版)》2009,(4):365-368

文本聚类的关键是对高维的特征集进行降维．本文对常用的一些特征选择、特征抽取等主流特征降维方法进行了介绍,分析了它们各自的特点及其适用范围．相似文献

19.

基于类间损失和多视图融合的深度嵌入聚类

郭晴晴王卫卫《吉林大学学报(理学版)》2023,61(1):101-110

针对深度嵌入聚类方法仅考虑类内关系及多视图聚类存在特征表示不足等问题,提出一种基于类间损失和多视图特征融合的深度嵌入聚类方法,该方法在深度嵌入聚类的损失函数中引进一个新的正则项提高类判别性.先通过自动编码器提取多视图数据的特征表示,对不同视图的特征表示进行融合得到公共表示,基于此得到数据的软分配分布和辅助目标分布;再对公共表示和聚类分配进行联合优化得到最终的聚类结果.在多视图数据集上的实验结果表明,该方法能有效提高聚类性能. 相似文献