首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 598 毫秒
1.
针对不完整多视图聚类存在的缺陷,提出一种融合自表示和投影映射的统一框架.首先,利用自表示和样本存在指示矩阵学习一致相似图,它反映了样本间的公共相似关系;其次,利用投影映射将样本矩阵投影到超球面上,得到公共低维表示;最后,将两者通过谱表示嵌入在一起,解决了因多视图数据缺失引起的不完整多视图聚类问题.该算法在真实数据集上的实验结果优于其他算法,证明了算法的有效性.  相似文献   

2.
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准确度及聚类性能.在多个基因表达数据集上的实验结果表明,所提算法得到了更接近真实表达值的填补结果及更紧凑的聚类效果,且聚类结果具有统计显著性.  相似文献   

3.
基于K-means聚类和遗传算法的少数类样本采样方法研究   总被引:1,自引:0,他引:1  
传统的分类器对不均衡数据集的分类严重倾向于多数类.为了有效地提高不均衡数据集中少数类的分类性能,针对此问题提出了一种基于K-means聚类和遗传算法的少数类样本采样方法.通过K-means算法将少数类样本聚类分组,在每个聚类内使用遗传算法获取新样本并进行有效性验证,最后通过使用KNN和SVM分类器,在仿真实验中证明了方法的有效性.  相似文献   

4.
不完备数据聚类是聚类分析中的一个重要问题.现有的不完备数据聚类算法对缺失值仅填充一次进行聚类,没有充分利用数据的已知信息,致使填充效果不佳,影响了聚类的有效性.文章提出了一种基于动态填充的不完备数据聚类算法.首先利用均值填充法对缺失数据进行初始完备化,然后利用K-means算法对填充后的数据集进行聚类,同时用含缺失值对象所在类的类中心的相应属性值对其再次填充,直到聚类结果不再变化时停止.该算法在多个UCI数据集上进行了实验验证,结果表明算法是有效的.  相似文献   

5.
为提高K-means算法全局搜索能力,提升聚类效果,提出一种基于近似骨架和混合蛙跳算法的K-means方法。该方法首先利用经典的混合蛙跳算法取代K-means算法中原有迭代公式,获得更优秀的聚类结果;然后对获得的聚类结果,使用基于近似骨架和混合蛙跳算法的K-means算法不寻找聚类中心,而是直接对簇的划分进行修改。UCI数据集实验结果表明,使用改进的聚类算法获得的聚类结果,较其他算法结果更为优秀。最后将改进后的聚类算法应用到医学眼底病历图像中,可以得到较好的血管切割效果。  相似文献   

6.
K-means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统Kmeans算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K-means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子.然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中.算法有效降低离群点对K-means算法的影响,提高聚类结果的准确率.实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效降低离群点对K-means算法的影响,提高了聚类的精确率和稳定性.  相似文献   

7.
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是一个不可缺少的数据预处理过程,因此提出了一个基于统计度量的缺失值填补算法,名为灰色类中心缺失值填补(GCCMVI)方法,利用数据点的类中心和标准差来填补缺失值,此外,通过比较阈值和实例与类中心间相关性的大小关系,决定是否加上(减去)标准差,灰色关联分析用来计算相关性,在缺失值被填补后,得到的完整的数据集用来训练支持向量机(SVM)分类器.在三种类型不同的数据集上进行比较,以分类精度,填补效果,填补时间作为评估准则来衡量算法的有效性.实验结果表明,所提出的算法显著地提高了分类精度和填补效果.  相似文献   

8.
传统的分类器对不均衡数据集的分类严重倾向于多数类。为了有效地提高不均衡数据集中少数类的分类性能,针对此问题提出了一种基于K-means聚类和遗传算法的少数类样本采样方法。通过K-means算法将少数类样本聚类分组,在每个聚类内使用遗传算法获取新样本并进行有效性验证,最后通过使用KNN和SVM分类器,在仿真实验中证明了方法的有效性。  相似文献   

9.
目的探索同时确定K-means算法的最佳聚类数K和最佳初始聚类中心的方法,使K-means算法的聚类结果尽可能地收敛于全局最优解或近似全局最优解。方法以次胜者受罚竞争学习(Rival Penalized Competitive Learning,RPCL)作为K-means的预处理步骤,以其学习结果作为K-means的聚类数和初始聚类中心并依据数据集样本自然分布定义样本密度,将此密度引入RPCL的节点权值调整,以此密度RPCL的输出作为K-means的最佳聚类数K和最佳初始聚类中心。采用UCI机器学习数据库数据集以及随机生成的带有噪音点的人工模拟数据集进行实验测试,并用不同的聚类结果评价指标对聚类结果作了分析。结果提出的密度RPCL为K-means提供了最佳的类簇数和最佳的初始聚类中心。结论基于密度RPCL的K-means算法具有很好的聚类效果,对噪音数据有很强的抗干扰性能。  相似文献   

10.
针对传统K-means算法在初始质心选取的敏感性以及迭代计算的冗余性这两方面的缺陷,提出一种高效的聚类算法(ECA).根据数据对象的空间分布情况,首先采用空间划分预聚类算法(SDPCA)对数据集实现预聚类划分,然后采用基于邻近簇调整的优化聚类算法(OCANC)对预聚类成果进行优化处理,最终获取聚类成果.实验证明,该改进算法能消除对初始输入的敏感性,以更高的运行效率获取较高质量的聚类结果.  相似文献   

11.
粗糙集理论在多属性决策、数据挖掘、机器学习、人工智能等领域发挥着越来越大的作用。经典粗糙集理论主要利用不可分辨关系对完备信息系统形成的划分来定义知识的上、下近似集,并在此基础上进行知识约简,规则推理和决策。而现实生活中存在大量不完备信息系统。针对不完备信息系统的多属性决策问题,从非对称相似关系的角度提出基于粗集的多属性决策方法。  相似文献   

12.
针对现有的不完全数模糊聚类算法未考虑样本各维属性对聚类贡献不同的问题,提出了基于属性加权的不完全数模糊c均值聚类算法.利用ReliefF算法评价各维属性的重要程度,通过加权欧式距离将属性权重结合入聚类,并能实现在聚类迭代过程中的缺失属性、隶属度及聚类中心的一体化求解.实验结果表明,该算法强调了重要属性在不完全数模糊聚类中的作用,能够得到更为准确的聚类结果.  相似文献   

13.
基于分布不完整数据选择性分类器   总被引:1,自引:1,他引:0  
通过删除数据集中的无关属性和冗余属性构建的选择性分类器可以有效地提高分类精度和效率.由于处理不完整数据的复杂性,已有的选择性分类器大都是针对完整数据的.然而,现实中的数据通常是不完整的并且包含许多冗余属性或无关属性.为解决这一问题,在构建的不完整数据分类器DBNB的基础上给出了一种有效的选择性分类器:SDBNB.在12个标准的不完整数据集上的实验结果显示,SDBNB的分类准确率比分类效果较好的选择性不完整数据分类器SNB和SRBC平均高出0.69%和0.58%,而其标准离差比SNB和SRBC平均低0.11和0.05.这表明SDBNB不仅有较高的分类准确率,而且分类效果更稳定.  相似文献   

14.
经典粗糙集理论是面向完备信息系统的,为处理不完备信息系统.需要进行理论扩充.本文首先介绍了粗糙集理论的基础知识,然后对经典粗糙集理论在不完备信息系统中的几种扩充模型进行了介绍和分析,并对现有基于粗糙集理论的不完备信息系统知识获取方法的研究进行了总蛄,最后展望了谊理论未来的发展方向.  相似文献   

15.
提出了一种新的不完全树结构小波变换用于纹理特征提取,提出了一种与人类视觉过程相一致的多分辨率多通道纹理分析方法,它由(1)特征提取:使用不完全树结构小没变换抽取纹理特征;(2)基于模糊Kohonen聚类网络的特征粗分类:使用缩减的特征向量对网络进行训练,得到粗分割结果;(3)粗分割结果的细化等几部分构成。实验结果证明了本方法的有效性。  相似文献   

16.
多值不完备决策表的属性约简方法   总被引:1,自引:0,他引:1  
在许多情况下.现实世界的信息系统是不完备的.考虑包含不确定性和不精确性两种因素的不完备信息系统,建立了一种推广的粗糙集模型并对这种情况下的不完备决策表进行分析.研究了属性约简的方法,根据约简生成了决策规则。  相似文献   

17.
本文首先分析了博弈论中对不完备信息的描述,利用粗集中对不完备信息的处理方法,将完全信息与不完全信息进行了粗集特征区分.经典博弈论用概率来处理信息的不确定性,本文将信息的不确定性用粗集的方法进行描述,将信息的传递看作是粗传递,较为详细地讨论了信息粗传递在不完全信息动态博弈中的应用.本文为粗集和博弈论之间架起了桥梁,给博弈论中不确定信息的描述提供了新的方法和角度.  相似文献   

18.
当前针对不完备信息系统的性能优化方法大多只适于小规模信息系统,不适于混合存储架构下多样性高且规模大的信息系统,导致优化效果不佳。为此,提出一种新的混合存储架构下不完备信息系统的性能优化方法,对混合存储架构下不完备信息系统进行描述,给出相容关系、相容块和极大相容块的定义。通过相容填补法获取极大相容块,通过块中相容元素的相应非空属性值对数据进行填补,将混合存储架构下不完备信息系统转换成完备信息系统,以达到系统性能优化的目的。实验结果表明,所提方法可靠性高,优化效果好。  相似文献   

19.
鉴于已有的绝大多数选择性分类算法主要用于完整数据,而现实中的数据通常是不完整的并且包含许多冗余属性或无关属性,本文在已有工作基础上利用信息增益率构建了一种用于不完整数据的混合型的选择性贝叶斯分类器:GBSD.在12个标准的不完整数据集上的实验结果表明,GBSD不仅能大幅度减少属性数目,而且比已有工作更能有效改善分类准确率和效率.  相似文献   

20.
上海住房市场信息不完全度的时间与空间变化规律   总被引:1,自引:0,他引:1  
为定量计算住房市场的信息不完全度,并揭示住房市场信息不完全度的时间与空间变动规律,首先构建计算住房市场信息不完全度的公式和模型;其次利用上海2000—2007年住房市场交易数据,建立上海住房市场H edon ic价格模型,并计算了上海住房市场信息不完全度及其时间与空间分布。研究表明:上海住房市场的信息不完全度随时间表现出先逐年快速上升再逐年缓慢下降的趋势,2004年到达最高点;上海中心城区的住房市场信息不完全程度远高于周围城区,而各非中心城区之间差异不大。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号