首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
核聚类算法是一种能够处理样本间差异微弱的有效聚类算法.以粗糙集理论为基础,将基于属性重要度的属性约简算法应用到核聚类算法中,提出一种新的聚类改进算法,由此可以得到高准确率低复杂度的良好结果.该算法在使用核函数对样本优化前,首先用基于属性重要度的约简算法对样本属性进行处理,同时引入信息熵来改进约简算法,从而删除冗余属性得...  相似文献   

2.
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法。该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的 K-means 聚类算法将数据集划分成微聚类,并检测微聚类的离群点。通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度。  相似文献   

3.
针对传统属性约简算法利用等价关系计算过程烦琐、运行时间较长的问题,定义能体现属性间相关程度的绝对关联度,提出一种基于粒化可拓决策的属性约简算法。首先,利用K-means聚类算法,对原始数据集进行粒化,得到各簇中心;其次,运用可拓决策理论确定经典域、节域和待评物元,通过计算各簇中属性之间的关联度构建指示矩阵,并计算各属性的指示值;最后,根据指示值,从大到小依次选择属性,实现样本集属性约简。实验结果表明,算法运算速度较快,约简后对数据集分类精度影响小,部分数据集分类精度有所提升,验证了算法的有效性。  相似文献   

4.
针对K-means算法因随机选取聚类中心而易造成聚类结果不稳定的问题,提出PCA-KDKM算法。该算法使用主成分分析法对数据集的属性降维,提取主属性;利用k′dist曲线自动获取k值;计算平缓曲线上所含数据对象的均值并选取其中一值,作为首个初始聚类中心;利用基于密度和最大最小距离的算法思想进行聚类;结合类间距离和类内聚类提出聚类质量评价函数。将该算法与K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定,聚类准确率高。将PCA-KDKM算法应用在微博舆情分析中,抓取不同类别的数万条数据进行聚类分析。实验结果表明,PCA-KDKM算法在微博舆情分析中有更高的准确性和稳定性,有利于及时发现热点舆情。  相似文献   

5.
模糊C-means算法是一种重要的聚类分析算法,但是在数据维数较高的情况下,该算法计算量急剧上升从而导致其效率较低.针对这一问题,提出了一种基于粗糙集理论的模糊C-means高维数据聚类算法,该算法在传统模糊C-means算法的基础上引入了粗糙集属性约简的理念,通过对数据集属性的约简,提取出对分类影响较大的属性集而摒弃与分类无关的属性,进而在聚类过程中只计算属性约简结果集中的属性,从而减少聚类过程的工作量、提高聚类效率.理论分析和实验结果表明,该算法在处理高维数据时较高效.  相似文献   

6.
针对目前远程教育中个性化教学水平较低的问题,提出了一种基于粗糙集的Web学习者聚类算法,并应用粗糙集的约简方法解决了学习者特征数据中的属性冗余问题,提高了聚类算法的效率,从而提高了远程教学网站的个性化教学水平.  相似文献   

7.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

8.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

9.
基于模糊粗糙集的一种属性约简算法   总被引:1,自引:0,他引:1  
将粗糙集理论与模糊集理论相结合,提出了一种基于模糊粗糙集的属性约简算法。该方法引入了模糊C均值聚类算法用以连续属性的模糊化;并通过聚类有效性分析来确定最佳分类数目;克服了目前属性模糊化方法需要人为规定划分类数,几乎不考虑信息系统的具体属性值等缺点。实例验证了此方法的有效性。  相似文献   

10.
海量数据属性约简的研究是数据挖掘研究中的一个难点。已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理。结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法。利用该算法可以快速得到海量数据的属性约简结果。仿真实验结果说明了该算法的高效性。  相似文献   

11.
海量数据属性约简的研究是数据挖掘研究中的一个难点.已有的许多属性约简算法对于空间复杂度考虑得不够,导致了算法不能适应大数据集的约简处理.结合分治法,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以快速得到海量数据的属性约简结果.仿真实验结果说明了该算法的高效性.  相似文献   

12.
针对临床路径决策分析聚类算法中聚类效果依赖于样本数据分布且处理数据效率低的问题,提出基于均衡分配方法的模糊K-means算法的临床路径决策方法.该算法利用文字数字化处理与加权计算来建立数据格式统一且关键属性突出的样本特征值矩阵;利用基于均衡分配方法的模糊K-means算法对上述样本进行聚类分析,得到最终的聚类中心与聚类结果,以此辅助医生进行临床路径决策.采用ECLIPSE编程进行仿真,与传统模糊K-means算法和基于减法聚类的FCM算法相比,采用该算法的迭代时间分别降低了26%与70%,迭代次数分别减少了33%和82%,平均目标函数最小值分别减小了32%和28%.实验表明,该算法能够有效降低聚类效果对于样本数据分布的依赖,同时数据聚类效率与质量也有显著的提高.  相似文献   

13.
基于优化GA属性约简的上证指数预测   总被引:1,自引:0,他引:1  
结合粗糙集的相关理论,优化了GA属性约简方法,针对上证指数预测的具体问题,对遗传算法的初始种群和适应度函数进行改进,将上证指数10年间数据的58个属性构成的训练集进行属性约简,并应用参数优化后的SVM分别以属性约简前后的数据集对开盘指数进行回归预测.仿真结果表明,用该算法进行属性约简后,原始数据集中冗余属性对预测结果的...  相似文献   

14.
属性约简是粗糙集理论中一个核心研究问题,在对粗糙集中属性约简相关理论研究的基础上,提出了一种新的基于属性重要性和依赖性相结合的GENRED_GROWTH属性约简算法.并通过CUI机器学习数据集测试实验,验证了该算法的有效性.  相似文献   

15.
在决策表中求取知识时可以进行属性约简,而属性约简中大部分算法都需计算核.文章基于现有的属性约简算法,提出了改进的约简算法.该算法不需要求核,从而节约了时间与空间,使粗糙集在面对大数据时能更好的处理.  相似文献   

16.
聂庆华  王彬 《科技信息》2009,(31):85-86,76
文主要介绍了粗糙集中的属性约简算法在在电信决策系统中客户流失方面的应用,描述了应用Spss Clementine对电信数据进行预处理,应用属性约简算法对处理后的电信客户的信息进行约简后的信息表,从而得出对电信客户流失影响最大的因素,并对结果进行分析作出决策。  相似文献   

17.
一种新的模糊C均值聚类算法   总被引:1,自引:1,他引:0  
传统的模糊C均值聚类算法及其变型在聚类过程中都假设所有的属性对聚类贡献相同,所以很难发现隐藏在部分属性中的类结构,也难以识别出重要属性.在实际应用中,噪声属性较为常见,并且会影响正常的聚类过程.鉴于以上原因,提出了一种新的基于属性加权的模糊C均值聚类算法,通过对人工数据和实际数据的聚类测试结果,证实了该算法的有效性.  相似文献   

18.
可辨识矩阵是粗集理论中可以标识决策属性和条件属性之间关系的矩阵。根据数据库的动态建立特性,提出了一种基于粗集理论中的可辨识矩阵的动态属性约简算法,利用数据的动态性和可辨识矩阵的特性对己有的属性约简进行修正,并通过实例证明了这种算法的有效性,该算法极大地节省了计算量,提高了算法的执行效率。  相似文献   

19.
可辨识矩阵是粗集理论中可以标识决策属性和条件属性之间关系的矩阵.根据数据库的动态建立特性,提出了一种基于粗集理论中的可辨识矩阵的动态属性约简算法,利用数据的动态性和可辨识矩阵的特性对己有的属性约简进行修正,并通过实例证明了这种算法的有效性,该算法极大地节省了计算量,提高了算法的执行效率.  相似文献   

20.
基于粗糙集属性变分区的属性约简   总被引:1,自引:1,他引:0  
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号