首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
面对大量的涉税数据,为揭示纳税个体间内在的分类特性,发现其中偏离常规的异常纳税行为等,有效提高税源监管力度,针对税源监管的应用需求,分析了数据挖掘中常用聚类算法的特性,提出了基于DENCLUE密度聚类的改进方法。该方法不仅可以发现数据分布的典型聚簇模式,而且可以揭示对税源监管更有价值的离群模式。应用实践验证了该方法的有效性。  相似文献   

2.
一种新的层次谱聚类算法   总被引:1,自引:1,他引:0  
提出一种新的聚类算法——层次谱聚类算法.该算法在传统二分的SM谱聚类的过程中嵌入了层次聚类算法,目的是为了提高谱聚类的聚类正确率,同时又利用谱聚类纠正了层次聚类过程中所得到的歪斜划分.实验结果表明:提出的层次谱聚类算法的聚类正确率比层次聚类算法、谱聚类算法的聚类正确率都要高,同时又纠正了层次聚类过程中的歪斜划分.  相似文献   

3.
一种改进的k-means聚类算法在入侵检测中的应用   总被引:4,自引:0,他引:4  
讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果以及入侵检测的准确度。  相似文献   

4.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果.  相似文献   

5.
针对模糊聚类算法不适应复杂环境的问题,提出了一种新的动态进化聚类算法,克服了传统模糊聚类建模算法须事先确定规则数的缺陷。通过改进的遗传策略来优化染色体长度,实现对聚类个数进行全局寻优;利用FCM算法加快聚类中心参数的收敛;并引入免疫系统的记忆功能和疫苗接种机理,使算法能快速稳定地收敛到最优解。利用这种高效的动态聚类算法辨识模糊模型,可同时得到合适的模糊规则数和准确的前提参数,将其应用于控制过程可获得高精度的非线性模糊模型。  相似文献   

6.
在传统层次聚类基础上,提出并实现了一种基于距离的增量式聚类算法,并应用于粮食智能决策支持系统中,算法在保持层次聚类优点的基础上,利用原有的聚类结果提高聚类速度,并可以根据用户需要在聚类精度和聚类速度两方面选取一个适当的平衡点,有效地提高聚类分析的效率。  相似文献   

7.
运用模糊C-均值(FCM)聚类算法对数字图书馆的图书借阅数据进行数据挖掘,并使用误判率交叉估计法验证挖掘过程的有效性.通过分析聚类挖掘结果,寻找到读者借阅图书的潜在规律,并对各类图书的借阅质量进行判断,以提高图书馆的图书利用率,进一步优化馆藏.  相似文献   

8.
目的 通过对现有聚类常用算法的研究,给出一种适用于大规模中本数据集聚类的算法DBTC(density-based text clustering)。方法 采用在DBSCAN算法基础上改进提出的DBTC算法,对中本数据集进行聚类。结果 DBTC算法可以发现任意形状的簇,对中本聚类的准确率高达80%以上。结论 经过分析和实验证明DBTC算法比基本的DBSCAN算法更适合于大规模数据集。  相似文献   

9.
一种新的最近邻聚类算法   总被引:1,自引:0,他引:1  
在分析现有最近邻聚类算法所存在问题的基础上,提出了一种先利用均值规格化的思想来确定算法的初始半径,然后根据启发式规则修改聚类半径的新的最近邻聚类算法.同时,给出了聚类有效性函数对得到的聚类结果进行合理性判断.  相似文献   

10.
王娟 《科技信息》2012,(25):168+229-168,229
聚类算法作为一种重要的数据挖掘的方法,能找到样本中相对集中的区域。本文分析了一些常用聚类算法以及局限性,并且针对K-means算法中初始点的选择,讨论了一种改进的K-means算法的实现过程,以期得到比较理想的聚类效果。  相似文献   

11.
基于并行免疫遗传算法基因表达数据的动态模糊聚类   总被引:4,自引:1,他引:4  
提出一种改进的并行免疫遗传算法, 通过在群体规模上引入“岛”的概念, 实现了可变的群体规模; 通过在适应度函数内引入免疫算子, 避免了算法过早收敛. 因此, 解决了寻优算法中局部收敛的困扰, 提高了获得全局最优解的几率. 把此算法应用于斯坦福大学酵母细胞周期表达数据库的数据进行共表达聚类, 并将实验结果与Spellman按照功能基因组学进行聚类所得结果进行了对比, 证明了所给算法在功能基因组 学聚类上的有效性.  相似文献   

12.
A genetic clustering algorithm was developed based on dynamic niching with data attraction. The algorithm uses the concept of Coulomb attraction to model the attraction between data points. Then, the niches with data attraction are dynamically identified in each generation to automatically evolve the optimal number of clusters as well as the cluster centers of the data set without using cluster validity functions or a variance-covariance matrix. Therefore, this clustering scheme does not need to pre-specify the number of clusters as in existing methods. Several data sets with widely varying characteristics are used to demonstrate the superiority of this algorithm. Experimental results show that the performance of this clustering algorithm is high, effective, and flexible.  相似文献   

13.
许颖梅 《河南科学》2014,(5):777-780
数据流聚类算法是当前数据流研究领域里的重要分支,而滑动窗口是数据流中一种关注近期数据的近似方法,提出一种采用滑动窗口处理数据的优化算法SWStream.算法采用双层架构思想,在线阶段利用滑动窗口树存储概要结构,动态调整窗口大小.而在离线阶段对上一阶段的结果进行宏聚类,得到最后的结果.实验验证本算法有更高的处理效率,也相对节约内存.  相似文献   

14.
子空间聚类是一种将搜索局部化在相关维上进行的聚类算法,它能有效地克服数据因维度过高引起的在全空间上聚类的困难.针对高维分类型数据,本文提出了一种自底向上的子空间层次聚类算法,该算法在全局范围内建立一个最相似线性表用来记录每个簇类与其最相似的簇类的相似度,在聚类过程中,选取最相似的簇类合并,并通过维护此线性表产生最相似的簇类.此算法在基于信息熵的意义上能够较准确地搜索簇类的子空间.通过Zoo和Soybean两个典型的分类型数据实验发现,相对于其它相关聚类算法,该算法在聚类的准确率和稳定性方面表现出较高的优越性.  相似文献   

15.
In traditional data clustering, similarity of a cluster of objects is measured by distance between objects. Such measures are not appropriate for categorical data. A new clustering criterion to determine the similarity between points with categorical attributes is presented. Furthermore, a new clustering algorithm for categorical attributes is addressed. A single scan of the dataset yields a good clustering, and more additional passes can be used to improve the quality further.  相似文献   

16.
一种新的子空间聚类算法   总被引:1,自引:0,他引:1  
通过对数据空间进行网格划分并寻找稀疏区域来发现类的边界,提出了一种基于密度与网格的新的子空间聚类算法.该算法使用投影寻踪的搜索策略来发现存在于子空间内的类,同时运用基于竞争的修剪方式来有效地控制算法的计算复杂性.实验结果表明,所提算法在精度、时间复杂性等方面具有优良性能.  相似文献   

17.
基于模糊聚类理论的入侵检测数据分析   总被引:5,自引:0,他引:5  
入侵检测系统是网络和信息安全构架的重要组成部分,主要用于区分系统的正常活动和可疑及入侵模式,但是它所面临的挑战是如何有效的检测网络入侵行为以降低误报率和漏报率.基于已有入侵检测方法的不足提出利用模糊C-均值聚类方法对入侵检测数据进行分析,从而发现异常的网络行为模式.通过对CUP99数据集的检测试验表明该方法不但可行而且准确性及效率较高.  相似文献   

18.
通过对数据空间进行网格划分并寻找稀疏区域来发现类的边界,提出了一种基于密度与网格的新的子空间聚类算法.该算法使用投影寻踪的搜索策略来发现存在于子空间内的类,同时运用基于竞争的修剪方式来有效地控制算法的计算复杂性.实验结果表明,所提算法在精度、时间复杂性等方面具有优良性能.  相似文献   

19.
研究分析了现有代表性的无线传感网络路由协议,提出一种动态传感网络环境下的高效率高可靠的聚类路由算法.算法改善了能量消耗均衡性,避免了消息路由空洞现象,提高了数据传输高效性和可靠性,延长了网络的生命期.算法在无线传感网络环境监测项目中得到很好的验证和应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号