首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对犯罪空间聚集态研究算法中有关窗宽优化选择问题,将动态优化窗宽算法与DENCLUE(DENsity-based CLUstEring)算法结合,提出一种新的聚类算法。以入室盗窃案件为例,研究了该算法在犯罪热点探测方面的应用。结果显示引入优化窗宽算法后,可得到较为精确的聚类中心位置及概率密度变化趋势,并且当格网边长与邻近格网距离阈值及邻近点距离阈值之比为2¨3¨1时会得到较好的热点分析结果。通过分析犯罪热点分布图,可协助公安机关调整警力配置,加强案件高发区警力巡逻。  相似文献   

2.
对密度峰值聚类算法进行有效改进,计算各样本点之间的距离和各样本点局部密度,选择两者中较大的样本点作为聚类中心点,根据其余样本点与各中心点的距离设定样本点所属类别;引入K近邻算法对密度峰值聚类算法进行优化,求解各样本点的距离时只需要考虑其周围由邻近值决定的若干样本点,实现距离阈值的自动选取;根据距离矩阵计算样本点的密度,绘制决策图并选择簇内中心点,将剩余点根据密度值分配给离中心点距离最近的类;最后将K近邻-密度峰值聚类算法部署至Hadoop云计算平台,用于解决大规模数据聚类的问题。仿真结果表明,通过合理设置K近邻算法的近邻值k,K近邻-密度峰值聚类算法具有较好的大数据样本聚类性能,与常用聚类算法相比,该算法具有更高的聚类准确率和聚类效率,适用于大数据样本聚类。  相似文献   

3.
为了解决传统算法检测准确性低,复杂性高不适于电力大数据异常值检测的问题,通过密度峰值聚类算法研究了电力大数据异常值检测问题。分析了密度峰值聚类算法的聚类过程。按照聚类中心选择原则,通过相邻距离和密度的归一化乘积对聚类点的差异度进行衡量,按照差异度的统计特性与改变趋势选择最大的一组点当成聚类中心。按照z空间填充曲线与高维数据点z携带位置信息特性提出基于z的分布式密度峰值聚类算法,降低异常检测复杂性,以达到电力大数据异常值检测要求。采用优化后的密度峰值聚类算法对电力大数据异常值进行检测,在局部密度超过阈值,同时距离超过阈值的情况下,认为相应电力数据点为异常值。将基于距离的检测算法和基于密度的检测算法作为对比进行测试,结果表明:所提算法得到的异常电力数据点,和实际情况相符,和其他两种算法相比没有出现错检测和漏检测的情况。可见所提算法适于电力大数据异常值检测,且检测结果准确性高。  相似文献   

4.
当前,基于核密度估计的空间犯罪热点分析方法存在着无法确定热点的分布范围和难以支持警务决策等不足.相比之下,数据挖掘中的层次聚类算法则能够根据犯罪活动的位置信息确定出不同空间尺度下的犯罪热点的分布范围和具体的热点数量,因此具有更好的优势.该文介绍了层次聚类算法的基本原理,并基于实际案例数据对层次聚类算法与核密度估计算法的热点分析结果进行了比较,并对基于层次聚类算法的犯罪热点分析在情报分析和警务决策方面的应用进行了讨论.  相似文献   

5.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进...  相似文献   

6.
作者针对传统k-means初始点的选择提出基于最小距离的优化算法。首先构造数据点集的带权无向图,更新数据点间的最小距离,然后利用最小距离获取数据点的密度函数,通过数据点的密度获取初始聚类中心,最后根据带权无向图中的路径长度获取邻近数据点形成初始聚类,对初始聚类内的数据点平均得到该类簇的聚类中心。实验结果表明,在相同的条件下所提算法在聚类效果上优于传统的k-means算法。  相似文献   

7.
一种改进的聚类和孤立点检测算法   总被引:1,自引:0,他引:1  
对基于距离的聚类及基于密度的孤立点检测方法进行了分析研究,提出了一种基于距离和密度的聚类和孤立点检测算法DDBCOD.该算法根据距离和密度阈值对数据进行聚类,并发现数据中的孤立点.实验表明,该算法能够识别任意形状的聚类,对高维数据有效,能够很好地识别出孤立点.  相似文献   

8.
为快速有效地确定聚类中心,提出一种基于距离阈值的自适应K-均值聚类算法.首先确定合理的距离阈值,其次根据距离阈值确定初始聚类中心位置及个数,最后对位置相近的聚类中心簇进行合并,获得新的聚类中心位置及个数.结果表明,该方法可以自动确定k值及中心位置,有效避免将离群点错误聚类,从而改善了聚类效果.  相似文献   

9.
平衡迭代规约层次聚类(balanced iterative reducing and clustering using hierarchies, BIRCH)算法是一个综合的层次聚类算法。但BIRCH算法为叶子节点中的簇设置统一的空间阈值,根据数据对象与簇之间的距离来决定数据对象的插入位置,从而忽略了簇与簇之间的关系;此外,算法在分裂节点时,选取距离最远的2个聚类特征作为子簇,其他聚类特征会根据与这2个聚类特征之间的距离关系分裂为另外的子簇,造成处于簇与簇之间的样本数据错误分类,这样会忽略聚类特征之间的关系。针对BIRCH算法的这2个问题,提出了基于阈值的自适应算法,用于解决原算法统一空间阈值的问题;并在针对聚类特征关系的问题上,结合朴素贝叶斯算法对原算法进行改进。对改进后BIRCH算法与传统的算法进行仿真实验。结果表明,改进算法在损失效率的情况下,聚类效果得到了明显的改善,并且与其他算法相比,所提算法具有不错的表现性,而且具有跨数据集的鲁棒性。  相似文献   

10.
为了在多维聚类分析中运用有效距离度量方法表征数据对象的邻近度,提出一种协方差测距(covariance distance measure analysis,CDM)算法,首先,采用模糊C均值(fuzzy c-means,FCM)方法对数据对象赋予权值,得到每个样本点相对类别特征的隶属度,再依据隶属度计算每个样本的差异度;其次,为了使类别分离最大化,用样本点同关联类别的协方差距离度量代替模糊聚类中欧式距离度量作为优化问题的第一个标准,使相似数据对象更为接近;最后,用样本点间的协方差距离度量作为第二个优化标准,使相异数据相互隔开,交替固定变量迭代计算最优解,使聚类指标和距离度量学习参数同时得到优化,获得更好的聚类结果。在不同数据集上的实验结果表明,与FCM-Sig和UNCA算法相比,CDM算法在聚类准确性和算法收敛性方面均有更好表现。  相似文献   

11.
为了适应实时性强、资源有限类物联网应用的需求,提出一种相对于传统入侵检测方法能明显减少计算量的轻量级入侵检测方法.在训练过程中先对样本进行K-means聚类,使类内数据之间的距离最小、相似度最大;然后逐个对聚类结果进行主成分分析(principal component analysis,PCA),去除无关并保留相关性大的特征,构成该类的特征集;在检测过程中比较测试数据与训练过程中各聚美中心的欧式距离,选取最小距离对应的聚类中心,并将测试数据划归到该中心对应的聚类中;利用该类的特征集与测试数据中对应维度的数据对比来进行入侵检测,若比较结果超过阈值则报警,否则予以通过.仿真实验结果表明,该方法在明显缩短检测时间的同时,检测率可达96.8%.  相似文献   

12.
时空聚类(spatial-temporal density based spatial clustering of applications with noise,ST-DBSCAN)算法只能处理固定属性的时空数据,且其人为设定阈值的方法具有较大随机性会导致聚类结果不理想.基于ST-DBSCAN算法存在的不足,提出了一...  相似文献   

13.
一种基于距离的聚类和孤立点检测算法   总被引:2,自引:0,他引:2  
提出了一种基于距离的聚类和孤立点检测算法(DBCOD),根据距离阈值对数据点进行聚类,在聚类过程中记录每个数据点的密度,并根据密度阈值确定数据点是否为孤立点.实验结果表明,该算法不仅能够对数据集进行正确的聚类,可以发现任意形状的聚类,算法执行效率优于DBSCAN,具有对噪音数据、数据输入顺序不敏感等优点,同时还能有效地进行孤立点检测.  相似文献   

14.
根据2012年10月份福州市主城四个区的盗窃犯罪案事件数据,利用标准差椭圆、最近邻层次聚类、核密度估算等方法,分别研究了福州市犯罪的总体集聚与发展方向、犯罪相对集聚和重点区域、以及犯罪的空间连续变化和集聚中心,并对每种方法进行了适合性评价和比较分析.结果显示:福州市盗窃犯罪案的平均中心位于台江区的茶亭街道附近;犯罪的总体集聚区域位于鼓楼区、台江区西部和仓山区北部;犯罪集聚中心为台江区的中亭街、祥坂村和晋安区的福州火车站.  相似文献   

15.
网络入侵的聚类算法研究与实现   总被引:11,自引:1,他引:10  
入侵检测中对知入侵的检测主要由异常检测完成,传统的异常检测方法需要构造一个正常行为特征轮廓的参考模型,但建立该特征轮廓和确定异常性报警的门限值都比较困难,而且建立该特征轮廓使系统开销大.据此本文提出一种针对入侵检测的聚类算法和一种数据处理方法.该算法通过动态更新聚类中心和类内最大距离实现,收敛速度快,再结合对数据的预处理使聚类效果更好.实验结果表明,此算法用于以未知入侵检测为代表的特殊模式检测方面是可行和有效的.  相似文献   

16.
提出了一种指定接收者椭圆曲线门限群签名加密方案.该方案根据Nyberg和Rueppel方法,利用椭圆曲线加密技术将门限群签名与指定接收者公钥加密有机地结合在一起,构造一种指定接收者的门限签名群加密方案.与传统的消息加密再数字签名的方法相比,该方案具有数据传输安全、计算复杂度和通讯复杂度低、通讯带宽小等优点.  相似文献   

17.
一种支持结构化P2P的多维范围查找方法   总被引:1,自引:0,他引:1  
提出一种基于结构化P2P的分层聚类查询系统. 利用空间填充曲线建立从高维特征空间到一维相邻空间的映射,根据映射过程提出一种分层聚类的概念,并将相似的多维数据归入在相同的聚类中,使聚类内的数据具有更大的相似性与更小的值域区间. 模拟结果显示,该方法可减少查询所需的带宽,具有良好的查询准确度和可扩展性.  相似文献   

18.
考虑时间距离因素、犯罪率因素、人口数量因素、警察因素、地理环境因素和被害人职业因素等影响因子, 采用数学建模方法, 建立研究区域的犯罪概率评价函数。采用这种评价函数计算研究区域的犯罪概率, 然后融合GIS相关技术, 得到犯罪分子下一步最有可能犯罪的预测区域, 即犯罪的地理画像, 并通过实例对方法进行验证和分析。这种新的犯罪概率模型的应用, 可以为连环犯罪的侦破提供空间地理数据, 缩小警方布控范围, 是一种精确性较高、适宜各种地理区域的新型侦查手段, 能够对连环犯罪案件的侦破起到很大的作用。  相似文献   

19.
应用空间聚类进行点数据分布研究   总被引:2,自引:0,他引:2  
空间数据挖掘是寻找大数据量空间分布的重要方法,应用地理信息系统(GIS)进行空间数据挖掘是目前进行海量数据分析的重要手段之一.应用空间聚类方法对北京市海淀区54 325个企业点数据进行量化分析研究,通过空间位置聚类,进行属性指标量化,从而进行属性指标分层聚类,得到企业空间分布特征.研究表明,空间聚类方法是进行点数据空间分布研究的有效方法.  相似文献   

20.
提出了一种针对码书优化的图像矢量量化算法。首先设定矢量距离的初始门限值,基于空间划分对训练矢量聚类,找到矢量个数小于平均胞腔矢量数的胞腔;提取其聚类矢量后删除该胞腔,然后缩小距离门限值再次聚类提取,依次循环直到聚类矢量个数达到要求。将提取的聚类矢量作为初始码书,进行LBG算法码书设计,有效地改善了传统LBG算法依赖于初始码书而容易陷入局部最优的缺点,采用改进算法生成的码书更接近全局最优,加快了收敛速度。仿真结果证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号