首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 937 毫秒
1.
针对多阶段洗钱资金转移路径的决策问题,基于多目标优化的思想,构建了以时间约束、总体资金转移量尽可能大以及总体风险尽可能小为决策目标的多阶段洗钱路径优化模型,并利用多重动态规划方法和最大流理论给出了求解该模型的算法,最后通过实例应用验证了该算法的可行性.通过该模型,不仅能够从洗钱资金转移路径观察洗钱行为特征,还能够发现和追踪到洗钱者的洗钱踪迹和全过程,有助于对洗钱行为的各个环节进行有效监控,降低反洗钱侦测成本.  相似文献   

2.
Effective link analysis techniques are needed to help law enforcement and intelligence agencies fight money laundering. This paper presents a link analysis technique that uses a modified shortest-path algorithms to identify the strongest association paths between entities in a money laundering network. Based on two-tree Dijkstra and Priority'First-Search (PFS) algorithm, a modified algorithm is presented. To apply the algorithm, a network representation transformation is made first.  相似文献   

3.
针对MinMax k-means算法易产生空解、 收敛速度慢和计算效率低的问题, 提出一种增量式MinMax k-means聚类算法. 该算法从给定的初始聚类个数开始, 以固定步长递增式产生新的聚类中心, 采用基于数据均衡的快速分裂方法产生增量聚类中心, 从而避免了传统增量聚类中心选择中遍历数据、k-means聚类算法运行次数过多导致的大计算量问题. 与MinMax k-means及相关算法的对比实验结果表明, 该算法在计算效率和求解精度上均优于对比算法, 有效改善了MinMax k-means聚类对初始化中心敏感和易产生空解的问题.  相似文献   

4.
介绍了 k -means 和 DBSCAN 聚类算法的基本原理和优缺点,针对传统聚类算法无法有效处理高维混合属性数据集的问题,对原有的数据归一化方法进行改进,在 k -means 和 DBSCAN 聚类算法的基础之上,结合增量聚类的思想和数据之间相异度的计算方法,提出了基于密度的增量 k -means 聚类算法,有效处理具有高维混合属性的数据集,改进了数据相异度的计算方法。  相似文献   

5.
为解决当前网络舆情大数据收敛算法普遍存在的收敛困难及热点聚类生成速度较低等难题,提出了一种基于聚合度热点适应机制的网络舆情大数据收敛算法。首先,通过增量用户节点与存量热点之间的信息交互关系,设计了一种基于聚合度初始化机制的数据收敛方案,采用匹配机制逐个对存量热点与增量用户节点间差异度及聚合度进行比对,能够将增量用户节点纳入性能最佳的存量热点所形成的种子聚类,提高聚类形成速度。随后,针对热点数量处于密集状态等极端情况,特别是用户特征匹配过程中难以实现快速匹配等不足,设计迭代方式,以逐步消除种子聚类差异度,提升大数据匹配性能,改善用户节点与热点之间信息交互质量。仿真实验表明:与当前常用的时间片累积挖掘收敛方案(Convergence Scheme for Time Slice Cumulative Mining,TSCM算法)及热点度显影收敛方案(Convergence Scheme of Hotspot Degree Development,HDD算法)相比,本文算法具有更高的收敛速度和聚类形成质量。  相似文献   

6.
At present, studies on training algorithms for support vector machines (SVM) are important issues in the field of machine learning. It is a challenging task to improve the efficiency of the algorithm without reducing the generalization performance of SVM. To face this challenge, a new SVM training algorithm based on the set segmentation and k-means clustering is presented in this paper. The new idea is to divide all the original training data into many subsets, followed by clustering each subset using k-means clustering and finally train SVM using the new data set obtained from clustering centroids. Considering that the decomposition algorithm such as SVMlight is one of the major methods for solving support vector machines, the SVMlight is used in our experiments. Simulations on different types of problems show that the proposed method can solve efficiently not only large linear classification problems but also large nonlinear ones.  相似文献   

7.
针对现有质心求解算法仍具有较高计算复杂度,导致区间二型模糊C均值聚类算法(Interval Type-2 Fuzzy C-Means, IT2FCM)运行速度不理想问题,提出了半数迭代法和一次迭代法两种近似质心求解算法。首先,在直接求解转换点问题质心求解算法(A Direct Approach for Determining the Switch Points in the Karnik–Mendel Algorithm, DA)的基础上,借助二分查找思想,构造出基于二分查找的质心求解算法;接着,以该算法为基础,通过限制查找范围,考虑两个转换点之间关系的性质和计算差值的技巧得到半数迭代法;最后,考虑只进行一次查找得到一次迭代法。在UCI上的5个数据集上(IRIS、SEEDS、WINE、WIFI_LOCALIZATION和HTRU2)验证了两种算法的聚类性能并没有因为求解的是近似质心而降低;进一步在ANURAN CALLS数据集上构造了8组数据量递增数据用于验证基于不同质心求解算法的IT2FCM和基于提出的近似质心求解算法的IT2FCM运行速度,实验结果表明:基于近似质心求解算法的IT2...  相似文献   

8.
给出了一种新的处理海量数据的聚类算法WIDE(window-density clustering algorithm).它通过网格方法将数据之间的相互关联局部化,通过窗口技术来提高算法的效率,通过密度方法提高聚类的精度.以窗口为中介将网格方法和密度方法融合在一起是算法的主要思想.在此基础上对算法进行了扩展,在功能方面实现了混合型数据聚类、含障碍物数据聚类和增量数据聚类;在速度方面实现了分布式并行聚类.WIDE算法能够在局域网中的多台计算机上并行工作,效率高,计算复杂度为O(N),且能够发现任意形状的聚类,对噪声不敏感.  相似文献   

9.
数字货币交易中的洗钱行为区别于传统金融犯罪形态,传统反洗钱技术手段难以直接适用. 针对数字货币交易所面对的洗钱行为检测需求和检测难点,通过定义交易行为,构建了一个层次化加权的交易行为特征描述体系,提出了一个结合孤立点检测和小类簇检测的数字货币交易行为异常检测方法,实现从交易行为到交易用户的洗钱可疑程度的量化度量. 在真实数字货币交易所数据集上进行评估实验,结果显示,异常交易行为、可疑洗钱用户、显著性异常交易行为和隐蔽性异常交易行为的检测准确率分别为96.02%、95.05%、95.83%和95.81%,均优于基准算法. 同时,本文算法的特征体系能对检测结果做出有效解释,帮助数字货币交易所安全员快速开展后续调查和取证工作.  相似文献   

10.
The k-means clustering algorithm is one of the most commonly used algorithms for clustering analysis. The traditional k-means algorithm is, however, inefficient while working on large numbers of data sets and improving the algorithm efficiency remains a problem. This paper focuses on the efficiency issues of cluster algorithms. A refined initial cluster centers method is designed to reduce the number of iterative procedures in the algorithm. A parallel k-means algorithm is also studied for the problem of the operation limitation of a single processor machine when given huge data sets. The analytical results demonstrate that these improvements can greatly enhance the efficiency of the k-means algorithm, i.e., allow the grouping of a large number of data sets more accurately and more quickly. The analysis has theoretical and practical importance for work on the improvement and parallelism of cluster algorithms.  相似文献   

11.
To alleviate the scalability problem caused by the increasing Web using and changing users' interests, this paper presents a novel Web Usage Mining algorithm-Incremental Web Usage Mining algorithm based on Active Ant Colony Clustering. Firstly, an active movement strategy about direction selection and speed, different with the positive strategy employed by other Ant Colony Clustering algorithms, is proposed to construct an Active Ant Colony Clustering algorithm, which avoid the idle and "flying over the plane" moving phenomenon, effectively improve the quality and speed of clustering on large dataset. Then a mechanism of decomposing clusters based on above methods is introduced to form new clusters when users' interests change. Empirical studies on a real Web dataset show the active ant colony clustering algorithm has better performance than the previous algorithms, and the incremental approach based on the proposed mechanism can efficiently implement incremental Web usage mining.  相似文献   

12.
现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高.  相似文献   

13.
研究了联机数据挖掘系统中的并行和增量聚类算法,并给出了算法伪码。实验表明,联机增量聚类算法相对于传统的Apriori算法具有较大优势,同时证明了增量聚类算法及其联机数据挖掘系统的实用性。  相似文献   

14.
我国现行反“洗钱”刑事立法有需要继续完善之处:洗钱罪的立法相对滞后,影响了对洗钱犯罪的打击;“洗钱”范围限定的过于狭窄,不利于对洗钱犯罪的惩处;与洗钱罪相关的法律规定不配套,惩治洗钱犯罪的效果不明显。本文建议对洗钱罪立法在以下方面加以改进:一是对洗钱罪进行修改,使其具有超前性;二是合理界定洗钱罪的行为方式,严密刑事法网;三是完善配套法律制度。  相似文献   

15.
一种增量式文本软聚类算法   总被引:1,自引:0,他引:1  
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类.  相似文献   

16.
从划分聚类要求的时间和空间上看,传统的串行算法已很难适应海量的数据,有必要研发高性能、可扩展的并行算法来解决这一问题,基于一些主要的并行划分聚类算法所存在的问题,提出了在机群系统上采取数据并行策略设计的并行划分聚类算法思想。  相似文献   

17.
分析了典型的聚类算法及其适用范围,针对其处理Web点击流数据的不足,提出了一种用于Web点击流的增量挖掘的聚类算法WCSCluster,给出了相关定义及存储结构,并用实例说明了算法的运行过程.最后对比同类算法给出实验结果.实验结果表明该算法具有良好的性能,能够发现更优的簇.  相似文献   

18.
增量聚类算法综述   总被引:2,自引:1,他引:1  
给出了增量聚类的概念,分析了增量聚类方法可以用于解决数据的变化和大量存储空间的需求问题。增量聚类算法选择恰当时,可以保证数据在变化时有效地提高聚类的精度和效率。从传统聚类、生物智能聚类和数据流聚类三个角度研究了增量聚类问题,分析了增量聚类问题的研究进展,包括发展的过程及特点,阐述了研究增量聚类问题的关键技术,最后给出了未来的发展趋势。  相似文献   

19.
谱聚类算法建立在谱图划分理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。然而,谱聚类算法涉及如何选取合适的尺度参数σ构造相似度矩阵的问题。并且,在处理大规模数据集时,聚类的过程需要较大的时间和内存开销。研究从构造相似度矩阵入手,以传统NJW算法为基础,提出一种基于K近邻的自适应谱聚类快速算法FA-SC。该算法能自动确定尺度参数σ;同时,对输入数据集分块处理,并用基于K近邻的稀疏相似度矩阵保存样本信息,减少计算的内存开销,提高了运行速度。通过实验,与传统谱聚类算法比较,FA-SC算法在人工数据集和UCI数据集上能够取得更好的聚类效果。  相似文献   

20.
K-匿名是解决数据隐私的关键技术,成为近年来研究热点.目前对K-匿名的研究大多依赖预定义的泛化层次,泛化后的数据有很大的数据损失,并且没有考虑到匿名后的可信属性缺乏多样性导致的隐私信息泄漏.本文针对K-匿名存在的上述问题,提出了一种在K-匿名之上的(L,K)-匿名模型,将聚类的方法应用(L,K)-匿名模型上,并给出了基于聚类分析的(L,K)-匿名算法,实验显示该方法能有效的消除K-匿名后可信属性的信息泄漏,增强数据发布的安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号