首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 179 毫秒
1.
提出了一种区间值聚类的数据挖掘方法。该方法首先将数据库中的数据按照属性进行聚类,将它们划分为若干区间,对于同一区间中的数据赋予相同的编号,以此处理直至数据库的最后一个属性。在完成这种转换后即可使用关联规则的挖掘方法。该方法与传统的数据挖掘方法相比更加符合实际。大量的仿真数据集和真实数据集的实验结果表明该算法是有效的。  相似文献   

2.
以格论及位图索引技术为基础给出了一个新的频繁项目集发现算法.1)该算法利用有向图进行一次性数据预处理,在预处理过程中将数据库预先存贮为每个结点都用一个域来记录其支持度的项目集格,从而把复杂的频繁项目集的发现问题转化为图搜索问题,提高了频繁项目集发现过程的效率.2) 支持度计算是关联规则发现中I/O及计算开销都非常大,算法引入了位图索引技术,提高了项目集支持度的计算速度.存储完整位图需要较大空间,针对该问题算法对位图进行了分块管理并对其进行了有效的编码压缩;不仅可以有效地对原始位图进行有效压缩,另外也可以在较大程度上提高支持度的计算效率.最后,对算法进行了计算实验与分析.  相似文献   

3.
为提高关联规则挖掘算法的效率及其对大型数据集的适应性,提出了基于划分的带项目约束的频繁项集挖掘算法Partition CHS Miner。算法按照约束条件裁减数据集,并采用基于约束的超结构CHS(con-straint-based hyper-structure)存储数据。对大型数据集,先将其划分为多个不相交的数据子集,使子集的大小适合主存,然后在子集上采用基于超结构的带项目约束的挖掘算法挖掘出局部频繁项集,最后合并所有子集中的频繁项集形成全局的带约束的候选项集,计算出全局频繁项集。实验证明了算法的有效性。  相似文献   

4.
面向个性化推荐的强关联规则挖掘   总被引:10,自引:2,他引:8  
提出了适用于个性化推荐的强关联规则的概念,并给出一种基于矩阵的强关联规则挖掘算法.强关联规则集合能够以较少数量的规则表示全部有效关联信息,便于管理和应用.给出的强关联规则挖掘算法只需对交易数据库进行一次扫描,在挖掘过程中不断删除非频繁项使矩阵规模逐渐减小,并且避免了对冗余规则的挖掘, 从而提高了挖掘效率.通过对三组数据的实验表明:强关联规则集合包括的规则数量平均仅为规则总数的26.2{\%},有效解决了规则数量过多的问题.  相似文献   

5.
基于数据挖掘的水库供水调度规则提取   总被引:1,自引:0,他引:1  
以供水调度为例对数据挖掘用于水库调度规则提取进行了研究.经分析主要选取了水库蓄水量、调度时段编号、需水量、径流量和水文年型5个特征属性构成数据集,通过数据挖掘从中发掘水库供水调度规则模式.采用径向基函数网络作为数据挖掘算法,将复杂的属性空间上的数据样本,映射为几种离散的供水调度模式,从而完成供水调度规则的模式划分.为了验证数据挖掘方法在调度规则提取上的效果,给出了调度图和调度函数方法用于供水调度的计算结果,三种方法的调度结果对比分析显示,数据挖掘方法在供水调度模式分类正确率和缺水指数两方面都是最好的,这反映出数据挖掘方法用于水库调度是合理有效的.  相似文献   

6.
基于多维数据的关联规则算法   总被引:4,自引:0,他引:4  
陈晓红  马亮 《系统工程》2005,23(5):103-105
通过分析多维数据对象属性的关系,结合联机分析处理技术,在建立数据立方体(Cube)的基础上,提出一个基于多维数据的关联规则算法,可以有效提高规则发现和数据挖掘的效率。最后,通过实践证明该算法有效。  相似文献   

7.
将各连续属性上的取值划分威多个语言值,利用微粒群算法优化各语言值的正交隶属函数,提高关联规则的可理解性特征,在此基础上提出了语言值关联规则挖掘算法,使得挖掘出的语言值关联规则更贴近人的思维方式,更好的反映各连续属性本身的分布特点。  相似文献   

8.
频繁模式挖掘是很多数据流挖掘工作的基础.现有算法虽然能够有效的在数据流中挖掘近似的频繁模式, 但是由于数据流数据的不确定性、连续性以及海量性, 始终不能有效的将算法的时间效率和空间效率控制在一个可以接受的范围内. 本文通过使用散列表作为概要数据的存储结构, 并引入关联规则兴趣度的概念, 提出了数据流频繁模式挖掘算法MIFS-HT(mining interesting frequent itemsets with hash table), 不仅有效降低现有算法的时空复杂度, 同时提高了算法的应用价值. 最后, 实验结果表明: MIFS-HT是一种高效的数据流频繁模式挖掘算法, 其性能优于FP-Stream、Lossy Counting等算法, 并且挖掘结果更具有现实意义.  相似文献   

9.
在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法.该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程.算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点.又不同于BOM算法,挖掘频繁k_项目集时,需要进行 次k个向量的与运算.因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法.  相似文献   

10.
模糊关联分类是一种具有较高精度的分类方法,现有的模糊关联分类算法多采用固定模糊隶属度函数对连续型属性进行模糊划分,没有考虑数据本身的特性.提出一种基于自适应区间划分的模糊关联分类算法-FARC(fuzzy association rules classification).算法利用模糊c均值聚类算法建立连续型属性模糊区间,使用新的剪枝策略避免生成无用规则,采用一种新的规则重要性度量方法对多模糊分类规则进行融合.仿真表明,FARC具有较高的分类精度.  相似文献   

11.
语言值关联规则在气象系统仿真中的应用   总被引:1,自引:1,他引:0  
在信息处理领域,大型关系数据库中的数据挖掘是一个热点,文中应用模糊c-方法算法(FCM)将数据库中记录的值划分成多个语言值,并借助语言值来软化数量性论域的划分边界,由此生成一系列的语言值关联规则。接着文中根据最大隶属原则将数据库中的记录映射到语言值,定义了语言值关联规则的支持率和信任度。最后讨论了语言值关联规则在气象系统仿真中的应用。  相似文献   

12.
给出一个新的序列规则挖掘算法,该算法在挖掘规则以前将数据库预先存贮为序列邻接网络,在序列邻接网络中每个项目集顶点都有一个域来记录它的支持度,算法把频繁序列规则的发现问题转化为网络中的顶点搜索问题,大大提高了搜索过程的效率,为了有效地解决网络生成过程中的序列支持计算问题,采用了一种纵向的数据库表示格式。  相似文献   

13.
1 .INTRODUCTIONWiththewideapplicationofdatabasetechniquesanddatabasemanagementsystem ,datastorageindatabasehassharplyincreased .Thedataminingisjusttodiscovereffective ,novel,potentiallyvaluableknowledgefromthesedata .Associationruleisanim portantmeansinda…  相似文献   

14.
数据挖掘主要是用来找出隐藏在数据库当中那些有用而未被发现的知识。这篇文章在文献(1)研究的基础上,对数量属性的关联规则问题作了进一步讨论。文中借助模糊集来软化数量属性论域的划分边界,提出了区间值数据库上的模糊关联规则的概念以及挖掘模糊关联规则的方法。最后讨论了模糊关联规则在环境系统仿真中的应用。  相似文献   

15.
一种关联规则增量更新算法   总被引:6,自引:0,他引:6  
针对一个新的事物数据库加到原有的事务数据库中,在最小支持度和最小置信度都不变的情况下相应关联规则的更新问题,提出了一种简单高效的增量式关联规则挖掘算法。该算法从集合的角度出发,将事物数据库分为频繁项集集合和非频繁项集集合,从而在两个事务数据库可能出现的关系中,准确找出能够生成新的频繁项集的集合。在此基础上,利用给出的算法能够较为容易地发现新的关联规则。最后,分析了此算法的优越性。  相似文献   

16.
谭华  谢赤  储慧斌 《系统工程》2007,25(4):92-97
将模糊关联规则应用于股票市场的交易规则抽取,以期能为投资者投资做出正确决策.首先选用聚类方法对模糊集属性进行离散化,进而构造模糊集和隶属函数,给出模糊集构造算法,最后提出适合股票交易规则抽取的模糊关联规则算法FARS.实验结果表明,所得规则能很好的反映股票交易中的实际情况.  相似文献   

17.
改进的增量式关联规则维护算法   总被引:4,自引:0,他引:4  
在分析现有的关联规则算法 IUA的基础上 ,指出了该算法的不足和错误之处 ,并加以改正 ,进而提出了一种改进的增量式更新算法 EIUA. EIUA算法解决了在数据库 D不变的情况下 ,当最小支持度和最小置信度二阈值发生变化时如何高效更新关联规则的问题 .实验分析表明了新算法的有效性和优越性.  相似文献   

18.
Finding frequent itemsets is the key problem in association rules mining. A new algorithm based on the lattice theory and bitmap index for mining frequent itemsets is proposed. The algorithm converts the original transaction database to an itemset-lattice in the pre-processing, where each itemset vertex has a label to save its support, and the complicated task of mining frequent itemsets in the database is thus changed to the simpler one that searches vertexes in the lattice. The efficiency of the mining process is enhanced greatly. Since the support counting in the association rules mining incurs a high cost regarding the I/O, a bitmap index technique is used to speed up the counting process. To address the issue that the intact bitmap usually needs a big memory space for storage, the bit vector is partitioned into blocks, which can be encoded as a symbol. This makes the original bitmap more compact in storage and improve the support counting efficiency as well. Finally, experimental and analytical results are presented.  相似文献   

19.
针对信用分类数据集中常见的高维性特征,本文基于特征袋装法和关联规则挖掘算法,构建了新的赋权特征选择集成模型AR-WSAB.该模型能根据频繁项集的支持度和置信度,对各特征的重要度进行测度,进而选择出各特征子集,训练子分类器,再通过集成得到最终结果.通过在贷款违约预测数据集上进行实证分析,结果表明该模型分类正确率相对于Bagging集成模型和PCA算法都有显著优势,所提方法能够有效处理高维性特征,并且在各分类算法上都具有普适性.  相似文献   

20.
Extraction of interesting and general spatial association rules from large spatial databases is an important task in the development of spatial database systems. In this paper, we investigate the generalization-based knowledge discovery mechanism that integrates attribute-oriented induction on nonspatial data and spatial merging and generalization on spatial data. Furthermore, we present linguistic cloud models for knowledge representation and uncertainty handling to enhance current generalization-based method. With these models, spatial and nonspatial attribute values are well generalized at higher-concept levels, allowing discovery of strong spatial association rules. Combining the cloud model based generalization method with Apriori algorithm for mining association rules from a spatial database shows the benefits in effectiveness and flexibility.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号