首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

2.
关联规则挖掘是数据挖掘领域中一个非常重要的研究课题。本文对压缩数据的关联规则挖掘进行研究,提出了挖掘算法,与传统的关联规则挖掘算法相比,本算法不但效率高,而且具有较好的伸缩性。  相似文献   

3.
使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性.  相似文献   

4.
针对经典挖掘算法挖掘效率低、主观性强、生成关联关系过多的问题,从样本筛选和关联规则生成两个方面提出一种面向高维数据关联规则挖掘的新型算法(mining multidimensional association rules by combination, Marc)。所提算法通过计算样本的分布系数和删除阈值,综合自定义支持度在初读数据集时对样本进行双重筛选,在挖掘之初降低弱样本影响。在频繁项和关联规则生成时以样本关系表和样本全关系组合模式挖掘信息,降低挖掘过程的复杂性和资源消耗。试验结果表明:Marc算法挖掘出的频繁项和关联规则数量显著降低,在挖掘效率和内存消耗上均优于Apriori、FP-Growth和Eclat算法,且维度越高,数据集越大,优势越明显,Marc算法频繁项和关联关系挖掘的精度为100%。  相似文献   

5.
智能手机已经成为个人行为的真实记录设备,对APP使用数据进行挖掘可以提取出用户的行为习惯.为了提取APP的使用关联模式,研究并提出基于数据挖掘的APP关联规则提取技术.首先,基于Android平台,开发APP状态数据收集平台;其次,对APP数据进行预处理;再次,基于Apriori算法,提出了APP关联规则挖掘算法;最后,应用真实个人APP使用数据,对提出的方法进行验证,实验结果证明本文提出的方法在APP关联规则挖掘中的可行性.  相似文献   

6.
针对数据集中的关联规则挖掘问题,提出一种基于改进量子粒子群优化(improved quantum particle swarm optimization,IQPSO)算法的关联规则挖掘方法。首先,将数据实例以量子比特形式表示,构建一个基于量子进化算法(quantum evolutionary algorithm,QEA)的关联规则挖掘基础框架。然后,在该基础框架上,采用新的量子角度更新公式,即使用QPSO代替QEA实现关联规则挖掘。最后,为了进一步提高QPSO算法的收敛性能,融入变异机制和动态惯性权重对其进行改进,加快其收敛速度和跳出局部最优的能力。在UCI和课程成绩数据集上的实验结果表明,提出的算法能够快速且有效地挖掘出关联规则,相比其他几种算法,挖掘到的关联规则价值更高。  相似文献   

7.
Web日志挖掘是Web数据挖掘中非常重要的一个研究领域和研究方向,首先介绍了Web日志挖掘的过程,然后介绍了关联规则及关联规则算法——FP-growth算法,最后将关联规则中的FP-growth算法应用在网上书店系统中,实现对客户数据的关联规则挖掘。  相似文献   

8.
基于关联规则的遥感图像挖掘的应用研究   总被引:1,自引:1,他引:0  
结合遥感数据的特点,利用P-树运算,将用于关联数据库和事务数据库的挖掘算法进行适当修正,在进行遥感图像关联规则挖掘时寻求新的算法,提出了几种剪枝策略(Pruning techniques),使之能适合遥感数据的挖掘,最后实现具体遥感图像上的关联规则挖掘.  相似文献   

9.
基于数据立方体的维内关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对数据立方体的结构特点,结合联机分析处理技术,提出了两种基于数据立方体的维内关联规则挖掘算法,以合肥农河超市实际数据作为测试数据,给出了两种算法的实验结果,结果表明,两种算法在不同支持度情况下执行效率存在明显差异,分别适合在高支持度和低支持度情况下进行关联规则挖掘。  相似文献   

10.
零售业销售数据关联规则挖掘算法关键思想研究   总被引:1,自引:1,他引:0  
对零售业销售数据关联规则挖掘算法的关键思想进行了研究,给出了各种提高算法效率的方法以及对规则选择的方法。  相似文献   

11.
聚类多维数字属性的关联规则   总被引:1,自引:1,他引:0  
提出一种有效开采多维数字属性关联规则的算法。为解决返回规则太多的问题,利用聚类技术把开采出来的关联规则进行分类,从而使所开采的规则量显著减少,同时使得结果更易理解。  相似文献   

12.
基于数据仓库的医药行业企业信息门户   总被引:6,自引:0,他引:6  
为了解决医药行业信息孤岛状态,对医药行业企业信息门户进行了功能设计.同时构造了基于数据仓库的医药行业企业信息门户的基本模型,并通过构造相关的医药行业企业的决策树和聚类算法,利用XML语言,实现了相互异构的Web数据挖掘.  相似文献   

13.
Extensible Markup Language即"可扩展的标置语言"(简记为XML)的出现,为基于Web的数据挖掘带来了便利,开发人员能够用XML的格式标记交换数据。充分利用XML的优点,提供一种利用决策树ID3修正算法和聚类的方法,对XML文档信息进行挖掘,并结合实例说明这种方法。  相似文献   

14.
一种XML数据到结构化数据的转换方法   总被引:2,自引:0,他引:2  
分析半结构化树状层次结构的XML文档的结构特征,描述XML结构与关系数据库的对应关系.给出XML文档的DTD中各主要元素与关系数据模型之间的映射规则,设计转换规则脚本的自动生成算法和数据转换算法.  相似文献   

15.
针对异构数据库之间数据交换软件的数据交换不规范、网状数据不通畅、数据同步无保证等问题,设计了一个通用安全高效的数据交换引擎.该设计采用影子表法获取数据,利用文本差异比较得出变化的数据量,并运用差异分析算法解析出数据变化结果集.设计中的数据交换规则与数据更新结果存储均采用了XML文件格式作为媒介,为了保证数据的安全性与可靠性,设计要求对需要传输的数据进行加密处理,并采用可靠的TCP作为数据传输协议的载体.实验表明,该文设计的异构数据库交换引擎可以高效率地完成异构数据库之间可靠、安全的数据交换.  相似文献   

16.
数据挖掘在智能交通系统中的应用   总被引:2,自引:0,他引:2  
目的将数据挖掘技术应用于智能交通系统中,利用挖掘得到的模式对交通管理决策提供有效支持。方法针对交通数据库系统中数据的特点,提出了基于概化的数据预处理方法,并在此基础上,采用基于树模型的关联规则挖掘算法进行关联规则挖掘。结果获得了良好的挖掘模式。实际应用说明了挖掘结果的有效性及可行性。结论数据挖掘技术在智能交通系统中的成功应用,为交通管理决策提供了有效支持,且提出的方法易于实现,便于推广。  相似文献   

17.
随着大量的XML数据的出现,给数据挖掘领域提出了新的挑战。传统数据挖掘算法是面向关系数据库和数据仓库的,不能直接用于XML文档的数据挖掘。本文从模糊集的基本理论入手,通过定义模糊概念软化属性论域的划分边界,提出了一种面向XML数据的模糊关联规则挖掘方法,并且使用Java语言实现,实验结果证明本文算法是正确的。  相似文献   

18.
分析了XML文档到关系数据库的映射方法,并提出了元素树和元素树节点与其他类型数据之间的映射算法.在此基础上建立了XML模式和关系模式之间的双向映射模型,并给出了双向映射模型算法,从而完成了XML与RDB数据转换.  相似文献   

19.
基于XML的异构数据源间数据交换的实现   总被引:1,自引:0,他引:1  
基于Web Service,XML设计开发了可配置的灵活数据交换集成中间件,阐述了数据集成中间件的关键难点部分的设计,如确定数据源、数据源数据和XML数据之间的映射、Select和Insert等命令的语法检查、转换规则的建立等.所开发的中间件在档案和办公系统的数据集成中得到了应用,很好地完成了对异构数据源数据的数据检索、交换、迁移以及数据更新的任务.  相似文献   

20.
By rapid progress of network and storage technologies, a huge amount of electronic data such as Web pages and XML has been available on Internet. In this paper, we study a data-mining problem of discovering frequent ordered sub-trees in a large collection of XML data, where both of the patterns and the data are modeled by labeled ordered trees. We present an efficient algorithm of Ordered Subtree Miner (OSTMiner) based on two- layer neural networks with Hebb rule, that computes all ordered sub-trees appearing in a collection of XML trees with frequent above a user-specified threshold using a special structure EM-tree. In this algo- rithm, EM-tree is used as an extended merging tree to supply scheme information for efficient pruning and mining frequent sub-trees. Experiments results showed that OSTMiner has good response time and scales well.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号