首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
在大型数据关联规则开采过程中,采用动态项目集计算算法寻找大项目集,以空间换取时间方案提高执行效率,同时,用坚信度作为构造关联规则的依据,更好地反映逻辑上的因果关系。  相似文献   

2.
在大型数据库关联规则开采过程中,采用动态项目集计算算法寻找大项目集,以空间换取时间方法提高执行效率.同时,用坚信度作为构造关联规则的依据,更好地反映逻辑上的因果关系.  相似文献   

3.
一种基于限制的关联规则数据开采的算法   总被引:2,自引:1,他引:1  
针对海量数据库开采时,现有的关联规则算法效率非常低下的问题,提出一种附加最小保证度的限制,并在此基础上提出一种新开采算法,可减少频繁项目集的数量,并显著地降低I/O时间和CPU时间。  相似文献   

4.
数据开采中基于用户需求的关联模型   总被引:1,自引:0,他引:1  
提出了一个基于用户需求的关联模型,引入了相关度的概念,给出了启发式查找与相联规则的NEA抽取算法。有效的解决数据开关联模型中查找规则的盲目性和冗余性,并使重要珠信息不被丢失。  相似文献   

5.
武广  韩云 《山西科技》2007,(4):25-26
石油天然气开采行业的特点决定了其会计处理与其他行业有很大的差别,在三大石油公司海外上市和全球经济一体化的情况下,我国正努力实现与国际会计准则趋同。为此,财政部于2006年2月15日发布了石油天然气开采会计准则,新的核算规则必然对我国的石油天然气行业产生重大的影响。  相似文献   

6.
陕北沙土基型覆盖层保水开采合理采高的确定   总被引:2,自引:0,他引:2  
鉴于目前陕北榆神矿区开采引起的生态环境恶化、荒(沙)漠化扩展问题,针对榆树湾煤矿首采面采用倾斜分层开采和放顶煤开采两方案的争论,设计了该两种开采方法的模拟实验,通过实验分析模拟开采实验现象,得出了陕北沙土基型覆盖层在不同的采高下“三带”的分布规律以及土层中裂隙发育规律。综合考虑地质条件、开采技术条件等,确定了属于陕北沙土基型覆盖层类型的榆树湾矿首采面要实现保水开采的合理开采方法是应采用上分层采高为5m的分层开采方案,而上分层采后的下分层开采和放顶煤开采方案均不能实现保水。  相似文献   

7.
关联规则挖掘中的关联推理   总被引:3,自引:0,他引:3  
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数常常是巨大的。现基于覆盖运算,讨论已知关联规则可导出其它关联规则,并指出存在能覆盖全部关联规则的最小规则集。  相似文献   

8.
针对矿山开采工艺技术经济参数间的灰色性与不确定性的特点 ,运用模糊逻辑推理的方法对影响矿山开采成本的关键因素作了有益的探索 ,揭示了开采工艺技术经济间映射关系的关联规律 ,为矿山开采效益的提高提供了重要的参考价值  相似文献   

9.
旋转开采技术在高档普采工作面的应用   总被引:1,自引:0,他引:1  
介绍了旋转开采技术在镇城底矿高档普采工作面的应用情况,实现了工作面绕过地质构造带后的连续性开采,减少了煤炭资源的技术性损失。  相似文献   

10.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

11.
一种基于可信度最优的数量关联规则挖掘算法   总被引:2,自引:0,他引:2  
研究了数量关联规划挖掘过程中的连续属性离散化问题,描述了连续属性离散化方程,包括连续属性区间划分算法和数据库样本大小的确定,提出了基于可信度最优的数量关联规则挖掘算法。该算法首先利用等深度划分算法对连续属性进行离散化,然后利用凸包处理技术提取强规则中可信度最高的数量关联区间,它对于数量关联规则的优化有着重要的应用价值。应用该算法对股票行情进行了数量关联分析,提取股票涨跌与股票价格之间可信度最高的关联规则。实验表明该算法是非常有效的。  相似文献   

12.
关联规则挖掘寻找给定数据集中项之间的有趣关系,是数据挖掘的主要研究方面.传统的关联规则挖掘算法仅能挖掘正关联规则,事实上,负关联规则也包含了非常有价值的信息,对于决策的作用也是不容忽视的.  相似文献   

13.
挖掘关注的语言值关联规则   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决利用RFCM算法划分数量型属性,并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多,以及难于获得用户真正关注的规则等问题,提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值,然后转换成布尔型属性关联规则挖掘问题。同时,给出一个能够度量语言值关联则简洁性和新奇性关注程度(兴趣度)的计算函数,用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验,得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库,并能有效地获取用户关注的规则。  相似文献   

14.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

15.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

16.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

17.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

18.
数据集中多属性关联规则发现算法   总被引:1,自引:0,他引:1  
对数据挖掘中的多属性关联规则算法进行了探讨,给出了关联规则发现算法的相关概念(关联规则、支持率、可信度)和关联规则发现算法,并说明了传统查询工具在数据挖掘中的作用,以及该算法需要进一步研究的内容。  相似文献   

19.
传统试卷分析系统一般只是对考试成绩做简单的整体统计,如平均分、等级、不及格率等,用户缺乏对试题知识点掌握情况关联程度的准确了解。针对该问题提出一种基于用户反馈的关联规则挖掘算法。首先对原始数据进行预处理,得到试卷知识点评分权重表和二进制的学生得分率表。然后建立一个根据用户选择层数输出关联规则,以及查询与选定知识点相关的规则的新方案。最后,提出了一个考虑用户反馈、支持度和置信度阈值的关联规则挖掘算法,以过滤无用规则,提高挖掘效率。对VB试卷数据应用该算法,发现了基于用户反馈的有趣关联规则。实验结果表明基于用户反馈的关联规则挖掘优于其他关联规则挖掘算法,更易获得有趣的关联规则。  相似文献   

20.
基于事务数据库的关联规则采掘算法研究   总被引:4,自引:0,他引:4  
采掘关联规则是知识发现领域的一个重要问题,文中对采掘关联规则问题进行了简单的回顾,分析了传统的关联规则Apriori算法的优缺点,设计了一种基于事务数据库的快速采掘算法TB-MA。实例证明,与Apriori算法相比,TB-MA算法削减了数据库遍历次数,提高了采掘效率,是十分有效的采掘算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号