首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
现有算法实现了事务内到事务间最大频繁项目集的转换,能够直接发现不同用户之间的关联关系.但在处理较大的事务数据库时,由于是在原数据库基础上进行关联分析,产生了大量的虚假规则.针对上述问题提出一种基于聚类分析的事务间关联规则挖掘算法,利用聚类分析将初始的复杂的数据集进行约简,去掉冗余数据,缩小数据集,避免了多次扫描数据库和...  相似文献   

2.
W eb日志挖掘是将数据挖掘技术应用到W eb服务器的日志中,发现web用户的行为模式.在介绍了典型的数据预处理技术的基础之上,指出Fram e页面降低了挖掘结果的兴趣性,并提出相应的解决方法-Fram e页面过滤算法消除其影响.通过实验数据对该算法进行验证,说明Fram e页面过滤算法可以显著地提高W eb日志挖掘结果的兴趣性.  相似文献   

3.
针对模糊属性事务数据库提取模糊关联规则的问题,采用模糊概念格与模糊关联规则相结合的方法,实现格节点与属性项集的对应关系,提出模糊关联规则格理论,在渐进式建格算法基础上对格节点相应修改,给出了适用于动态数据库的模糊关联规则格的构建思想.利用模糊关联规则格挖掘关联规则,与采用Apriori算法计算频繁项目集获取规则相比较,容易获得用户感兴趣的关联规则,同时减少冗余规则的生成,使挖掘算法得到优化.  相似文献   

4.
频繁模式挖掘是数据挖掘研究中的关键问题之一,在关联规则等领域应用广泛.概念格是数据分析和知识表示的一种有效工具,适用于从数据库中挖掘规则的问题描述.分析了概念格在频繁模式挖掘的应用,包括对普通事务项集、序列项集及格、树和图等复杂结构的挖掘;讨论了概念格构造优化的必要性及两类主要的优化方法属性约简和剪枝概念格;并对关联规则提取的方法的优劣进行了基本比较,最后探讨了概念格未来的研究方向.  相似文献   

5.
典型的关联规则仅考虑事务中所列举的项目,这样的规则主要是正关联规则.负关联规则不但要考虑事务中所包含的项目集,还要考虑事务中所不包含的项目,它有利于进行购物篮分析以发现那些相关的商品或互斥的商品.而已有的负关联规则挖掘的算法具有很大的局限性.为此,文中提出了一种基于位矩阵的负关联规则挖掘新算法.通过算例表明,该算法是有效可行的.  相似文献   

6.
基于频繁集的多层次交互式关联规则挖掘   总被引:2,自引:0,他引:2  
定义了一系列关联规则的相关概念 ,然后 ,针对现有的销售事务数据库 ,提出了一种改进的获取多层次信息方法 ,并据此对各数据进行压缩编码 ,减少处理时间 .同时 ,借助频繁集和交互式技术 ,实现多个概念层次交互式挖掘 ,以按用户实际需要提取出其感兴趣的关联规则 ,从而提高了挖掘速度和运行效率  相似文献   

7.
 关联规则挖掘能使我们发现数据库中大量项目与项目之间的相关关系,但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.通过求封闭项目集大大消减了频繁项目集数量,再由封闭项目集构造一种新的存储机制——-近似格,基于近似格可以得到冗余度较小的关联规则,从而提供用户简洁紧凑又无信息丢失的关联规则集.  相似文献   

8.
一种应用关联规则森林的改进贝叶斯分类算法   总被引:1,自引:0,他引:1  
针对朴素贝叶斯分类方法中属性值条件独立假设不适应实际情况的问题,提出了关联规则森林表示法及应用关联规则森林的改进贝叶斯分类算法(ABC算法).ABC算法利用关联规则挖掘得到满足条件的关联规则,并由此来构造关联规则森林,而规则森林中所有根节点的概率与所有适用的规则置信度连乘,就得到所有属性值的联合概率.应用UDI数据集对分类器进行了测试,分类结果表明,ABC算法的分类准确率明显高于朴素贝叶斯分类算法,平均提高5%,特别是对属性间有着较强依赖关系的数据集,其分类准确率提高了37%.  相似文献   

9.
在关联规则挖掘算法中,PredictiveApriori算法只需设定输出最好的N个规则,就可挖掘出N个预测精度最大的规则,从而极大地减轻用户参数设置的负担.但该算法需要不断对事务数据库进行扫描,如果事务数据库很大将会大大增加I/O时间,降低挖掘效率.本文融合事务压缩技术,提出一种称为Fast PredictiveApriori的改进版算法.实验结果表明,随着事务数据量的增大,改进后的算法只需扫描压缩事务集.因此,在事务数据库很大时,该算法能明显提高执行效率.  相似文献   

10.
高校人事管理信息中的关联规则挖掘   总被引:1,自引:0,他引:1  
在制定人事激励制度时,要针对不同类别的教师建立有针对性的制度.为此,提出了一种基于分类和关联规则挖掘的方法.通过相似性分析将教师分为若干群体,针对每个群体,应用关联规则挖掘识别其中隐含的规则.  相似文献   

11.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。  相似文献   

12.
为在Web日志数据中挖掘关联规则以指导信息无障碍网站的设计与开发, 针对大量用户对网站页面URL(Uniform Resoure Locator)的访问频率等信息, 通过Apriori算法实
现数据挖掘, 以寻找用户访问页面之间的关联规则。根据3次点击原则及网站结构设计的特点, 对Apriori 算法网页超链接挖掘的过程进行了改进, 频繁项集最多只需找出所有3
-项集即可。算法实现过程表明, 该方法可有效降低算法的时间复杂度, 能通过对关联规则的分析确定用户感兴趣的网页类型, 找出用户所访问网页之间的链接关系。  相似文献   

13.
针对基于Web日志挖掘的用户访问预测经典算法的不足,提出了基于Markov链和关联规则的预测算法(MAPA).使用二阶Markov链找到用户下一步或将来可能访问的页面集,生成预测候选集;使用二项关联规则从正向和反向2个角度修正Markov的预测结果,从而生成最后的预测页面.通过引入用户反馈机制,提出了带反馈的Markov预测算法(MPAF),即在预测过程中逐步构造历史预测树,把历史预测信息保存到历史预测树中,并根据用户的反馈来判断预测的正确性.在预测过程中,用二阶Markov预测算法生成预测候选集,再利用历史预测信息动态地调整预测算法,从而生成预测页面.理论分析证明,这2种预测算法具有线性时间复杂度的预测效率.实验结果表明,MAPA和MPAF在预测准确率上平均提高5%和10%.  相似文献   

14.
0 IntroductionDiantga .cl Dasesciifsiicoanti otrneies r aengr ie smspioornta,n Bta yperosibalnem claisnsi dfiactaati omnin&-Bayesian network, decision tree[1], neural network andSVM[2 ,3]are the technologies of data classificationin commonnow. They have extensively appliedin machine learning,ex-pert systemandstatistics etc .Inthese methods ,the most tra-ditional method is C4 .5[1]based on information entropy,which had extensively applied in practical problems . But themain problemof this me…  相似文献   

15.
基于决策树的MODIS影像赤潮智能检测技术   总被引:2,自引:0,他引:2  
针对赤潮检测方法的及时性和普适性较差的问题,选取美国国家航空航天局(NASA)对地观测系统(EOS)所获取的多景MODIS遥感图像,经过光谱分析和特征选择获得所需数据集,采用数据挖掘技术训练赤潮检测的决策树分类模型,抽取赤潮分类规则。通过对2004年5到6月份一次赤潮爆发周期内获取的8景MODIS遥感影像的赤潮检测,验证了利用挖掘出的分类规则对渤海黄河入海口及邻近海域所发生的赤潮进行检测可取得较满意的结果。  相似文献   

16.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

17.
指出了时序关联规则在支持度度量上的不足,存在处理高密度海量数据时往往要耗费大量的时间处理规模巨大的频繁候选集,同时需要多次重复扫描数据库,执行效率低等问题,提出了重新定义支持度度量方法的时序关联规则.针对时序关联规则在解决项分类时涉及到的分层不确定、不准确情形,引入了基于隶属度的模糊层次分类结构,定义了项间距离、项集间距离,最终得到一种新的关联规则间距离的度量方法.实现了模糊层次分类,将时序关联规则结果进行聚类分析,得到规则和规则之间相似性,实验验证了该方法的有效性.  相似文献   

18.
数据分类的方法直接影响着分类效果。用粗糙集理论中的区分矩阵和区分函数进行的属性约简可以很好地用于数据分类当中,基于此,提出一种数据分类方法,即用区分矩阵和区分函数约简掉信息系统中的冗余属性,得到必要的属性集;然后再约简掉每一条规则中的冗余属性值,提取出决策规则,最后按照决策规则进行分类。实验证明,用该方法实现的数据分类复杂馋低,且能有效提高分类效果。  相似文献   

19.
由于在实际的数据挖掘过程中容易出现无用的频集和冗余的规则,所以降低频集和规则的冗余度可大大提高挖掘的质量,这也是数据挖掘中一直被关注的问题,提出了一个用等价类生成关联规则的方法,算法主要在频集的基础上建立项集的等价关系,进而对项集划分等价类,同时将得到的关联规则划分为精确关联规则和近似关联规则两个集合,通过等价类,不但可以很容易地生成所需要的关系规则,同时可以方便地判断数据之间依赖关系的强弱,同时,项集的等价关系在实际应用中也很有利用价值,算法最后的规则结果集剔除了由来自同一等价类中的面集的重复出现构成的冗余规则,从而得到了较小的关联规则集合。  相似文献   

20.
The classical algorithm of finding association rules generated by a frequent itemset has to generate all nonempty subsets of the frequent itemset as candidate set of consequents. Xiongfei Li aimed at this and proposed an improved algorithm. The algorithm finds all consequents layer by layer, so it is breadth-first. In this paper, we propose a new algorithm Generate Rules by using Set-Enumeration Tree (GRSET) which uses the structure of Set-Enumeration Tree and depth-first method to find all consequents of the association rules one by one and get all association rules correspond to the consequents.Experiments show GRSET algorithm to be practicable and efficient.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号