共查询到20条相似文献,搜索用时 46 毫秒
1.
传统的关联规则只关注于挖掘出项集间的正关联规则,但在实际应用中负关联规则同样隐含着有价值的信息.本文首先给出了正、负关联规则的定义及支持度和置信度的函数表示,重点分析了关联规则中"支持度—置信度"架构的局限性,提出了利用项集的相关性来解决关联规则中正、负矛盾规则出现的问题,同时针对置信度的设置进行了研究分析,最后对负关联规则挖掘的算法进行了讨论,旨在为关联规则的研究奠定基础. 相似文献
2.
本文绍了关联规则挖掘的研究情况,提出了关规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。 相似文献
3.
韩冬霞 《哈尔滨师范大学自然科学学报》2010,26(3):65-67
把基于数据垂直分布的模糊关联规则挖掘算法引入到网络的入侵检测,利用该算法从网络数据集中对采集到的数据进行模糊化的处理,并将数据垂直分布于位图中.利用k-means聚类算法建立属性的模糊集和模糊隶属函数,该算法克服了传统的离散分区法的不足,同时改进了已有模糊关联规则,提取出具有较高可信性和完备性的模糊关联规则. 相似文献
4.
亓文娟 《哈尔滨师范大学自然科学学报》2015,(1):45-48
针对传统关联规则各项目具有着相似的出现频率和相同的重要性两个前提假设,提出了加权关联规则的概念,重点研究了水平加权关联规则MINWAL(O)算法的基本思想,指出该算法的不足及优化算法,旨在对加权关联规则挖掘算法的扩展和改进奠定基础. 相似文献
5.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向. 相似文献
6.
模糊关联规则及其挖掘算法 总被引:3,自引:1,他引:2
通过定义模糊事务数据库,用模糊概念表示事务数据之间的关联关系,提出并定义了模糊关联规则的概念,研究了模糊关联的性质,并给出了一种模糊关联规则的数据挖掘算法. 相似文献
7.
负关联规则挖掘算法研究 总被引:5,自引:0,他引:5
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的. 相似文献
8.
一个基于频繁项集的时态数据挖掘算法 总被引:5,自引:0,他引:5
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。 相似文献
9.
针对当前关联规则挖掘存在的不足,在充分利用本体特点的基础上,对关联规则挖掘方法进行了改进。提出了一种面向领域的噪音清除算法,结合Apriori算法优点,又提出了一种改进的关联规则挖掘算法,采用领域本体技术来优化规则,从而去除冗余规则。通过实验验证所提方法的有效性。 相似文献
10.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献
11.
基于关联规则的电子商务推荐系统研究 总被引:3,自引:0,他引:3
电子商务网站可以使用推荐系统分析客户的消费偏好,向每个客户具有针对性地推荐商品.推荐系统在帮助了客户的同时也提高了顾客对商务活动的满意度.本文首先对基于关联规则的推荐系统的相关知识进行了讨论,提出基于项目支持度的关联规则推荐算法,并通过实验验证该算法的可行性.在此基础上对基于关联规则推荐系统的结构进行了研究. 相似文献
12.
13.
较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例. 相似文献
14.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率. 相似文献
15.
16.
常项集产生的算法及兴趣度量 总被引:1,自引:0,他引:1
聂永红 《广西师范学院学报(自然科学版)》2001,18(4):65-68
本文引入在关系数据库中包含定量和范围属性关联规则的挖掘问题,这种技术的一个直接应用可以生成许多类似的规则。给出为挖掘定量关联规则所需的兴趣度量及常项集产生的算法。 相似文献
17.
《哈尔滨师范大学自然科学学报》2016,(6)
通过对传统决策树算法的介绍,阐述了改进后的C4.5算法将在挖掘时间上用时更少.通过对学生成绩进行预处理后,利用改进后的算法挖掘学生成绩之间的关联规则,分析并解释关联规则的结果. 相似文献
18.
针对分类中如何有效利用负关联模式提高分类准确率,提出了一种基于正负关联模式的分类算法.利用类Apriori算法挖掘包含正项或/和负项且项与项之间互相关联的正负关联模式来产生分类规则.为提高挖掘效率,先找出能覆盖训练集的信息熵最小k个正,负项.然后,把这k个正/负项分别与其他项进行连接得到相应的正负关联模式.实验表明,该算法有效减少了挖掘的规则数,极大减少了挖掘时间,并提高了分类准确率. 相似文献
19.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。 相似文献