首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 656 毫秒
1.
加权关联规则研究及其在个性化推荐系统中的应用   总被引:4,自引:0,他引:4  
传统的关联规则挖掘没有考虑各项目的重要程度,因此实际过程中缺乏一定的针对性.在New-Apriori算法的加权支持度基础上结合Fp-growth算法思想,提出了基于Fp-树的加权关联规则算法,并给出了关联规则的个性化推荐的一般过程.利用Web日志文件采用网页被用户选择的频率作为权重值,实现了个性化推荐系统的算法.实验结果表明该算法具有较高的准确性和效率.  相似文献   

2.
给出了一个基于约束的关联规则挖掘算法,首先依赖加权支持度产生频繁项目集,然后利用兴趣度产生关联规则,并对过滤掉的频繁项目集进一步分析发现包含负项集的关联规则。  相似文献   

3.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

4.
张争龙 《科学技术与工程》2013,13(19):5687-5691
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。  相似文献   

5.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

6.
为解决经典Apriori算法中最小支持度设定不当和数据库中各项目的重要程度不易给出的问题,采用区间量化方法计算出最小支持度满足的一个区间,用区间值代替单一的最小支持度.并根据引入的可能度概念对改进算法进行剪枝的策略,提出项目权重和最小支持度都为区间值的加权关联规则挖掘算法.通过UCI上的数据集对比改进算法和经典算法的性能.研究结果表明:改进算法解决了最小支持度设定过高或过低所带来的问题,并提高了算法的运行速度及有效率.  相似文献   

7.
基于PSO的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集.  相似文献   

8.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

9.
分析了概念格与关联规则之间的关系,提出了将频繁项集及其支持度存储在概念格上,然后在创建好的概念格上提取关联规则的方法,概念格的每个节点本质上是一个最大项目集,非常有利于关联规则的提取。为了充分利用概念格实现关联规则提取,提出了一种新的概念格结构:加权概念格,并给出其渐进式构造算法及基于该格结构上的关联规则提取算法。  相似文献   

10.
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则.鉴于此,给出了关联规则的两个性质和引入兴趣度的第三个度量--相关支持度;利用两个性质消除了一定的冗余,同时利用相关支持度使挖掘出的规则更符合用户的需求,设计了挖掘出有效关联规则算法,在算法中利用导出的性质提高算法效率,较好地解决了上述问题.  相似文献   

11.
针对时间序列,研究和分析时序关联规则挖掘,提出时序关联规则数据挖掘的基于滑动窗口和时序树特殊结构的新的挖掘算法,并利用该算法挖掘超过给定支持数阈值频繁时序,为用户的决策支持及趋势预测提供支持,并通过实验验证算法的有效性和实用性。  相似文献   

12.
本文在关联规则提取算法深入研究的基础上,进一步提出了一种带权重又带约束的关联规则提取算法,解决了在项目集中各项目存在权重和项目间存在约束的情况下关联规则的提取问题.实验证明了该算法的有效性和实用性.  相似文献   

13.
考虑事务数据库D长度不变、项目集I发生变化并且带有权重时的关联规则挖掘问题,提出了一种针对项目集增加的加权关联规则更新算法,解决了增加项目集的加权关联规则更新问题,与对新数据库重新运行算法相比,其运行效率有显著提高.  相似文献   

14.
基于Rough Set的缺省加权规则挖掘算法   总被引:8,自引:0,他引:8  
本文在引入规则加权支持度概念后,提出了一种基于Rough Set的缺省加权规则挖掘算法-MDWRBR算法,实验结果表明,该算法能有效地过滤噪声,提高规则的挖掘效率。  相似文献   

15.
数据库中标准加权关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
在原有的关联规则挖掘算法的研究中,认为所有的属性的重要程度相同,提出标准加权关联规则的挖掘算法,能够解决因属性重要程度不一样带来的问题。  相似文献   

16.
针对Apriori 关联规则算法中的瓶颈问题,提出了一种Apriori_improve 算法.该算法根据组合元素的计数结果排除一些不符合组合条件的元素,并在扫描数据库后"删除"一些不能支持频繁集的记录,迅速减小了数据库规模.实例表明:对于大型数据库的挖掘,该算法比Apriori算法的效率有明显地提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号