首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 124 毫秒
1.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率.  相似文献   

2.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。  相似文献   

3.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

4.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

5.
数据的挖掘是一门综合的学科,涵盖计算机数据库以及高等数学等诸多学科,对于如何更好地利用分析数据库,学者一直在探索。本文从关联规则基本理论入手,进一步对关联规则挖掘的经典算法Apriori算法和FP-growth(频繁模式增长)算法进行了详尽描述,并提出了两个算法不同的针对点,有助于使用者在应用时根据环境做出适当选择。  相似文献   

6.
负关联规则挖掘算法研究   总被引:5,自引:0,他引:5  
典型的正关联规则仅考虑事务中所列举的项目.负关联规则不但要考虑事务中所包含的项目,还必须考虑事务中所不包含的项目,它包含了非常有价值的信息.然而,对于负关联规则挖掘的研究却很少,仅有的几种算法也存在一定的局限性.为此,文中提出了一种快速有效的负关联规则挖掘算法MNAR,并给出了一种基于二进制形式的支持数计算方法.理论和实验结果表明算法MNAR是有效和可行的.  相似文献   

7.
本文绍了关联规则挖掘的研究情况,提出了关规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。  相似文献   

8.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向.  相似文献   

9.
传统的关联规则只关注于挖掘出项集间的正关联规则,但在实际应用中负关联规则同样隐含着有价值的信息.本文首先给出了正、负关联规则的定义及支持度和置信度的函数表示,重点分析了关联规则中"支持度—置信度"架构的局限性,提出了利用项集的相关性来解决关联规则中正、负矛盾规则出现的问题,同时针对置信度的设置进行了研究分析,最后对负关联规则挖掘的算法进行了讨论,旨在为关联规则的研究奠定基础.  相似文献   

10.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

11.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

12.
一个基于频繁项集的时态数据挖掘算法   总被引:5,自引:0,他引:5  
研究了基于频繁项集的一个时态效据挖掘算法。首先,引进了基于频繁项集关联规则的概念,性质,然后,给出了基于时态约束关联规则的相关概念的定义和性质分析。最后,给出了在时态效据库中挖掘具有时态约束的最大频繁项集,并在此频繁项集生成时态关联规则的算法,由此导出了一种具有一定意义的时态关联规则挖掘方法,这种方法可以崩于商品销售。股票价格等问题的知识发现,最后讨论了该算法在股票效据分析上的一个应用。  相似文献   

13.
郑毅  郑苹 《应用科学学报》2014,32(4):427-433
在火炮身管弯曲度测量系统中,为了能从光靶图像中同时提取标定图案和激光光斑,提出了一种双阈值图像分割方法. 基于模糊数学理论和最大模糊熵判据,把光靶图像中的像素灰度级分为黑、灰和亮3 个模糊子集,用于畸变校正的标定图案的像素灰度级隶属于黑模糊子集,用于测量的激光光斑的像素灰度级隶属于亮模糊子集.使用改进的模糊指数熵作为分类判据,提高了分类准确性. 通过遗传算法确定模糊熵参数的最优组合,降低了计算复杂度,并且最大模糊熵判据仅含有4 个模糊熵参数,减小了搜索空间. 针对光靶图像进行了双阈值分割实验,并与最大类间方差双阈值法、模拟退火模糊熵法和使用未改进的模糊指数熵的遗传模糊熵法进行了比较. 实验结果表明,所提方法能自动而有效地选取双阈值,且分割效果优于其他3 种双阈值分割方法.  相似文献   

14.
15.
针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based on mutual information,MIHFS)算法,该算法以K-最近邻算法的分类准确率作为衡量所选特征分类性能的评价指标,有效...  相似文献   

16.
过滤特征基因选择及演化硬件急性白血病分型   总被引:1,自引:0,他引:1  
提出一种基于虚拟可重构结构的内部演化硬件癌症分子分型方法. 为有效处理DNA微阵列数据和便于硬件实现,对比研究了5 种基于过滤模式的信息基因选择方法. 演化硬件通过系统学习和系统分类两个阶段对经过特征选择的信息基因进行处理. 对急性白血病数据集的实验结果表明,基于信噪比信息基因选择方法的演化硬件分类器识别率最高. 演化硬件具有和其他传统模式识别方法可比的识别率,识别时间仅需0.12 ms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号