首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 157 毫秒
1.
针对分类中如何有效利用负关联模式提高分类准确率,提出了一种基于正负关联模式的分类算法.利用类Apriori算法挖掘包含正项或/和负项且项与项之间互相关联的正负关联模式来产生分类规则.为提高挖掘效率,先找出能覆盖训练集的信息熵最小k个正,负项.然后,把这k个正/负项分别与其他项进行连接得到相应的正负关联模式.实验表明,该算法有效减少了挖掘的规则数,极大减少了挖掘时间,并提高了分类准确率.  相似文献   

2.
在Apriori算法的递归链接-剪枝概念上,设计了面向海洋异常事件的关联规则挖掘算法.首先给出事件的相关概念与定义、事件的规则表达及评价指标.根据事件的定义和支持度阈值,生成事件频繁1-项集,并设计面向事件的链接-剪枝算法,实现频繁k-项集到(k+1)-项集的产生.根据事件强关联规则评价指标,提取海洋事件强关联规则.通过太平洋海洋异常事件的关联规则挖掘和典型异常事件间的关联规则分析,验证了该方法的正确性和可行性.  相似文献   

3.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。  相似文献   

4.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

5.
针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based onmutual information,MIHFS)算法,该算法以K-最近邻算法的分类准确率作为衡量所选特征分类性能的评价指标,有效地去除了冗余和不相关的特征,保留了具有交互作用的特征。为了评估该算法的性能,从分类准确率、所选特征数量以及算法稳定性三方面,与最大相关最小冗余、联合互信息等7种特征选择算法在8个数据集上进行了实验比较和分析。实验结果表明:MIHFS算法具有较强的稳定性,不仅有效降低了特征空间的维数,而且在所选特征的分类性能方面明显优于其他特征选择算法。最后将MIHFS算法与灰色关联分析法-逼近理想解的排序技术法相结合并应用到高邮凹陷永安地区戴一段地质评价中,其评价结果准确率为80%,与实际钻探结果基本吻合,具有较高的可靠性,能够有效指导油气地质评价。  相似文献   

6.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

7.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率.  相似文献   

8.
采掘关联规则是数据采掘领域的一个重要问题,探讨了Apriori算法,基于该算法,提出了1种用Visual Foxpro求频繁项目集的方法,并编写了求频繁项目集的程序。  相似文献   

9.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法.  相似文献   

10.
针对传统纹理图像分类算法识别率不高的问题,引入置信规则库推理方法而提出一种纹理图像分类策略.目前纹理图像分类研究常局限于纹理特征提取算法的改进,而忽视了另一个决定分类效果的关键,即分类器设计.该文采用置信规则库推理方法,在现有纹理特征提取算法基础上重新设计纹理图像分类器.根据角度径向变换和灰度共生矩阵算法提取图像纹理特征,采用主成分分析方法减少角度径向变换特征的维数,以避免产生置信规则库"组合爆炸"的问题.最后用置信规则库推理方法将纹理特征信息转换成类别置信度信息,得到最终的分类结果.实验中将置信规则库推理方法分别与相似性距离度量法和支持向量机法进行对比,结果表明所提出的方法在一定程度上提高了纹理图像分类准确率.  相似文献   

11.
以齐齐哈尔市辖区为研究区域,利用分类回归树(Classification and Regression Tree,CART)算法从训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、纹理特征和地学辅助数据建立研究区的决策树模型.用实测的GPS样本点对分类结果进行精度验证,并与最大似然监督分类方法(Maximum Likelihood Classification,MLC)进行对比.结果表明,基于CART的决策树分类结果的总精度和Kappa系数分别为82.24%和0.77,分类精度较MLC监督分类方法有明显提高,有较好的分类效果.  相似文献   

12.
基于数据挖掘思想的故障模式分析   总被引:1,自引:0,他引:1  
提出了一种新型的基于数据挖掘思想的故障模式分析.通过收集故障现象并整理形成故障信息维度表,产品技术参数、故障原因等组成的关系规则维度表;基于故障信息维度表与关系规则维度表应用Apriori算法的频繁项集方法对故障信息进行分析,通过故障匹配、生成候选集、过滤候选集,最后确定故障原因,优选出排除故障方案.  相似文献   

13.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

14.
研究了以决策树结构取代原有入侵检测系统采用的链表结构,在于改进入侵规则的存储和模式匹配,提高检测速度.用C4.5算法为决策树每个规则集节点动态选择最显著的特征,进行并行测试,实现性能优化.为了减少冗余比较和无效匹配,运用了一种基于C4.5决策树裁剪算法,以规则信息量作为判断标准.研究结果表明,此方法可以提高最终模型的预测精度,并能克服噪音数据,有效地提高了模式匹配速度和规则的访问速度.  相似文献   

15.
基于频繁模式树的约束最大频繁项目集挖掘算法研究   总被引:2,自引:0,他引:2  
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的.  相似文献   

16.
频繁项目集的快速增量式更新算法   总被引:7,自引:0,他引:7  
提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号