首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 281 毫秒
1.
空间数据分类算法大部分基于单表,将多关系数据挖掘的分类技术用于构建空间数据对象的分类模型,特别是元组ID传播技术使得空间数据对象可以高效表征包括领域属性和空间位置的完整特征,从而使得分类依据更客观。实验表明SCrossMine算法可以获取较高的分类精度,同时分类结果也能较好不同类别对象的空间分布格局。  相似文献   

2.
董贺  荣光怡 《松辽学刊》2008,29(4):107-108
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

3.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

4.
主动规则执行终止性分析算法的修正   总被引:1,自引:0,他引:1  
指出基于触发图和活化图主动规则终止性分析算法的,错误,提出触发可达和触发可达集,并在此基础上对原算法进行修正。  相似文献   

5.
随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘出相应的联知识愈来愈感兴趣,关联规则一个典型的应用实例就是市场购物分析.本文介绍了关联分析的概念Apriori算法及其改进技术,对Apfiori算法地优缺点进行了评价.  相似文献   

6.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率.  相似文献   

7.
数据的挖掘是一门综合的学科,涵盖计算机数据库以及高等数学等诸多学科,对于如何更好地利用分析数据库,学者一直在探索。本文从关联规则基本理论入手,进一步对关联规则挖掘的经典算法Apriori算法和FP-growth(频繁模式增长)算法进行了详尽描述,并提出了两个算法不同的针对点,有助于使用者在应用时根据环境做出适当选择。  相似文献   

8.
在分析决策树算法及遗传算法的基础上,提出了一种将两种算法结合起来挖掘分类规则的新方法.实验证明,它不仅解决了数据挖掘中的“碎片”问题,同时还提高了分类的准确率.  相似文献   

9.
在数据量很大时,原有的数据分类方法变得失效。因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法。在相同的数据量下,PSS算法比传统的sPRINT算法具有更好的性能。实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题。  相似文献   

10.
决策树分类ID3算法研究   总被引:1,自引:0,他引:1  
张桂杰  王帅 《松辽学刊》2008,29(3):135-137
分类是数据挖掘的重要内容之一,在许多领域得到广泛应用,现已有多种分类方法,其中决策树分类法在海量数据环境中应用最为广泛,本文分析了决策树分类ID3算法的原理,给出构造决策树的基本算法,指出ID3算法构造决策树的优缺点,针对ID3算法倾向于取值较多的测试属性的缺点,引入一个参数来约束属性选择,给出一种优化算法.  相似文献   

11.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法.  相似文献   

12.
在智能算法优化分类器参数时,经常采用加权方式将分类率和特征数目作为单目标优化。为提高分类性能和解决权值设定问题,本文提出一种基于MOABC算法的分类器设计,将分类率和特征数目作为两个优化目标,并通过相关数据进行验证。结果表明,通过多目标优化可以得出多组最优解,供决策者选择,并且分类效果明显优于作为单目标处理时所得的结果。  相似文献   

13.
针对FP-growth算法存在的不能进行增量更新,以及已有基于FP-growth的增量更新算法效率不高、不支持连续更新等问题,在FP-tree基础上,提出了增量更新改进算法FPIUA2,其适用于数据集连续增加的情形,适用于稀疏型数据集和稠密型数据集、支持连续执行.实验表明:该算法的效率远高于FPgrowth和已有的增量更新算法,其执行效率较FP-Growth、FPUA和FIUA2算法提高了1个数量级,并且具有很好的可扩展性.  相似文献   

14.
本文重点研究了关联规则经典算法Apriori算法的基本思想,并通过实例说明发现频繁项集的方法,提出了Apriori算法的不足,并结合spss clementine软件将关联挖掘应用于某超市的销售数据,从大类及二级类商品之间两个方面进行挖掘,针对挖掘结果进行了分析,同时提出建议,为超市提供辅助决策信息.  相似文献   

15.
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.  相似文献   

16.
将alman滤波算法与BP算法相结合,提出一种用于模式分类的多层感知机模型和学习算法,并对计算实例进行了计算机模拟实验,实验结果表明,这种算法适用于非线性模式分类,且具有较快的收敛速度。  相似文献   

17.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

18.
首先将事务数据库压缩存储到一棵事务线索树(TT-tree)的结点上,并建立这些结点的索引表,然后寻找结点索引表的最后结点到根结点的全部路径,这些路径及路径的交集包含了用于挖掘关联规则的频繁集,该算法只需扫描事务数据库一次,由于采用了逆向搜索TT-tree的方法,搜索的时间开销非常少,该算法可以挖掘中短模式的海量数据,具有很好的伸缩性,同时该算法具有增量挖掘的功能,通过大量的实验数据进行比较。该算法的速度约是Apriori算法的10倍。  相似文献   

19.
一个有效的不精确推理算法   总被引:1,自引:0,他引:1  
文中给出了一个借助模糊产生式规则的矩阵变换而实现的不精确推理算法,并通过实例解释了算法的推理过程,同时证明了对具有n个模糊产生式规则的知识系统而言,该算法的时间复杂度为O(n+1)。  相似文献   

20.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号