首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种基于概念层次的分类规则挖掘算法研究   总被引:7,自引:1,他引:6  
从概念层次的角度,提出了一种新的基本概念层次的分类规则挖掘算法,并阐述了相关概念及属性归纳技术与相关性分析方法,以城市人口与收入信息数据库和测试数据,给出了该算法的试验结果,研究结果表明,本算法生成的决策树大小适合,具有高的分类规则挖掘效率。  相似文献   

2.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法。采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测。研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度。  相似文献   

3.
针对信息搜索与挖掘中存在的关键词多义性及用户对所要查询信息的分类存在一定的模糊性问题,提出了一种基于模糊分类网络的信息挖掘方法。该方法利用模糊分类网络固有的对模糊信息的非线性处理能力和自适应学习机制,通过对WEB页面大量分类文档信息的学习,建立了基于模糊分类网络的信息分类器和挖掘模型。构造的信息分类模型结构简单、学习收敛速度快且易于实现。文中给出了分类策略和实现算法,并以中国石油网油气管道专题信息分类为例验证了方法的有效性。  相似文献   

4.
目的:针对时间效率不高的问题,对利用属性特性挖掘粒关联规则的算法进行改进。方法:在分析粒计算有关定义和原有算法的思想的基础上,调整原有算法的相关流程顺序,同时设置相关标志位避免对部分数据集重复组织包含关系的操作。结果:通过相关实验证明,有关改进有效减少了算法所需操作步骤,降低了时间消耗。结论:通过调整流程顺序和设置标志位的方法,有效减少了原有算法的挖掘时间,具有一定实用性。  相似文献   

5.
为提高多因素分类算法的准确性,根据集合包含与概念推理之间的内在联系,提出了有别于决策树算法的一种新的知识挖掘算法.引进因素的或操作、与操作,或操作背景空间,因素的决定域、决定度,优势因素等概念,给出基于上述原理与概念的知识挖掘算法的数学描述,研究了算法的训练和测试问题.在UCI共享数据库中的乳腺癌病例数据集上进行了算法的训练和测试,总错误率低于see5测试的结果.研究结果表明:算法的原理朴素而简单,有较好的学习能力,知识表达方式简洁.  相似文献   

6.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进.在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法.该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则.理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的.  相似文献   

7.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

8.
对基于商品分类信息的多层关联规则挖掘进行了深入研究,提出了一种改进的基于商品分类信息的多层关联规则挖掘算法,该算法可以有效提高其挖掘性能。  相似文献   

9.
一种新的多维关联挖掘智能方法   总被引:1,自引:0,他引:1  
关联规则挖掘在数据挖掘中有着重要的作用.本文提出了采用多维模型的架构将维表进行组织,而且利用项目分块和提取感兴趣的个别属性作为多维关联规则挖掘的基本思想,并利用数据库查询语言实现算法,实现了多维的挖掘,经实验表明该算法的效率大大高于Apriori等算法,且易于实现.  相似文献   

10.
在Ant-Miner算法基础上提出了一种利用蚁群算法解决分类规则挖掘的算法(ACR),设计了合理的蚂蚁选择属性及属性分区的概率公式,并对规则质量的衡量等策略进行改进,可以较好地挖掘分类规则.在标准数据集上通过与Ant-Miner算法和经典的基于决策树的C 4.5算法比较,ACR在挖掘分类规则的简单性、正确率上有较好的表现.  相似文献   

11.
决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。  相似文献   

12.
一种基于粗糙集的决策树构造方法   总被引:2,自引:1,他引:2  
决策树是一种有效的数据分类方法。传统的决策树方法是通过信息熵的计算去生成决策树的节点,计算量大。基于粗糙集理论,利用近似精度的概念来进行属性选择,构造决策树,有效地提高了效率并降低了决策树的复杂度。  相似文献   

13.
一种基于序列挖掘的分类系统框架   总被引:1,自引:0,他引:1  
为了有效地对序列数据进行分类,提出了一种集成分类挖掘和序列模式挖掘技术的分类系统框架(SPACS).先采用一套约束和裁减策略,为每个分类挖掘频繁序列模式,并将其转换为分类序列规则(CSR);再利用平均CSR匹配置信度和一个规则匹配算法构建有效的序列数据分类器.SPACS不需要在提取序列的特征后采用传统方法进行分类,可以直接利用从序列数据中提取出的频繁序列进行分类.实验结果表明,对于序列类型的数据的分类,SPACS比传统的决策树和关联分类方法具有更高的分类精度.  相似文献   

14.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

15.
决策树是数据挖掘中的一种重要分类方法。在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法。该算法具有较大的灵活性,能从测试属性空间逐次删除已使用过的属性。避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率。最后,实例验证了算法的可行性与有效性。  相似文献   

16.
Hybrid Machine Learning (HML) is a kind of advanced algorithm in the field of intelligent information process. It combines the induced learning based-on decision-making tree with the blocking neural network. And it provides a useful intelligent knowledge-based data mining technique. Its core algorithm is ID3 and Field Theory based ART (FTART). The paper introduces the principals of hybrid machine learning firstly, and then applies it into analyzing family apparel expenditures and their influencing factors systematically. Finally, compared with those from the traditional statistic methods, the results from HML is more friendly and easily to be understood. Besides, the forecasting by HML is more correct than by the traditional ways.  相似文献   

17.
基于域理论的自适应谐振神经网络研究   总被引:3,自引:3,他引:0  
在自适应谐振理论和域理论的基础上提出了一种基于域理论的自适应谐振神经网络算法FTART。该算法将自适应谐振理论和域理论的优点有机结合,采用了独特的解决样本间冲突和动态扩大分类区域的方法,不需人为设置陷层神经元,学习速度快,精度高。此外,还提出了一种从FTART网络中抽取符号规则的方法,即基于统计的产生-测试法,实验结果表明,使用该方法抽取出的符号规则可理解性好、预测精度高,可以很好地描述FTART  相似文献   

18.
利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策表训练BP神经网络,再将构造好的BP神经网络集成在每个传感器节点上.仿真结果表明,该算法可以降低数据维数,消除冗余数据、减少网络通信量、延长网络寿命.  相似文献   

19.
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题, 设计实现了基于G4ICCS(Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT。该算法使用哈希表存储连续属性分割点两侧的数据记录, 为并行节点的分割提供依据, 在MapReduce架构下解决了海量地学数据挖掘问题。实验结果表明, 在模拟的云计算环境下, 决策树并行算法可以处理海量地学数据分类问题, 并获得较好的稳定性和较高的处理速度。  相似文献   

20.
This paper combines computational intelligence tools: neural network, fuzzy logic, and genetic algorithm to develop a data mining architecture (NFGDM). which discovers patterns and represents them in understandable forms. In the NFGDM. input data are preprocessed by fuzzification, the preprocessed data of input variables are then used to train a radial Basis probabilistic neural network to classify the dataset according to the classes considered. A rule extraction technique is then applied in order to extract explicit knowledge from the trained neural networks and represent it in the form of fuzzy if-then rules. In the final stage, genetic algorithm is used as a rule-pruning module to eliminate those weak rules that are still in the rule bases. Comparison with some known neural network classifier, the architecture has fast learning speed, and it is characterized hy the incorporation of the possibillty information into the consequents of classification rules in human understandable forms. The experiments show that the NFGDM is more efficient and more robust than traditional decision tree method.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号