首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
文章提出了一种利用粗糙集理论生成文本分类规则的方法.首先,抽取特征词并计算权重.然后,在权值离散化之后,构造决策表.其中,特征词作为条件属性,类别作为决策属性.之后,将文本用属性约简和属性相对约简进行处理,得出决策规则.最后给出分类算法.  相似文献   

2.
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法。目前传统的算法有ID 3、C 4.5、CART等,这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合。为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID 3算法和P ID算法构造的决策树的节点数分别减少了82.9%和31.2%。  相似文献   

3.
应用分类贡献函数的决策树构造方法   总被引:1,自引:0,他引:1  
在构造决策树的过程中,分类属性选择的标准直接影响分类的效果。本文基于粗糙集的理论,提出了在核中应用分类贡献函数来选择分类属性的新方法。利用UCI提供的数据集对该算法和基于信息熵的算法C4.5,以及基于加权平均粗糙度的决策树生成算法相比较。实验证明:用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,复杂性低,且能有效提高分类效果。  相似文献   

4.
将决策树扩展到不确定情形,使用基本信念分配bba(basic belief assignment)来描述训练集的不确定类别,形成一种新的分类方法,即信念决策树.使用稳态环境和置信度2个要素约束bba,形成置信bba.文章给出稳态环境和置信bba的相关定义,运用置信bba来描述训练集的不确定类别,研究了基于置信bba的信念决策树构造,包括bba距离、属性选择方法、分类策略、终止规则及叶结构和树构造流程;最后,给出一个算例以阐述基于置信bba的信念决策树构造过程.  相似文献   

5.
文章就现代藏语语义词典设计的理论框架、语义分类思想、语义分类体系和属性描述原则.构造了一个初步适应英藏机器翻译的藏语语义分类体系,指出了语义分类和语义属性描述在语义分析中的重要性,阐明了语义分类与语义属性描述两者之间的约束关系,探讨相关的语义分析研究课题.  相似文献   

6.
文章提出了一种基于属性重要度的多变量决策树的构造算法。基本思想是将等价关系相对泛化的概念用于多变量检验的构造,在单变量结点的构造时,算法倾向选择属性重要度最大的条件属性作为检验属性。实验表明,该算法具有良好的性能,不仅有效降低了树的高度,而且还兼顾了分类的可读性,是效率较高的决策树生成方法。  相似文献   

7.
基于条件互信息下聚类的朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
 采用条件互信息来度量任意2个条件属性之间的关联程度,采用互信息度量各条件属性与类属性间的关联程度,以此作为将各条件属性进行聚类的准则,提出一种新的将条件属性进行聚类的分组技术.同时,结合朴素贝叶斯分类算法,构造了改进的朴素贝叶斯分类模型.通过仿真实验表明该文提出的算法具有较好的分类性能.  相似文献   

8.
将属性数学理论与关联函数相结合.用于公路隧道围岩分类。根据公路隧道围岩稳定性的影响因素和分类标准,运用属性数学理论建立了公路隧道围岩分类模型;构造了单指标属性测度函数;用关联函数确定分类指标的权重,依据置信度识别准则对公路隧道围岩进行分类,并结合实例进行了对比分析,评价结果更为可靠。研究表明,该方法合理可靠,为公路隧道围岩分类提供了一种新方法。  相似文献   

9.
应用粗糙集的方法,分析决策系统中不同的属性分类方法,以及不同分类方法引起的属性重要性与属性相对约简极小子集的变化情况,寻求属性分类方法与属性约简结果相互影响的内在因素,给出高效的属性分类方法和合理确定约简子集的策略,生成策略对应软件的实现算法,并运用软件实现算法来选取相对约简子集.试验结果显示了该策略及算法的有效性.  相似文献   

10.
本文针对现存多属性综合评价方法的不足,借助小波神经网络思想、原理,构造了一种新的分类小波神经网络多属性综合评价模型,并进行了实例验证,表明此分类小波神经网络多属性综合评价方法是正确、可行的,且能有效地提高综合评价精度与收敛速度。  相似文献   

11.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

12.
基于模糊数据挖掘技术的入侵检测算法与应用   总被引:2,自引:0,他引:2       下载免费PDF全文
基于数据挖掘技术的入侵检测技术是近年来研究的热点,目前有不少入侵检测系统中都采用了关联分析的数据挖掘方法,现有的关联分析算法只能够解决数据中分类属性的挖掘,对于数值属性则不能直接使用,然而网络流量数据中包含了许多反映入侵状况的数值属性,已有学者提出了将数值属性先进行分类而后再进行关联分析的挖掘方法,然而这种方法带来的问题是在进行异常和正常划分时存在明确的界限,即“尖锐边界问题”,由于网络安全概念自身具有一定的模糊性,因此明确的界限可能会导致误报和漏报的情况产生,从而影响检测效果,文中提出了一种基于模糊关联挖掘技术的入侵检测算法,并采用遗传算法确定划分模糊集合的隶属度函数参数,最后的实验结果说明了该算法的有效性。  相似文献   

13.
基于属性的粗糙集在数据挖掘中的应用   总被引:3,自引:0,他引:3  
研究怎样能够有效地实现基于属性的粗糙集理论的数据挖掘技术.详细讨论了粗糙集理论;为了从基于属性的数据库中发现新的规则,研究了一种适合数据挖掘的面向对象的商业市场研究软件体系的应用.  相似文献   

14.
一种基于粗糙集理论的启发式分类规则挖掘算法   总被引:1,自引:0,他引:1  
粗糙集理论是一种新的数据挖掘算法,文章以属性依赖重要性作为启发信息提出了一种新的属性约简算法,且加入了一定的分类正确度。最后通过一个实例完整演示了本方法,证实其有效性。  相似文献   

15.
为改进数据分类的效果,基于粗糙集理论实现数据分类和规则推理的基本原理,利用粗糙集理论中核及决策类覆盖的思想,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系,简化带有不相容规则的决策系统的数据挖掘算法。通过PL/SQL演示了挖掘分类规则的过程,结果表明基于粗糙集分类算法的有效性。  相似文献   

16.
利用数据挖掘来提高网络中能量利用率是无线传感器网络(WSN)的一个重要研究方向.本文构建了基于粗糙集与神经网络相结合的无线传感器网络分布式数据挖掘算法.该算法用粗糙集对节点内的原始数据进行离散化与属性约简后得到的最简决策表训练BP神经网络,再将构造好的BP神经网络集成在每个传感器节点上.仿真结果表明,该算法可以降低数据维数,消除冗余数据、减少网络通信量、延长网络寿命.  相似文献   

17.
Rough集挖掘时间序列的研究   总被引:10,自引:1,他引:9  
Rouhg集方法是一种用于处理不确定性和模糊性知识的数学工具。探讨了基于Rough集方法的时间序列挖掘问题,提出一种将时态信息系统转化信息系统的方法和一个将实时时态信息系统转换为时态信息系统的方法;并从理论上证明了该方法在挖掘效率上的优越性。  相似文献   

18.
一种用于数据挖掘算法的数据生成方法   总被引:1,自引:0,他引:1  
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.  相似文献   

19.
基于模糊集和粗糙集的关联规则挖掘策略   总被引:3,自引:0,他引:3  
提出了一种对原始数据先进行模糊聚类,再提取规则的基于模糊集和粗糙集技术的关联规则挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,有利于提高规则挖掘的有效性.  相似文献   

20.
为了提高决策系统的分类质量,探讨了一种在数据仓库中基于粗糙逼近近似度量的挖掘分类规则策略.首先介绍了数据集中挖掘分类规则的基本原理,并利用粗糙集理论中粗糙逼近近似度量概念,根据决策表条件属性重要性度量及条件属性对决策类划分的逼近近似度量,提出了基于改进粗糙逼近近似度量的数据挖掘进行属性约减方法,最后举例说明了如何在数据库中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号