首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
张志锋 《科学技术与工程》2012,12(26):6640-6643
如何有效地从具有连续属性的数据中挖掘关联规则,是目前数据挖掘领域的一个研究热点。论文基于遗传算法,提出了一个连续属性关联规则挖掘方法。在该方法中,首先采用三段式编码将连续属性离散化、属性约简和规则提取集成在一起,然后将小生境引入到遗传算法中,以避免早熟、提高挖掘效率。实验表明,该方法是有效的。  相似文献   

2.
针对病理诊断规则获取问题,采用基于粗糙集理论的规则提取方法.首先进行连续属性的离散化,用遗传算法对CAIM(class-attribute interdependence maximum)离散化算法进行改进.然后利用粗糙集理论进行规则提取.采用以核为基础的增量式约简算法,综合考虑属性对约简的增益和属性在剩余属性集中的重要性,给出了衡量属性重要性程度的一个准则.随后进行属性值约简,获取诊断规则.  相似文献   

3.
传统的粗糙集理论不能处理连续属性,而且得到的分类规则大多比较复杂.支持向量机理论能够得到简洁的分类规则,也能处理连续属性,但仅适用与小样本,对大样本数据集有一定的局限性.文章首先提出了针对连续属性的粗糙集下近似理论,使粗糙集理论能够应用到连续属性.基于上述理论以及支持向量机分类方法仅与支持向量有关的特性.提出了一种先由粗糙集进行预处理的支持向量机分类方法.实验表明,该方法在缩短训练时间的基础上,保留了支持向量机方法所需分类信息,提高了分类精度,克服了SVM算法的应用瓶颈.  相似文献   

4.
赵阳  陆静 《河南科学》2010,28(8):992-996
为了提高蚂蚁矿工算法处理连续属性的性能,采用混合正态核函数处理连续属性,使蚂蚁矿工算法能够处理具有连续与离散混合域的数据集.通过分析表明,混合域蚂蚁矿工算法有更高的准确率,能产生更简洁的规则.  相似文献   

5.
目的 讨论连续值决策表的一种属性约简方法.方法 连续值决策表是一种常见的根据实际应用抽象所得的数据库.本文通过对连续值决策表进行预处理--离散化,把它们转化为有序决策表,然后以r度量作为度量标准对转化后所得的有序决策表进行属性约简.结果 与结论可以证明该方法可对连续值决策表有效的进行属性约简,使此类决策表的规则表示简单直观.  相似文献   

6.
一种基于可信度最优的数量关联规则挖掘算法   总被引:2,自引:0,他引:2  
研究了数量关联规划挖掘过程中的连续属性离散化问题,描述了连续属性离散化方程,包括连续属性区间划分算法和数据库样本大小的确定,提出了基于可信度最优的数量关联规则挖掘算法。该算法首先利用等深度划分算法对连续属性进行离散化,然后利用凸包处理技术提取强规则中可信度最高的数量关联区间,它对于数量关联规则的优化有着重要的应用价值。应用该算法对股票行情进行了数量关联分析,提取股票涨跌与股票价格之间可信度最高的关联规则。实验表明该算法是非常有效的。  相似文献   

7.
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵作为属性约简的标准,提出了基于联合熵的知识约简算法;并给出了以支持度、兴趣度和准确度为阈值的有效关联规则算法.  相似文献   

8.
针对生产调度规则提取工作对数据集属性约简的客观需求,提出了一种关键属性提取技术.首先,分析了生产数据的特点,并依据重要性和关联性,将生产数据的属性划分为多个集合;然后,在此基础上利用模糊熵与聚类准确度建立重要性目标函数,用于发现重要属性.最后,利用关联性分析查找重要属性的关联属性,将相关属性进行合并,形成重要复合属性,以进一步增强属性提取效果.为了验证该技术的有效性,将利用该技术所获取的数据子集与通过随机法所得到的数据子集进行了对比,分析比较了各数据子集的相容性和规则提取准确性.结果表明,提取属性后所形成的数据子集具有较低不相容度,浓缩了原始数据集的调度规则知识,可显著提升多种生产调度规则挖掘算法的准确度与效率.该技术非常适用于生产调度规则挖掘数据预处理阶段的关键属性提取工作.  相似文献   

9.
文章提出了一种利用粗糙集理论生成文本分类规则的方法.首先,抽取特征词并计算权重.然后,在权值离散化之后,构造决策表.其中,特征词作为条件属性,类别作为决策属性.之后,将文本用属性约简和属性相对约简进行处理,得出决策规则.最后给出分类算法.  相似文献   

10.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

11.
对于混合属性相关度的计算,现有方法的做法是将连续属性离散化后,用基于频率的计算方法来计算.而连续属性离散化可能会丢失部分信息,为属性评估带来不确定因素.在此提出一种直接计算混合属性相关度的方法:将一个连续属性中的所有数据,根据一个离散属性的属性值分组,以分组连续属性前后数据方差的关系确定两个属性的相关度.在两个真实数据集及常用机器学习数据集上的实验结果表明:该方法可以有效度量混合属性数据之间的相关程度.  相似文献   

12.
基于粗糙集方法提出了一种系统的决策表约简和决策规则提取方法. 为了避免现有属性离散化方法的不足,使用多元统计中的聚类分析,并借助树形图,R2、半偏相关以及伪F统计量,对连续属性进行离散化处理,得到适合粗糙集方法要求的决策表. 在此基础上,简化了基于可辨识矩阵和逻辑运算的传统属性约简算法,并完善了启发式算法进行属性值约简和决策规则提取. 最后,以应用实例验证了该方法的可行性和有效性.  相似文献   

13.
ID3分类算法无法处理连续性数据并且在选择分裂属性时明显倾向于取值多的属性,无法产生准确的规则.基于信息熵的连续数据离散化预处理技术有效地拓展了ID3算法的应用领域,并提出了基于信息增益率的分裂属性选择方法 ,样例数据测试结果 分析表明:该分类算法改正了在选择分裂属性时明显倾向于取值多的属性的缺陷,提高了分类的精度.  相似文献   

14.
提出了基于粗集理论的煤矿瓦斯预测专家系统知识获取方法.该方法首先建立瓦斯数据与瓦斯突出强度之间关系的预测样本集;然后运用粗糙集的连续属性离散化、属性约简以及规则提取算法,从大量的预测样本集中自动获取预测知识,并将预测知识存储于专家系统知识库中;最后基于推理机,实现煤矿瓦斯突出的实时预测.实例分析表明,粗糙集方法在煤矿瓦斯突出预测专家系统知识获取中的有效性和实用性.  相似文献   

15.
一种基于粗集的模糊神经网络   总被引:5,自引:0,他引:5  
罗健旭  邵惠鹤 《上海交通大学学报》2003,37(11):1702-1705,1722
提出了基于粗集的模糊神经网络(RSNFN),利用粗集理论从数据样本中获取约简的规则集作为模糊神经网络的规则,使得规则数目减少,克服了当输入维数高时,模糊神经网络模糊规则过多,结构过于庞大的缺点.同时利用遗传算法对连续属性的最优离散化值进行寻优,从而获得最优的网络结构.最后用RSNFN方法对催化裂化装置的轻柴油凝点进行估计,取得了良好的效果.  相似文献   

16.
连续属性离散化是粗糙集应用研究的重点内容之一.基于条件熵可以反应属性依赖度的性质,将决策属性对条件属性的条件熵作为离散化标准,提出了一种粗糙集连续属性离散化方法,并通过实例证明了该方法的正确性.  相似文献   

17.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

18.
为了提高入侵检测的准确度和速度,针对入侵规则属性相关性的特点,将属性与类间的互信息与属性间的互信息结合,提出了一种新的混合互信息的决策树分类算法.在对此算法进行了算法设计和分析的基础上,将由此算法构造的决策树分类方法对入侵规则进行组织,改变了传统的入侵规则逐条串行检测,以增加预处理时间为代价,提高了数据包的过滤速度和准确度.实验分析表明,应用该算法的入侵检测系统比使用传统方法具有更高的准确率和速度.  相似文献   

19.
基于CMAR算法的水平加权多分类关联规则挖掘   总被引:1,自引:0,他引:1  
关联分类是数据挖掘中一种新的分类方法,它将关联规则挖掘和分类进行了算法集成.但在实际应用中,用户会比较倾向于自己最感兴趣或认为最重要的那部分属性,因此有必要加强这些属性对规则的影响,同时减弱另一些用户兴趣不大或认为不重要的属性对规则的影响.为此,本文提出了水平加权关联规则的问题,并结合CMAR算法,加以改进给出了关于该问题的解决方案及有效算法New_CMAR,实验表明,修改后的New_CMAR算法正确并符合实际,有实用价值.  相似文献   

20.
基于粗糙集和证据理论的决策规则提取   总被引:2,自引:1,他引:1  
提出一种基于粗糙集和证据理论的两阶段决策规则提取算法, 该算法首先利用粗糙集中属性缩减的思想, 找出每条规则中的重要条件属性集合, 然后再基于证据理论中证据结合的思想进一步去掉重要条件属性集中的冗余条件属性, 从而得到最终的决策规则. 所给算法简化了属性集的约简, 对高维数据也是可行的. 实验结果表明, 利用该算法能够挖掘出高质量的决策规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号