首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 112 毫秒
1.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

2.
介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法.值差分度量算法原本是用于计算离散属性值间的距离,但实际上将这种方法反过来用于连续属性的离散化也可以有相当好的效果.将其与传统的使用统计量χ2的离散化算法作了比较.  相似文献   

3.
连续属性离散化是粗集理论应用于实际问题时的重要环节,一般的离散化方法应用于不确定信息系统的属性离散化时,在数值选择上却存在着依据缺失的突出问题.利用数值态势构成的态势差研究两个集对势之间的差度,并将其结果应用到了连续属性离散化过程中,形成了基于数值态势分析的连续属性离散化的新方法,较好地解决了数值选择不确定问题,并给出实例进行了验证.  相似文献   

4.
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C 编写的算法进行数值示例及测试数据库。实验结果表明此算法有效可行。  相似文献   

5.
例外挖掘是一项有趣的知识发现任务。现有的例外挖掘算法主要基于数据的所有属性检测数据集中的例外。本文针对高维数据的稀疏性,提出了连续数据上基于贝叶斯网(BN)子空间例外挖掘,以及基于属性重要性的连续数据离散化方法。  相似文献   

6.
一种基于聚类的粗糙集连续属性的离散化算法   总被引:4,自引:0,他引:4  
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具。粗糙集理论只能对离散属性进行处理,而不能处理连续属性。中针对这一缺陷,利用连续数值属性有序性的性质和统计方差理论,提出了一种基于聚类的连续属性离散化算法。运用典型数据将本算法与现有方法进行了比较分析,得到了满意的结果。  相似文献   

7.
连续属性离散化是粗糙集应用研究的重点内容之一.基于条件熵可以反应属性依赖度的性质,将决策属性对条件属性的条件熵作为离散化标准,提出了一种粗糙集连续属性离散化方法,并通过实例证明了该方法的正确性.  相似文献   

8.
一种连续属性离散化的新算法   总被引:5,自引:0,他引:5  
连续属性的离散化问题是机器学习、数据挖掘等领域中重要研究课题之一,本文深入讨论连续属性离散的各种方法,提出一种基于RS理论和条件信息熵的决策表条件属性离散化算法,计算简单、易实现并以实例加以说明。  相似文献   

9.
提出了连续属性的一种离散化方法,指出与其他离散化方法的不同之处:离散化算法应是与挖掘目标息息相关的.研究和探讨了分类问题中的属性离散化方法,以分类精度和正域的势来评估每一步离散化过程,并将评估结果进行反馈,直至所有属性的属性值判断完为止.通过UCI机器学习数据库的实验表明,属性值个数的减少会提高在数据集上运行数据挖掘算法的效率,离散化后的分类正确率保持不变或有一定的提高.  相似文献   

10.
连续数值属性的离散化是粒计算理论应用的重要步骤,提出粒度商的连续属性离散化方法。通过给出粒度商的概念,根据粒度商的大小来选取合适的区间粒,从而达到连续属性离散化的目的。最后给出实例分析,说明该算法的有效可行性。  相似文献   

11.
主要介绍了云端装配知识发现系统的总体设计思路、总体设计结构、粗糙集处理引擎设计、软件架构设计和详细实现,用户在浏览器就可以完成对上传的数据进行参数设置、完整性处理、离散化处理、属性约简、知识生成和知识过滤等一系列操作。  相似文献   

12.
针对转炉炼钢知识发现的特点,采用粗糙集理论进行分析,应用数据清洗、标准化及离散等方式对转炉炼钢生产数据进行预处理,以炼钢生产的主要影响因素作为知识发现的条件属性,以转炉冶炼终点控制目标作为知识发现的决策属性,建立了基于粗糙集方法的转炉炼钢知识发现模型,实现转炉炼钢生产知识的自动发现、获取和规则提取。以转炉冶炼终点钢水温度的变化规律做为知识发现的决策属性,采用210 t转炉炼钢实际生产数据进行模型的应用测试,结果表明提取出的铁水硅含量、铁矿石质量、氧气消耗量等影响因素对转炉冶炼钢水终点温度存在重要影响,且模型提取出的转炉炼钢终点钢水温度知识规则与现行转炉炼钢现场的变化规律一致,证明基于粗糙集方法的转炉炼钢知识发现模型的有效性。  相似文献   

13.
数值仿真结果中知识发现的模糊-粗糙集方法   总被引:3,自引:0,他引:3  
分析了塑性成形过程数值仿真结果的特点和采用离散化作为粗糙集数据预处理方法的不足,提出用模糊-粗糙集算法对仿真结果进行数据挖掘,并以NUMISHEET’93中盒形件拉伸为例进行了数值仿真,从中提炼出对加工工艺和模具设计有指导意义的产生式规则,且每条规则都有可靠性度量,有利于知识推理中的规则调度.研究结果表明,该算法是一种适用于本领域特点的更有效的算法.  相似文献   

14.
为了解决机械装配行业工艺知识提取困难的问题,提出一种基于粗糙集理论的装配知识发现方法,给出其计算机软件实现方案,并用实例验证方法的有效性。该方法运用粗糙集中属性重要度的概念和方法,实现属性核和属性约简的求解,并根据约简挖掘隐含在经验数据中的专家知识,形成相应的决策规则。实例验证结果说明,该方法可以有效地提高装配效率和装配知识的学习。  相似文献   

15.
概念格是数据分析与知识发现的重要理论.知识发现的一个重要方面是知识约简,因而找到简单有效的约简方法是非常必要的.本文从形式背景上ECⅡ代数结构的角度出发,研究了概念格的属性约简定理,约简方法及属性特征.  相似文献   

16.
形式概念分析理论对于知识发现、信息检索、机器学习、软件工程等领域是一种很有效的数据分析工具.通过对概念格属性约简的研究,给出了绝对必要属性、相对必要属性和绝对不必要属性的判定定理,在此基础上给了直接从对象集求约简属性的快速算法.  相似文献   

17.
提出了基于粗集理论的煤矿瓦斯预测专家系统知识获取方法.该方法首先建立瓦斯数据与瓦斯突出强度之间关系的预测样本集;然后运用粗糙集的连续属性离散化、属性约简以及规则提取算法,从大量的预测样本集中自动获取预测知识,并将预测知识存储于专家系统知识库中;最后基于推理机,实现煤矿瓦斯突出的实时预测.实例分析表明,粗糙集方法在煤矿瓦斯突出预测专家系统知识获取中的有效性和实用性.  相似文献   

18.
偏序结构图因其良好的知识可视化特性已在知识发现、数据挖掘等领域得以广泛应用.但在对大数据所形成的超大形式背景进行研究和分析时,偏序结构树形图存在的一些不足,使大数据可视化效果欠佳,不利于对大数据进行数据挖掘和知识发现.本文对偏序结构树形图进行改进,提出了可用于大数据分析的偏序结构环形图.对实例形式背景绘制出偏序结构环形图,并与其偏序结构树形图比较.实验结果表明,该方法清晰、直观,可视化效果较好,能更有效地呈现出大形式背景中的重要信息,可以应用在大数据的数据挖掘和知识发现中.  相似文献   

19.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

20.
区间集是解决部分已知概念、近似不可定义或复杂概念的研究工具。概念格是机器学习、数据挖掘、知识发现和信息检索等领域的一种很有效的数据分析工具。区间集概念格是这两种方法的结合,是对于部分已知概念或不可定义概念信息系统进行机器学习、数据挖掘、知识发现和信息检索的一种有效的数据分析工具。区间集属性约简是揭示区间集概念格本质特征的一种方法。本文揭示了区间集属性约简的组成与结构:两个区间集相对必要属性不能在同一个区间集属性约简中出现;区间集约简与任何一个区间集相对必要属性等价类的交都不空;核心属性和每个区间集相对必要属性等价类中取一个属性组成的集合一定是区间集属性约简。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号