首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 265 毫秒
1.
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C 编写的算法进行数值示例及测试数据库。实验结果表明此算法有效可行。  相似文献   

2.
针对粗糙集理论中属性约简问题,提出了一种基于扫描向量的属性约简方法.根据粗糙集理论知识,定义了一个新概念--差别向量,利用差别向量将信息表转换成差别向量组;根据差别向量的结构特征,定义了差别向量加法法则;运用这个加法法则仅需对差别向量组扫描一次,就可以形成结构简洁却能代表原信息表属性特征的扫描向量.以扫描向量中的属性频率项作为属性约简搜索的启发信息,提高了属性约简效率.数值实例及数据库测试的结果表明该属性约简算法是有效可行的.  相似文献   

3.
针对客户市场细分问题进行了研究。依据粗糙集理论,以信息表中条件属性与决策属性的一致性原理为基础,以超立方体、扫描向量为数据计算对象,进行数据离散化和连续型属性约简,实现了数据预处理;在此基础上,以集合差异度指标为约束条件,运用集合特征向量加法法则最终实现客户市场细分。在实验中,连续属性离散化和冗余属性约简有效地减少了计算数据,便于客户市场细分的实现,提高了客户市场细分的效果。研究结果表明该客户市场细分算法是有效可行的。  相似文献   

4.
基于扩展可辨识矩阵的混合决策系统属性约简   总被引:1,自引:1,他引:0  
经典粗糙集理论的研究对象只能是完备的离散决策系统。为了直接对不完备混合决策系统进行属性约简,因此通过引入邻域关系和限制容差关系的概念对可辨识矩阵的定义进行了扩展,提出了一种基于扩展可辨识矩阵的属性约简算法;该算法可以兼容处理完备与不完备混合决策系统。通过UCI数据集的仿真实验证明了该算法的有效性,最后讨论了扩展可辨识矩阵中的邻域阈值选择对属性约简结果的影响。  相似文献   

5.
李金艳  余忠华 《科学技术与工程》2023,23(35):15117-15123
诊断决策过程本质上为信息的处理过程。由于信息结构的复杂性和采集的局限性使得获取的信息存在缺失、模糊、冗余等不完备现象,从而影响诊断的准确性。为此,对条件属性冗余、部分数据值缺失情形下,如何提高被诊断信息的完备性开展讨论,试图通过问题聚类探寻诊断决策所需的隐含规则,提出信息补齐与属性约简的知识挖掘方法:首先,针对Roustida算法在缺失值处理时存在的局限性进行改进,扩充其在工程实践中的适用范围,使缺损信息趋于完整;然后,利用遗传算法和广义诊断规则推理实现条件属性约简和规则凝练;最后,以质量问题诊断为对象进行了案例研究,测试样本诊断结果覆盖度 ,验证了不完备信息条件下该方法可以实现以相对较简方式表达问题与情境信息之间的关联关系,挖掘问题发生的隐含规律。  相似文献   

6.
针对信息表中的规则提取问题,应用粗糙集理论对其中的属性约简、属性值问题进行了研究,提出了一种基于可辨识向量的规则提取方法。根据粗糙集中的不可分辨关系建立了可辨识向量,利用可辨识向量的加法法则运算只需要对信息表扫描一次,就可以得到信息表的核属性集以及信息表的一个属性约简。在此基础上,利用条件属性与决策属性之间的对应关系,对信息表中的每条规则通过删除冗余属性值完成信息表的属性值约简,最终实现规则提取。数值实例和试验表明本算法是有效可行的。  相似文献   

7.
区分矩阵是属性约简的一种有效方法.针对不完备的决策系统,定义了区分矩阵的概念,给出了区分矩阵构造方法,并根据区分矩阵稀疏性的特点,定义了区分向量的概念,在此基础上,给出了一种基于区分向量的不完备决策系统属性约简算法.最后,采用恒星光谱数据,实验验证了该算法的有效性.  相似文献   

8.
基于信息熵的不完备信息系统属性约简算法   总被引:11,自引:0,他引:11  
在现实生活中信息的不完备现象广泛存在,等价关系不一定成立,限制了经典Rough集理论在一些实际问题中的应用.从信息论角度出发引入信息熵的概念,提出了不完备信息系统中知识熵的度量方法,定义了信息观下不完备信息系统知识约简的方法,分析并讨论了与现有其他约简定义的关系,给出了一种基于信息熵的不完备信息系统属性约简算法,通过仿真实验说明了该算法对于不完备信息表知识约简是可行的.  相似文献   

9.
连续量决策信息表的离散化问题研究   总被引:1,自引:0,他引:1  
在粗糙集理论中,知识是以表格的形式表达的.当用粗糙集算法从连续量决策信息表中提取规则时,首先要对其进行离散化处理.针对连续量决策信息表离散化过程中存在的问题,本文中提出了2个定理并进行了证明.定理表明:在考虑决策信息表中属性值之间不可分关系的条件下,若决策信息表的值发生变化,则离散化结果必然发生变化.所以由单一样本构成的连续量决策信息表所得到的离散化结果不能用于实际的连续量系统中.  相似文献   

10.
针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.  相似文献   

11.
具有连续属性的不完备信息系统Rough集扩展   总被引:1,自引:0,他引:1  
在模糊相似关系的基础上,针对具有连续属性的不完备信息系统提出了Rough集的扩展模型;利用模糊区间数来表示不完备信息表中缺失的连续属性值,并根据属性值的概率分布情况计算模糊区间数的可能度,在模糊关系的基础上给出了不完备信息表的上近似和下近似的定义;利用基于欧氏距离的贴近度法计算模糊相似度,构造相似矩阵,实现了对论域的划分;给出决策规则的约简和表示方法,应用实例说明了所提出的Rough集模型及规则的实用性。  相似文献   

12.
鉴于已有的绝大多数选择性分类算法主要用于完整数据,而现实中的数据通常是不完整的并且包含许多冗余属性或无关属性,本文在已有工作基础上利用信息增益率构建了一种用于不完整数据的混合型的选择性贝叶斯分类器:GBSD.在12个标准的不完整数据集上的实验结果表明,GBSD不仅能大幅度减少属性数目,而且比已有工作更能有效改善分类准确率和效率.  相似文献   

13.
粗糙集理论在通侦信息融合中的应用   总被引:5,自引:0,他引:5       下载免费PDF全文
信息融合技术的研究对现代通侦信息系统非常重要。作为一种软计算方法,粗糙集理论能有效地分析和处理不精确,不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。提出了基于粗糙集理论的通侦信息融合方法,结果显示了该方法的有效性。  相似文献   

14.
针对原始信息系统往往存在大量重复样本和冗余属性,从而影响实际故障诊断的精度和速度这一问题,介绍了一种基于粗糙集和决策树C4.5算法相融合的故障诊断模型,用于设备的精确和快速故障诊断.利用粗糙集具有较强的处理不确定和不完备信息的能力,对原始样本集进行离散化及约简处理;同时,利用决策树C4.5算法对约简后的决策表进行快速学习并形成树状故障分类器.以实例介绍了利用该模型进行故障诊断的完整过程.  相似文献   

15.
为了获取连续值域信息系统的决策规则,本文突出了一种新的方涛,这种新的方法无需对连续值域信息系统进行离散化,因此减少了由于离散化预处理所丢失的信息.通过对文中允许误差的系统对规则获取效率的影响的讨论,可以发现,在实际应用中新的方法比传统的方法更有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号