首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
知识发现中缺损数据的处理(Ⅱ)   总被引:1,自引:1,他引:0  
研究了在知识发现过程中处理连续取值属性值缺损的问题,提出了进行连续值划分的“超长方体”划分法,在此基础上,通过发现值缺损属性的取值集合,值缺损属性是否为强作用属性以及与其它属性是否相关,解决了对含有缺陷数据的信息源进行知识发现的问题,文中通过处理UCI机器学习数据库中的COIL数据库,说明了本方法是可行的。  相似文献   

2.
知识发现中缺损数据的处理(I)   总被引:3,自引:2,他引:1  
研究了如何在知识发现中处理属性值缺损的问题,通过发现值缺损属性的取值集合,值缺损属性是否为强作用属性以及与其他属性是否相关。不仅解决了对含有缺损数据信息源进行知识发现的问题,同时也说明了对缺损数据处理的意义。  相似文献   

3.
讨论了利用领域知识,如完整性约束,分级概念等,对原数据库进行重新处理并且给那些丢失或明显背离常规的属性确定一个取值区间。实验证明利用这种基于属性的知识发现方法处理缺损数据是很有效的。  相似文献   

4.
知识发现过程中连续属性离散化方法研究   总被引:8,自引:0,他引:8  
在综合分析知识发现过程中连续属性离散化方法的基础上,提出了一种基于全局聚类分析来处理连续属性离散化问题的方法。实例验证结果表明该方法对知识发现过程中连续属性离散化的划分更为合理。  相似文献   

5.
介绍了在数据库知识发现(KDD)中将连续属性离散化的一些方法,并提出使用值差分度量离散化的算法.值差分度量算法原本是用于计算离散属性值间的距离,但实际上将这种方法反过来用于连续属性的离散化也可以有相当好的效果.将其与传统的使用统计量χ2的离散化算法作了比较.  相似文献   

6.
目的 讨论连续值决策表的一种属性约简方法.方法 连续值决策表是一种常见的根据实际应用抽象所得的数据库.本文通过对连续值决策表进行预处理--离散化,把它们转化为有序决策表,然后以r度量作为度量标准对转化后所得的有序决策表进行属性约简.结果 与结论可以证明该方法可对连续值决策表有效的进行属性约简,使此类决策表的规则表示简单直观.  相似文献   

7.
简要介绍了粗糙集连续属性的一种量化算法—基于VDM (ValueDifferenceMetric)度量的划分法 ,并用该算法对实验数据为取自UCI机器学习数据库中心的数据集Iris进行量化 ,再对量化后的属性领域进行灵敏度分析  相似文献   

8.
概念学习中连续值型属性的离散化   总被引:1,自引:0,他引:1  
在概念学习中,属性不仅可以为离散值型,还可以为连续值型,因此,连续值型属性的离散化问题是概念学习中的一个重要问题,本给出了基于假设检验的离散化方法的理论依据,并依此提出了一种离散化算法Discrete,实验结果表明,这种方法一有得到较合理的区间划分。  相似文献   

9.
应用经典粗糙集理论处理连续值属性决策表问题时,对连续值属性进行离散化会造成信息损失.本文在分析已有相似度不足的基础上提出一种改进的相似度,建立基于改进相似度的扩展粗糙集模型,并提出一种基于重要度的约简算法.  相似文献   

10.
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C 编写的算法进行数值示例及测试数据库。实验结果表明此算法有效可行。  相似文献   

11.
在用粗糙集理论解决连续系统的问题时,要求信息表必须是离散值.在对由连续量构成的信息表离散化时,首先要对决策属性的值域进行离散化。文中针对这一问题提出了3种确定离散化区间的方法,即经验分割法、等频分割法和等距分割法;又提出了2种求区间离散值的算法,即区间重心法和区间值平均法,并通过算例验证这些算法均是可行的,其中等距分割法中的区间值平均法效果最为满意。  相似文献   

12.
为了提高分类的精确度,提出一种基于粗糙集理论的增强学习型分类器。采用分割算法对训练数据集中连续的属性进行离散处理;利用粗糙集理论获取约简集,从中选择一个能提供最高分类精确度的约简。对于不同的测试数据,由于离散属性值的变化,相同的约简可能达不到最高的分类精确度。为克服此问题,改进了Q学习算法,使其全面系统地解决离散化和特征选择问题,因此不同的属性可以学习到最佳的分割值,使相应的约简产生最大分类精确度。实验结果表明.该分类器能达到98%的精确度.与其它分类器相比.表现出较好的性能。  相似文献   

13.
不确定性多属性决策的一种线性规划方法   总被引:12,自引:1,他引:11  
针对具有不确定性区间数的多属性决策问题,提出了一个线性规划方法,该方法与Bryson和Mobolurin给出的线性规划方法相比,能够保证计算出来的每个方案综合评价值所在的区间均使用了一个属性权重向量。对于这个结果,进行相应的决策方案排序才显得更有实际意义。  相似文献   

14.
研究了属性权重和属性值均以区间数形式给出的不确定多属性决策问题.针对此类区间型多属性决策问题,定义了方案的综合属性正理想值、综合属性负理想值和带风险度的综合属性值;依据决策者对风险的态度,给出了方案满意度函数;提出了基于方案满意度的单目标优化模型;最后应用该模型解决了投资方案的选择问题.  相似文献   

15.
使用属性文法设计了研究生教育评价系统,非终结符表示一级和二级评价指标,终结符表示输入的数据,文法符号的属性表示相应数据的值,并设计语义规则实现了对这些属性的加工处理,完成了对某一单位研究生培养的评价.该设计方法不仅节省内存空间,而且提高了系统的灵活性.  相似文献   

16.
一致完备决策系统中属性重要性定义的改进   总被引:3,自引:3,他引:0  
在一致完备决策表中利用代数(信息熵)定义比较属性之间的重要性时往往会得到一些与实际不相吻合的结论,这种问题产生的主要根源是其定义本身的不完善所造成的.该文从产生问题的根源出发,从约简的角度重新定义了决策表中的各个属性(属性子集)的重要性,同时还给出了体现2个不同属性之间相互关系的相关系数的定义.最后通过对2个不同的例子来说明新定义的重要性比代数(信息熵)定义更具有合理性.  相似文献   

17.
许多学习算法都存在这样一个偏置:属性集中的属性同等重要.然而,这种假设不一定实际.如果把属性集中的属性根据实际情况考虑为分别具有不同的重要性,那么由此获得的模型应该更合理,也有不少学者将此考入到算法中.文章将计算属性约简的问题转化为计算集合覆盖约简问题的思想,通过将描述用户需求或偏好的属性序纳入考虑,设计了基于用户需求的覆盖约简算法,并且对计算复杂性分析.最后运用实例验证了算法的可行性和有效性.  相似文献   

18.
规则空间模型(RSM)及属性层级方法(AHM)是有较大影响力的认知诊断模型.在RSM与AHM中不可缺少属性及属性层级关系,属性层级关系为属性间的先决关系所诱导.但是,先决关系只考虑了属性之间的关系,却忽略了属性集之间存在的联系.该研究以先决关系为切入点,实例证明先决关系及其诱导的属性层级关系具有局限性,基于属性集,提出更具一般性的蕴含关系,使先决关系为其特殊形式,为当前认知诊断理论研究提供了新的研究角度.  相似文献   

19.
An attribute-based ring signature scheme in lattice was proposed in this paper. In this signature scheme, an entity’s attributes correspond to the columns of a lattice matrix, and the signature was generated by using a subset of these attributes. The entities possessing these attributes form a ring. The scheme is computationally efficient than the schemes based on the integer factor problem and discrete logarithm problem, furthermore it is still secure in quantum computing environment.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号