共查询到19条相似文献,搜索用时 85 毫秒
1.
43(2000)01-0007-04摘要:根据信息表中相对每个条件属性的集合和划分的粗糙逼近精度,给出衡量属性重要性程度的一种准则.在此基础上,提出了信息表属性约简的一个较为简单有效的算法. 相似文献
2.
利用单属性的逼近精度 ,在Jelonek属性约简算法的基础上 ,得到一个改进的属性约简算法 .实例计算结果表明 ,在获得同样的属性约简的情况下 ,该算法与Jelonek算法相比 ,计算量较少 ,提高了计算速度 . 相似文献
3.
叶东毅 《福州大学学报(自然科学版)》2004,32(4):448-450
研究信息表绝对属性约简与相对属性约简之间的关系,指出一个绝对属性约简通常只是包含而不一定会是相对属性约简,同时给出相对属性约简不是绝对属性约简的一个充分条件.此外还阐述了绝对属性约简与属性依赖性之间的关系. 相似文献
4.
5.
黄丽萍 《太原师范学院学报(自然科学版)》2009,8(3):46-49,56
鉴于现有属性约简算法大多是针对一致决策表不适合对不一致决策表的求解,且运行效率底.文章提出了一种新的决策表属性约简算法.首先判断决策表是否为一致决策表 如果是不一致决策表,则通过最大相对概率分布将其转换为一致决策表; 然后基于一致决策表的相对概率分布满足单点分布的性质来快速确定属性是否为冗余属性,从而求出约简; 并通过MATLAB和UCI学习数据库验证了该算法的有效性和高效性. 相似文献
6.
从相对核的角度,提出了一种新的属性约简方法.首先,求出条件属性相对决策属性的相对正域,然后根据相对正域求得属性的相对核.用这些相对核属性对论域进行划分,在对论域划分后,将可以完全正确的分类删除,减小论域,如此迭代下去,直到论域完全划分,最后求出这些核属性并集,去除并集的冗余信息,即可得到属性约简集.该方法可直接利用核属性来对论域进行划分,不用再计算每个属性的重要度,减少了计算量,在每次迭代的过程中,减小论域,缩减搜索空间,降低了时间复杂度. 相似文献
7.
经典粗糙集的前向启发式正域约简算法没有考虑到存在多个重要度最大的条件属性时如何合理地去选择候选属性;同时在度量条件属性间相关性时忽略了决策属性的影响程度,由此得到的约简集合泛化能力较弱.针对这些问题,首先引入信息粒度,提出一种候选属性选择的优化策略;其次引入信息论中交互信息的概念,通过计算属性之间的交互信息来剔除冗余属... 相似文献
8.
9.
将单个属性按照B精度的均值和方差决定的属性重要性,从大到小依次加入到约简属性中.对重要性相等的属性,再计算划分的B精度来决定加入哪些属性,直到满足约简条件为止.与不用属性重要性的算法相比,计算量较少,提高了计算速度. 相似文献
10.
沈晨鸣 《南京工程学院学报(自然科学版)》2007,5(1):30-34
粗糙集理论是一种研究不完整、不确定知识处理的数学工具,属性约简是粗糙集理论的核心内容之一.阐述了粗糙集理论的基本思想,给出了一种启发式的最小约简算法,通过一个实例,分析说明算法的可行性和有效性. 相似文献
11.
针对粗糙集理论中属性约简问题,提出了一种基于扫描向量的属性约简方法.根据粗糙集理论知识,定义了一个新概念--差别向量,利用差别向量将信息表转换成差别向量组;根据差别向量的结构特征,定义了差别向量加法法则;运用这个加法法则仅需对差别向量组扫描一次,就可以形成结构简洁却能代表原信息表属性特征的扫描向量.以扫描向量中的属性频率项作为属性约简搜索的启发信息,提高了属性约简效率.数值实例及数据库测试的结果表明该属性约简算法是有效可行的. 相似文献
12.
一种基于互信息的粗糙集知识约简算法 总被引:2,自引:0,他引:2
针对粗糙集理论核心内容之一的知识约简问题,该文提出了一种改进的互信息的属性约简算法。该算法结合信息论中信息熵与互信息的概念定义了粗糙集里的一种新的属性重要度,并以此属性重要度为启发式信息进行属性约简。实验分析表明:在大多数情况下,该种算法都能够得到决策表的最小约简。 相似文献
13.
一种改进的Rough集属性约简启发式遗传算法 总被引:4,自引:0,他引:4
属性约简是知识发现中的关键问题之一 .为了能够有效地获取决策表中属性最小相对约简 ,提出了一种在优化初始群体基础上提高算法性能的启发式遗传算法 .首先 ,通过构造一个新的算子 ,将信息论角度定义的属性重要性度量作为启发式信息 ,来描述所选择的属性子集对论域中确定分类子集的影响 ;接着 ,以此为基础并结合遗传算法 ,选择一些经过优化的染色体作为初始群体 ,在加强局部搜索能力的同时保持了该算法全局寻优的特性 .最后 ,从理论上对算法做了分析 ,证明了新算子所选择的属性子集对原有属性分类能力保持不变 .试验分析表明 ,该算法能有效地对决策表属性进行约简 相似文献
14.
一种不完备信息表的预处理方法 总被引:1,自引:0,他引:1
针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究. 应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化. 数值示例和实验结果显示此方法是有效可行的. 相似文献
15.
属性约简是粗糙集理论研究的核心内容之一.为此,在提出了最近精确集概念的基础上,研究了决策表属性约简方法一最近近似约简.数值例子表明,该方法简单有效. 相似文献
16.
一种新的基于决策熵的决策表约简方法 总被引:2,自引:0,他引:2
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足.以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法.理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简. 相似文献
17.
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足。以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法。理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简。 相似文献
18.
基于云模型的连续属性决策表简化算法 总被引:1,自引:0,他引:1
从降低样本数据模糊性及随机性角度出发,提出了一种基于云模型的连续属性决策表简化算法.该算法通过对决策表的转换,建立云相似度概念来刻画样本间等价关系,并采用改进的动态聚类方法自动获取相似样本,完成对样本的较粗粒度表示.实验结果表明,简化决策表在不到原规模十分之一的条件下,取得了大致相当的识别率,从而大幅降低粗集知识获取时间. 相似文献
19.
模糊信息系统的代数结构及其约简 总被引:5,自引:0,他引:5
模糊粗糙集理论是一种处理不确定性信息的重要的数据挖掘方法。为了建立模糊信息系统的约简建立理论基础,该文首先利用三角范数及其余范数给出了模糊集合近似算子的一般形式,进而定义了上、下可定义模糊集合,证明了它们分别构成完全分配格,并对其结构进行了刻画。在此基础上定义了模糊信息系统及其约简,讨论了它与经典的信息系统的约简的关系,为进一步研究模糊信息系统及其约简理论奠定了基础,同时也丰富了模糊集理论。 相似文献