首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
一种基于粗糙集的文本分类规则抽取方法   总被引:10,自引:0,他引:10  
随着文本数据库的日益增大,寻找新的文本数据处理方法变得十分紧迫。本文将粗糙集理论应用于文本自动分类的规则提取,提出了基于粗糙集理论的文本分类方法。把文本特征项的权值进行离散化处理后,作为规则的条件属性,文本所属的类别用作决策属性,构造决策表,然后通过决策表的知识约简算法提取出文本的分类规则。实验结果表明,该方法提取规则的分类正确率较高,分类速度较快。  相似文献   

2.
从理论上研究了决策表中决策值细化程度与信息粒度、近似分类的精度及近似分类质量之间的关系,结果表明,决策属性的属性值划分得越细,则该属性的信息粒度、近似分类精度和近似分类质量的值就越小.仿真实验同时证明,在基于决策属性划分之下,对任意一个条件属性集经决策细化后的决策表所对应的信息粒度、近似分类精度和近似分类质量的值,都不大于决策细化前决策表所对应的信息粒度、近似分类精度和近似分类质量的值,这个结果对研究决策表属性约简和决策规则的有效性等问题都有指导作用.  相似文献   

3.
针对多标记决策分类中的粒度选择问题,提出了基于决策表的全局最优粒度选择方法和基于对象的局部最优粒度选择方法.首先基于多个粒度层次分析了多标记决策表的粒度划分,引入了多粒度多标记决策表的粒化粗糙度度量方法;然后针对协调决策表和不协调决策表讨论了通用的决策表最优粒度选择方法;最后,针对全局最优粒度选择不能使每个对象都达到最优粒度的局限性,以及不协调决策表中有些对象关于决策标记分类的不确定性问题,讨论了对象的局部最优粒度选择方法,并结合实例验证了该方法的有效性.  相似文献   

4.
系统系统约简是个重要的课题,借鉴粗糙隶属度,最小分类规则及关产规则可信度等概念,推广了粗集理论中知识的核与简化的概念,使之能更好地描述决策表的属性约简,还从理论上研究了信息表数据浓缩与决策表数据浓缩的关系。  相似文献   

5.
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法. 首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类. 这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点. 试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本.  相似文献   

6.
通过对偏序拟阵的偏序集性质和广义拟阵通的偏序集性质的分别研究,得到了偏序集拟阵和广义拟阵二的关系,即每个偏序集拟阵均为广义拟阵,但反之不然。又利用这种关系得出拟阵中的贪心算法能够推广到偏序集拟阵进而组合格式中,并阐述了利用这种关系对于研究偏序集拟阵理论和广义拟阵理论的一些其他作用。  相似文献   

7.
本文介绍了关系及关系矩阵等概念,并着重讨论了偏序关系及对应的偏序范畴、偏序矩阵,刻划了偏序范畴的始对象、终对象和零对象,偏序范畴的积范畴以及给出相应的矩阵的关系,即积范畴对应的偏序矩阵是原来两个偏序矩阵的张量积;讨论了等价的偏序范畴对应的偏序集之间的关系.  相似文献   

8.
说明决策表和知识库之间的关系,详细介绍了作者开发的基于决策表的知识库验证工具KBV。给出了在KBV中检查冗余,矛盾,循环,守完备性的算法。KBV能对包含特定规则,通用规则和框架的知识库进行验证。由于考虑了各子决策表之间的逻辑关系,KBV得到的结果是全局的。  相似文献   

9.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。  相似文献   

10.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

11.
粒度约简是多粒度粗糙集研究的一个关键问题。为了从乐观多粒度粗糙集的角度研究粒度约简问题,消除冗余数据,提高粒度约简的效率,提出基于压缩决策表的乐观多粒度粗糙集粒度约简算法。针对乐观多粒度粗糙集模型,引入下近似分布粒度约简的概念;利用线性时间排序算法进行等价类划分,为决策表的压缩和下近似集的计算打下基础;以冗余的决策表为研究对象,以核粒度为初始粒度约简集,以粒度重要性为启发式信息,运用粒度约简算法进行粒度约简,并通过实例分析和实验验证了该算法的有效性。结果表明,算法降低了计算下近似集的时间复杂度,具有较高的粒度约简效率。  相似文献   

12.
序贯三支决策模型作为一种能够有效处理不确定性信息的数据挖掘方法,采用了渐进的思维进行决策。然而,边界域可能存在部分不确定性较大的等价类,即便添加属性也无法准确划分,导致决策的分类精度降低,同时延迟代价较高。因此,通过条件概率来刻画等价类的不确定性,基于阴影集理论筛选不确定性较大的等价类,并对其采取跳阶延迟处理的方法,提出了基于不确定性的跳阶序贯三支决策模型。实验结果表明,所提模型与经典序贯三支决策模型相比,在分类性能上具有更好的有效性。  相似文献   

13.
对Rough集的属性约简进行分析,特别针对不一致决策表,提出一种新的约简算法。算法通过等价类消除决策表不一致性,然后利用传统算法进行约简,并用实例证明算法可行性。  相似文献   

14.
置换群与群决策的排序数估计   总被引:1,自引:0,他引:1  
在决策方案优劣等级排序分析和多层序等价类划分的基础上,构造了等级排序置换群,并提出了群决策中序位相同的可能排序数的解析和递推估计式.分析结果显示,注重维护决策方案的齐次性和协调决策者的意见冲突是提高群偏好集结有效性的重要方法.  相似文献   

15.
粗糙集理论中决策表属性约简的信息表示   总被引:7,自引:2,他引:5  
主要讨论了决策表属性约简和信息熵之间的关系,证明了对于一致决策表,其属性约简在代数表示和该文给出的信息表示下是等价的,并举例说明,对于不一致决策表,其属性的约简不能用信息熵来等价表示。  相似文献   

16.
基于云模型的连续属性决策表简化算法   总被引:1,自引:0,他引:1  
从降低样本数据模糊性及随机性角度出发,提出了一种基于云模型的连续属性决策表简化算法.该算法通过对决策表的转换,建立云相似度概念来刻画样本间等价关系,并采用改进的动态聚类方法自动获取相似样本,完成对样本的较粗粒度表示.实验结果表明,简化决策表在不到原规模十分之一的条件下,取得了大致相当的识别率,从而大幅降低粗集知识获取时间.  相似文献   

17.
使用粗糙集中的等价关系来刻画粒度,粗糙集结合粒度计算方法,给出信息决策表的粒度表示,并将信息决策表中的属性重要度值作为启发信息,在相对约简的个数组合上进行Tabu搜索。此方法可避免无用的属性入选,有效去除可省属性及缩减搜索空间,提高了算法的高效性。  相似文献   

18.
研究了保序且保等价部分变换半群上的自然偏序关系.首先给出了保序且保等价部分变换半群上的自然偏序关系的定义.利用自然偏序关系定义,考察了此半群中两个元素何时关于此自然偏序关系是相关的,并探讨了关于此偏序关系左(右)相容的元素,所得结果推广了保序且保等价变换半群上的自然偏序关系.  相似文献   

19.
设x是一个全序集,E是x上的一个凸等价关系,在已有的保等价部分变换半群的基础上,引入保等价部分变换半群的一类子半群保序且保等价部分变换半群。在这类半群中规定新的运算,得出一类新的半群,称为保序且保等价部分变换半群的变种半群,利用定义,描述了这类半群上的格林关系。  相似文献   

20.
利用理想计算机URM关于能行可计算性函数的定义以及渐进分析的方法对能行可计算性函数进行分类后,建立了能行可计算性函数渐进优超等价类子结构,并通过引进可达性概念研究能行可计算性函数渐进优超等价类之间的关系,证明了任何一致无界能行可计算性函数渐进优超等价类都具有强不可达性质。此成果对算法复杂性函数渐进优超等价类数学结构的进一步研究有一定参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号