首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
将粗糙集和粒计算理论应用于中文文章相似度计算研究中,通过引入文章相容粒、段落相容粒和段落粒空间信息表等概念构建相容粒计算模型,提出基于相容粒计算模型的中文文章相似度的计算算法。示例和测试结果说明所提出方法有效。  相似文献   

2.
针对不完备决策系统的规则提取问题,提出一种基于极大团的不完备系统规则获取方法.引入图中极大团概念定义相容块构造范式,将其等价转换为极小析取范式后得到不完备系统全体极大相容块,收集每一相容块最全描述即可生成极大相容块最全描述系统,进而为最全描述系统中的每一对象构造决策分辨范式得到与该对象对应的全体可信关联规则.该方法具有2个特点:针对系统中每一基本信息粒自动生成基准置信参数,避免了预设固定参数而遗漏置信度小于此参数的部分有用规则;将决策分辨范式等价变换为其极小析取范式,避免了采用特定顺序选择属性而遗漏部分有用规则.将该算法应用于某保险公司私家车客户车险数据和UCI不完备数据集,实验结果与数据分析说明了该算法的分类预测性能.  相似文献   

3.
基于概念格的求所有绝对属性约简的一个算法   总被引:7,自引:0,他引:7       下载免费PDF全文
根据概念格的Hasse图与粗糙集中属性集导出的不可分辨 (等价 )关系之间存在的对应关系 ,提出了一种基于概念格的计算信息表中所有绝对约简的算法 ,并通过理论分析和实例计算验证其正确性和有效性 .  相似文献   

4.
顿毅杰  张永 《甘肃科技》2005,21(6):80-81
决策规则是关联规则、决策树和粗糙集等方法挖掘的主要对象。提出了一种基于属性值重要性的挖掘决策规则的新方法,该算法将属性值重要性看成是可以分辨的元组对数,从其构造的决策树中得到的规则与ID3算法产生的规则是等价的,但该方法计算复杂度低。  相似文献   

5.
本文在研究粗糙集、决策树与粒计算的基础上,结合Hash算法快速、高效的特点,提出了一种基于Hash的快速值约简方法.该方法在处理信息系统过程中,能够快速划分等价类,并计算出正区域;在基于粗糙集理论针对每一个属性进行属性约简和值约简的过程中,利用Hash方法能够对数据压缩的特点,实现快速高效的规则提取.通过仿真实验显示,...  相似文献   

6.
针对现有不完备决策表属性约简算法复杂度较高的问题,提出了基于属性分辨度的属性约简算法.文中分析了不完备决策表中条件属性相对于决策重要性的外在表现,提出了属性分辨度的概念,并给出了属性分辨度随着约简属性集的变化而动态更新的计算方法.该算法在属性约简过程中会不断删除已经属于正域的对象或不影响正域计算的相容块,通过降低样本数据的规模来减少计算耗时,加速属性约简.理论分析和仿真实验表明,文中算法是有效的,并且算法复杂度优于现有的不完备决策表属性约简算法.  相似文献   

7.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

8.
Skowron分辨矩阵是代数观点属性约简模型的一种演化,其本质在于保持系统中非冲突对象与其他对象的可分辨关系不变,不能刻画常见的非代数观点属性约简准则.属性约简准则的本质体现为保持决策信息系统的某种特定可分辨特性不发生变化,决策信息系统具有多方面可分辨特性,单一属性约简准则仅能刻画其中某一特性.为将不同的属性约简准则运用统一的分辨矩阵形式加以描述,在定义条件等价类的决策向量基础上,构建了决策向量简化决策系统,进而设计满足不同属性约简准则的分辨矩阵及分辨函数,给出其与对应准则属性约简模型的等价性证明,推理证明与仿真实例说明了该方法的可行性与有效性.  相似文献   

9.
不完备信息系统的粗集扩展模型   总被引:1,自引:0,他引:1  
经典粗集理论以等价关系为基础,它们在处理不完备信息系统的时候存在一定的局限性.作者首先从扩展粗集理论适应范围的角度出发,引入信息系统对象的先验概率,结合量化相容关系的思想,提出基于先验概率的相容关系模型,然后以该模型为基础研究了不完备信息系统的属性约简,通过严格的数学证明,得到基于分辨矩阵的属性约简算法.最后通过一个实例验证了该改进相容关系模型及其基于分辨矩阵的约简算法.表1,参20.  相似文献   

10.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

11.
针对决策信息系统属性约简问题,根据粒矩阵运算简便直观的特点,提出了粒关系包含度矩阵概念,然后将粒包含度矩阵中隐含的信息作为启发式算子,设计了一种相容决策信息系统属性约简算法.最后,通过实例验证了该算法的有效性.  相似文献   

12.
蔡贺  张睿 《甘肃科技》2011,(14):31-33,8
从分析ID3决策树算法及解析入手,引入属性样本结构相似度概念,构建了样本结构相似度模型,并以该模型和属性的信息增益共同作为决策树内部结点的选择标准。改进SS_ID3决策树算法,着眼于决策树非叶结点的选择标准的优化,继承了原始ID3决策树算法的优点,并在多值偏向性的修正、决策树的大小控制及分类预测性能等方面取得了积极的改进。  相似文献   

13.
传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率,克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.  相似文献   

14.
用信息向量表示信息表知识表达系统中的埘象,基于同一思想用算法描述了Rough集中的等价类、不可分辨关系、上下近似集、属性约简、相对属性约简等概念。  相似文献   

15.
介绍了决策树算法的基本原理,指出在决策树构建的过程中,ID3(Interative Dichotomic Version3)算法按照信息增益最大的原则选取属性,公式比较复杂,相应计算的复杂度也比较高,耗费较多的硬件资源.相对于ID3算法而言,条件概率决策树算法按照条件概率最大的原则选取属性,条件概率能够把属性和类别联系在一起,公式比较简单,有效地降低了计算的复杂性,并且决策树的建立提高了系统的精确度和检测速度.  相似文献   

16.
ID3算法的改进和简化   总被引:2,自引:0,他引:2  
针对ID3算法倾向于选择取值较多的属性的缺点,引进属性重要性来改进ID3算法,并根据改进的ID3算法中信息增益的计算特点,利用凸函数的性质来简化该算法.实验表明,优化的ID3算法与原ID3算法相比,在构造决策树时具有较高的准确率和更快的计算速度,并且构造的决策树还具有较少的平均叶子数.  相似文献   

17.
为获取高效算法,结合Rough集和粒计算理论,基于知识颗粒设计出获取等价类的算法及计算正区域的等价算法,使用动态SQL语句直接获取已排序的对象集,省略类似算法必需的排序算法,降低了实现的复杂度.给出一种增量式的属性约简算法,设计5种选择属性的新启发策略供算法使用,可避免无用属性入选,更有效去除可省属性及缩减搜索窄间等,确保约简算法的完备性,简化了中间步骤,从而保证算法的高效性.理论分析及实验结果表明:采用该约简算法的时间复杂度和实际求解时间均比采用现有算法的时间复杂度和实际求解时间低,并能更好地适应海量数据集的挖掘.  相似文献   

18.
分辨矩阵为属性约简与求核运算提供了一种规范精确的数学模型,通过分辨矩阵模型可方便地获取决策系统全体属性约简.本文基于分辨矩阵运用启发式信息与二分策略扩展结点,设计了一种构造约简树求取全体属性约简的有效算法,该约简树从根结点到叶结点全体路径构成的析取范式与系统分辨函数等价,其极小析取范式所有析取项即为决策系统全体属性约简.该方法适用于满足任意约简准则的分辨矩阵,能够显著地减少搜索空间和保证全体约简求解的完备性,理论分析与实验结果说明了算法的可行性与有效性.  相似文献   

19.
针对ID3决策树生成法中存在的缺点,通过引用属性关联度和代价敏感学习,提出了一种基于属性关联度和代价敏感学习的决策树生成法。该方法利用粗糙集理论对条件属性进行约减,在构建决策树过程中,把属性的关联程度和性价比作为选择分裂结点的依据,利用改进的信息增益方法构建代价敏感决策树。试验结果表明,该方法在分类准确度和生结点总数量上比常用决策树生成方法优越。  相似文献   

20.
介绍了基于粒计算的二进制信息粒矩阵,给出了粒计算粒度的概念、粒的关联度运算、关联粒度矩阵和条件属性重要度等几个基于二进制信息粒计算的基本定义,并基于上述定义提出一种新的基于粒计算的决策树分支和剪枝算法在气象预报中的应用,实例结果证明了所提出的算法是有效和可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号