首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
从矩阵视角研究不完备信息系统的知识表示和属性约简.首先,引入关系矩阵,基于容差关系提出不完备决策信息系统协调性判定方法.其次,利用关系矩阵求正域,并提出属性协调集的矩阵判定定理,从而给出一种保持正域不变的约简的新方法.最后,基于上述框架,给出属性重要性度,进一步提出一种属性约简的启发式算法,并通过分析和实例证明该方法的有效性.  相似文献   

2.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高.  相似文献   

3.
针对现有不完备决策表属性约简算法复杂度较高的问题,提出了基于属性分辨度的属性约简算法.文中分析了不完备决策表中条件属性相对于决策重要性的外在表现,提出了属性分辨度的概念,并给出了属性分辨度随着约简属性集的变化而动态更新的计算方法.该算法在属性约简过程中会不断删除已经属于正域的对象或不影响正域计算的相容块,通过降低样本数据的规模来减少计算耗时,加速属性约简.理论分析和仿真实验表明,文中算法是有效的,并且算法复杂度优于现有的不完备决策表属性约简算法.  相似文献   

4.
基于粗糙集的属性约简算法研究   总被引:20,自引:1,他引:19  
提出一种新的基于粗糙集的属性约简算法.该算法采用层次结构和近似精度的概念,约简集中的属性选择从空集开始,用启发函数ξ作为选择条件属性的衡量标准,逐步加入相对于决策而言重要的条件属性,并采用下近似值作为剪枝依据,逐步删除给定论域U中根据该属性子集能完全正确分类的对象,减小了属性约简过程中的搜索空间,处理过程是递归的,直到给定论域U为空集,保证了在分类精度不变的情况下,获得简化的属性集,最后运用粗糙集中正域的概念,约简冗余的属性值并求出其最简规则.对UCI机器学习数据库中7个数据库属性约简结果证明了该算法的正确性和可行性.  相似文献   

5.
经典的粗糙集理论对直觉模糊目标信息系统不能直接进行知识约简.为此,首先在直觉模糊目标信息系统中引入优势关系,给出了基于优势关系的直觉模糊粗糙集定义;然后将经典粗糙集理论中的相对正域、属性依赖度以及属性重要性等概念推广至直觉模糊环境中,同时证明了直觉模糊目标信息系统的相对正域具有单调性的特征;结合属性的不同特征以及正域约简的定义给出了正域约简的判定定理,从而设计出以属性重要性为启发式信息的正域约简算法,并给出算法的复杂度分析;最后通过数据实验验证了算法的有效性.  相似文献   

6.
为获取连续属性数据集的最小属性子集,提出一种基于模糊粗糙集和人工蜂群算法的约简方法。首先由边缘蕴含算子和t-模给出集合的模糊粗糙近似,以下近似构建模糊粗糙正域,并据此确定决策属性对条件属性集的依赖度,然后通过依赖度和约简率构建能够反映属性集大小和重要性的目标函数,将属性约简问题转化为优化问题,最后以目标函数为迭代准则,利用人工蜂群优化算法完成数据集的属性约简。仿真结果表明:该方法在不降低分类正确率的同时,可以有效降低属性维数。  相似文献   

7.
基于邻域关系提出一种综合考虑正域和边界数据的属性约简方法.该方法利用邻域关系对数据进行离散化处理,通过定义基于邻域的正域属性重要度、边界属性重要度和邻域综合属性重要度概念,设计一种新的启发式属性简约算法.该算法从空约简集出发,利用邻域属性重要度启发式搜索属性空间以扩展约简属性集,理论分析和实验表明该算法有效可行.  相似文献   

8.
由于数据自身的不确定性和观测条件有限,现实问题中许多数据以区间值形式呈现。其中,优势关系下的区间值信息表研究对于多属性决策问题有重要意义。目前针对该系统的属性约简方法主要是辨识矩阵法或基于互信息的增量式约简,但前者计算效率较低,而后者没有利用到决策信息。文章探讨了条件熵作为不确定性度量在该系统下的性质,通过比较不同属性缺失时信息系统的条件熵变化,引入了属性重要度概念,基于此提出启发式属性约简算法。最后,通过对比实验验证了本算法具有低冗余的特点,在约简率上比基于粗糙熵和正域不变等序信息系统的启发式约简。  相似文献   

9.
基于互信息和疑义度相结合的知识约简方法   总被引:3,自引:0,他引:3  
提出一种基于互信息和疑义度相结合的知识约简方法,遵循修正的互信息准则,发展了一种类似于正交化特性的启发式算法,从决策系统中找出属性集的约简;该方法采用可增可删的双向回归算法,克服了目前前向选择或后向删除的知识约简方法中存在的属性相互依赖或依赖于决策类别的缺点,可保证分类精度不变的情况下,得到更为简化的决策属性集。最后,通过一个简单实例的仿真分析过程验证了文中所提方法的有效性。  相似文献   

10.
在混合决策系统中提出模糊效用三支决策模型和两种启发式算法。在模糊效用三支决策模型中提出正域分布保持属性约简算法,扩展了效用三支决策模型的属性约简算法研究。首先结合混合距离概念与高斯核模糊T-等价关系,构造相应的模糊条件概率,然后使用效用函数为不同决策类生成概率阈值划分论域,最后提出最大效用启发式属性约简算法和正域分布保持的启发式属性约简算法。  相似文献   

11.
现有的最优尺度选择算法有可能无法得到全局最优尺度组合,且具有较高的时间和空间复杂度。针对该问题,提出了不完备广义多尺度决策系统的逐步最优尺度选择算法。介绍了不完备广义多尺度决策系统,给出了上下近似集的性质;采取属性约简与尺度选择同步优化策略,以得到全局最优尺度组合;给出了一个快速的求相容类方法,并提出了不完备广义多尺度决策系统的逐步最优尺度组合选择算法,该算法显著降低了时间复杂度与空间复杂度。数值实验表明所提出的算法是有效的。  相似文献   

12.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

13.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

14.
特征选择是粗糙集理论在数据挖掘等领域中一种重要的应用,如何对动态变化的信息系统进行增量式特征选择是目前粗糙集理论研究的重点。在不完备混合型信息系统中,属性集的不断增加是信息系统动态变化的一种重要形式。首先在不完备混合型信息系统中引入邻域条件熵的概念,并且利用矩阵的方法去表示邻域条件熵;然后针对属性集动态增加的情形,提出矩阵形式的邻域条件熵增量式更新,并且基于这种增量式更新机制给出了相应的增量式特征选择算法;最后,UCI数据集的实验结果表明,所提出的增量式特征选择算法比非增量式特征选择算法具有更高的特征选择性能。  相似文献   

15.
针对肿瘤基因数据因维度高和冗余基因较多而导致分类精度低的问题,提出一种基于PCA和信息增益的肿瘤特征基因选择方法.该方法首先使用PCA算法剔除冗余基因,获得预选特征基因子集;然后利用信息增益算法对预选特征基因子集进行优化选取,得到特征基因子集;最后采用不同分类模型对特征基因子集进行仿真实验.实验结果表明,所提方法提高了基因表达谱的分类精度,从而表明致病基因被有效地选取出来.  相似文献   

16.
孤立性肺结节诊断模型中未得到充分解决的一个关键问题就是如何选择合适的特征子集。为了构建一个良好的诊断预测模型,提高肺结节良恶性诊断的效率以及准确率,提出了一种基于联合互信息的混合模型特征子集选择算法。该算法综合过滤式和包裹式特征选择模型各自的优势,首先使用过滤式方法得到与诊断有高相关度的候选特征子集,然后通过包裹式方法对候选特征子集进行特征间冗余分析,最后得到最优特征子集。实验表明,该算法与基于其他互信息的过滤式、混合模型特征选择方法相比,不仅在特征子集数目上,而且在良恶性诊断的敏感性、特异性和平均分类准确率上,均具有很好的性能效果。  相似文献   

17.
提出了一种由遗传算法和改进互信息公式相结合的特征选择方法.将遗传算法中的特征评价函数换为改进互信息公式来对特征进行选择,结合了过滤式和封装式这2种特征选择方法的优点.实验部分采用另外2种特征选择算法与本文所提方法分别进行特征选择,将这3种方法所得到的特征子集用于概率神经网络、BP神经网络分类器上,通过比较对应的分类精度,检验各种特征选择方法的效果. 实验结果显示,所提出的特征选择方法能更为有效的实现特征选择,所取得的特征子集具有更好的泛化特性.  相似文献   

18.
决策表最优特征子集的选择--基于粗集理论的启发式算法   总被引:5,自引:0,他引:5  
特征子集选择问题是机器学习的重要问题。而最优特征子集的选择是NP困难问题,因此需要启发式搜索指导求解。基于粗集理论,本文提出了一种新的决策表最优特征子集选择的启发式算法。和以往的方法相比,这种算法简单实用,在一定条件下能够以较高的效率得到最优特征子集。  相似文献   

19.
为了提高模糊粗糙集特征选择算法的计算效率,在每次迭代过程中通过不断缩减样本和特征的搜索范围,提出了一种新的模糊粗糙集特征选择算法.为了减少样本的搜索范围,利用样本对决策类下近似隶属度的单调性,构建样本的筛选机制,用以筛除当前所选特征子集已保持决策类下近似隶属度的样本;为了缩减特征的搜索范围,采用特征冗余性概念,构建特征搜索机制,用以移除已被确定为冗余的特征;通过融合样本筛选机制和特征搜索准则,设计模糊粗糙集特征选择的高效算法.数值实验表明,所提算法具有高效性和有效性.  相似文献   

20.
A New Approach of Feature Selection for Text Categorization   总被引:1,自引:0,他引:1  
This paper proposes a new approach of feature selection based on the independent measure between features for text categorization. A fundamental hypothesis that occurrence of the terms in documents is independent of each other, widely used in the probabilistic models for text categorization (TC), is discussed. However, the basic hypothesis is incom plete for independence of feature set. From the view of feature selection, a new independent measure between features is designed, by which a feature selection algorithm is given to ob rain a feature subset. The selected subset is high in relevance with category and strong in independence between features, satisfies the basic hypothesis at maximum degree. Compared with other traditional feature selection method in TC (which is only taken into the relevance account), the performance of feature subset selected by our method is prior to others with experiments on the benchmark dataset of 20 Newsgroups.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号