首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
一种新的基于决策熵的决策表约简方法   总被引:2,自引:0,他引:2  
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足.以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法.理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简.  相似文献   

2.
分析了在知识约简过程中经典粗糙集理论决策表知识约简方法的不足。以知识粗糙熵为基础,将一致和不一致对象分开,提出决策熵的概念及其属性重要性,在此基础上给出约简的判定定理;然后以条件属性子集的决策熵来度量其对决策分类的重要性,提出一种新的知识约简启发式方法。理论分析和实验结果表明,基于决策熵的属性重要性是一种更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优约简。  相似文献   

3.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

4.
在多标记学习中,属性约简是解决多标记数据维数灾难的一个关键技术.针对邻域粗糙集属性约简在计算正域代价较大和多标记数据中标记具有不同的强弱性问题,提出了基于邻域粗糙集的多标记属性约简算法.该算法首先利用样本在整个属性空间下到其异类样本的平均距离与到其同类样本的平均距离的差值对标记进行加权;其次,利用取整函数对样本空间进行划分,提出了一种新的多标记邻域粗糙集快速计算正域的方法;最后,根据前向贪心搜索算法进行属性约简,以获得一组新的属性排序.实验给出了5个多标记数据集在4个评价准则上的对比结果,实验结果分析表明了所提算法的有效性.  相似文献   

5.
考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.  相似文献   

6.
基于属性重要性的加权支持向量机及其应用   总被引:1,自引:0,他引:1  
针对珠江水质预测中的大量不确定和模糊因素,提出了一种基于属性重要性的加权支持向量机水质预测模型.首先通过粗糙集理论对原有的评价指标体系进行约简,由原来的8个预测指标约简为7个指标,被约去的属性正是网站公布数据中缺失的属性;同时计算出各属性的重要性,对重要的指标赋予较大的权重,构造基于属性重要性的加权支持向量机,这不同于以前的针对样本作用不同而构造的加权支持向量机.本文以珠江流域重点断面水质预测为例,对近2年数据进行分析,结果显示了该模型的有效性.  相似文献   

7.
由于相似关系或相容关系不具有传递性或对称性,从而相容类或相似类之间存在误判,因此研究不完备信息系统中合适粒度下的粗糙性度量和属性约简算法很有必要。在不改变相关模型的基础上,文章通过极大相容块的思想,研究了非等价关系的基本知识粒度构造,进一步讨论了合适粒度下的粗糙性度量方法,提出了基于极大相容块的知识粗糙性更精确的定义和极大相容块的条件信息熵及其属性重要性定义,并证明了相关性质;给出了合适粒度下属性约简的启发式算法,结果表明,极大相容块的重要性度量避免了通常意义下粒度过粗问题,知识粗糙性更为准确。  相似文献   

8.
模糊信息系统上的粗糙约简   总被引:3,自引:0,他引:3  
:基于粗糙集理论和模糊等价关系,提出了模糊信息系统(FISs)在不同粒度划分上的知识约简方法和属性重要性度量.这些约简利用了2个水平划分参数(或对象相似度)α、β,其中相对约简与属性重要性度量采用了决策类的水平集正区域公式.利用水平集粗糙成员函数得到分布约简与分配约简方法,它们扩展了Pawlak信息系统(PISs)上的属性约简方法,解决了FISs上的知识获取与特征选择问题.同时,基于不同粒度下的等价类,给出了FISs上可辨识属性矩阵、分布约简和分配约简的辨识公式,克服了经典方法在FISs上的不适用性.示例结果表明,在不同粒度空间上,这些约简方法产生了与全部属性具有最大程度分辨能力和规则置信度的属性子集.  相似文献   

9.
基于广义加权支持向量机的焊接缺陷分类方法   总被引:1,自引:0,他引:1  
提出了一种广义加权支持向量机(GWSVM)的焊接缺陷分类算法。首先为克服由于样本数量不平衡性引起的小样本类别精度差的问题,引入由于样本差异的权重;然后为解决不同类别的重要性要求,根据经验人工确定不同类别重要性的权重。针对样本重要性的影响,采用有监督模糊聚类方法来确定样本重要性权重。测试结果表明:广义加权支持向量机在噪声影响较大及样本类别相差较大时,能够提高重要的、数量少的缺陷检测精度。  相似文献   

10.
基于信息熵的不完备信息系统属性约简算法   总被引:11,自引:0,他引:11  
在现实生活中信息的不完备现象广泛存在,等价关系不一定成立,限制了经典Rough集理论在一些实际问题中的应用.从信息论角度出发引入信息熵的概念,提出了不完备信息系统中知识熵的度量方法,定义了信息观下不完备信息系统知识约简的方法,分析并讨论了与现有其他约简定义的关系,给出了一种基于信息熵的不完备信息系统属性约简算法,通过仿真实验说明了该算法对于不完备信息表知识约简是可行的.  相似文献   

11.
针对网络评论中普遍存在的负面评论较少而影响力却较大的类不平衡问题, 提出一种基于类不平衡学习的情感分析方法. 该方法利用深度学习训练过程中的概率输出, 以计算样例的信息熵作为影响因子构建交叉信息熵损失函数. 在IMDB公开数据集上进行实验验证的结果表明, 基于集成信息熵损失函数的双向长短期记忆网络能处理类不平衡问题; 对数据的统计分析结果表明, 该策略能提升基于双向长短期记忆网络的评论情感极性分类性能. 针对AUC(area under curve)指标, 使用集成信息熵损失函数的双向长短期记忆网络模型比未考虑类不平衡的深度学习模型在中位数上最多提升15.3%.  相似文献   

12.
针对传统检测模型仅通过单一方法进行窃电检测具有局限性且用电数据中存在类不平衡的问题,从集成学习的角度出发,本文提出一种基于熵权法融合异质分类器的窃电检测模型。首先,通过少数类样本合成过采样技术(synthetic minority oversampling technique,SMOTE)处理用电数据不平衡的问题,其次综合考虑个体分类器之间的多样性以及各自的检测性能和训练机理进行基分类器的优选,最后,引入信息熵的概念,基于各个基分类器分类结果的分散程度,计算其权重占比,并以该权重占比集成各基分类器的输出。实验结果表明,对比传统的窃电检测模型,本文所提模型在多项评价指标下表现较好,具有良好的检测性能。  相似文献   

13.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

14.
支持向量机在处理分类问题时,如果两类数据重叠严重会造成分类器过学习,降低泛化性能。为此提出了一种基于信息熵的数据修剪支持向量机EB-SVM(entropy based-support vector machine),其主要思想是通过计算样例信息熵删除部分边缘数据和边界处混淆程度较高的样例以及噪声数据,用较少的训练样例学习SVM分类器。实验结果表明,该方法能够有效提高SVM的泛化性能。  相似文献   

15.
非平衡数据集Fisher线性判别模型   总被引:4,自引:0,他引:4  
非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原理有关.本文首先阐述了Fisher线性判别的分类机制,指出当两类样本的协方差矩阵不同时,样本不平衡会导致Fisher线性判别的性能下降.在此基础上,提出了一种加权Fisher线性判别(WFELD),以减小样本不平衡的影响.然后,从UCI中选择了8个非平衡数据集,并采用ROC曲线下面积作为评估指标进行比较,实验结果证明了WFLD模型的有效性.  相似文献   

16.
提出了用粗糙集理论构造模糊多层感知器的方法。使用粗糙集从样本信息表中抽出关于领域的规则以及规则的精确度和覆盖度。网络的结构由已经抽取的规则映射而成,初始连接权由规则的精确度和覆盖度确定。论文给出了基于信息熵的知识的简算法。运用于水稻虫害分类的试验结果表明:这种基于知识的模糊多层感知器与传统感知器相比,具有较少的隐层节点,并能做出正确的特征分类。  相似文献   

17.
 讨论了权重完全未知且属性值为区间数的多属性决策问题,提出了一种基于理想区间数贴近度的决策方法。首先定义区间数的距离,并给出区间数贴近度的公理化定义,讨论区间数贴近度的性质,然后针对区间型多属性决策问题给出一种区间型决策矩阵的规范化方法,并给出3种确定权重的方法,分别是模糊标度重心赋权法(主观赋权法)、基于最小相对熵原理的熵与相对熵综合赋权法(客观赋权法)以及利用优化方法,以待评方案与理想最优方案的贴近度最大化为优化目标,建立的贴近度最大化赋权法(主、客观组合赋权法)。利用权重可计算出每个方案与理想方案的综合贴近度,即可得到所有方案的排序结果。最后通过实例分析验证了该方法的有效性和实用性。  相似文献   

18.
一种基于互信息的粗糙集知识约简算法   总被引:2,自引:0,他引:2  
针对粗糙集理论核心内容之一的知识约简问题,该文提出了一种改进的互信息的属性约简算法。该算法结合信息论中信息熵与互信息的概念定义了粗糙集里的一种新的属性重要度,并以此属性重要度为启发式信息进行属性约简。实验分析表明:在大多数情况下,该种算法都能够得到决策表的最小约简。  相似文献   

19.
This paper presents a novel ontology mapping approach based on rough set theory and instance selection .In this appoach the construction approach of a rough set-based inference instance base in which the instance selection (involving similarity distance, clustering set and redundancy degree) and discernibility matrix-based feature reduction are introduced respectively; and an ontology mapping approach based on multi-dimensional attribute value joint distribution is proposed. The core of this mapping aI overlapping of the inference instance space. Only valuable instances and important attributes can be selected into the ontology mapping based on the multi-dimensional attribute value joint distribution, so the sequently mapping efficiency is improved. The time complexity of the discernibility matrix-based method and the accuracy of the mapping approach are evaluated by an application example and a series of analyses and comparisons.  相似文献   

20.
逆向物流供应商选择是典型的多属性决策问题.针对逆向物流供应商选择问题的特点,提出一种基于直觉模糊熵的逆向物流供应商选择问题的直觉模糊多属性决策方法.在回顾相关基础理论知识基础上,建立了逆向物流供应商评价指标体系,给出了基于直觉模糊熵的评价指标权重的确定方法,然后运用直觉模糊加权平均算子对二级指标信息集结,得到逆向物流供应商选择问题的直觉模糊决策矩阵,提出了基于直觉模糊熵和TOPSIS法(逼近理想解的排序方法)的逆向物流供应商评价方法.最后通过数值分析验证了该方法的可行性与有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号