首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
传统的视觉单词仅通过无监督聚类方法生成,标注的精度和效率较低。加权概念格是一种有效的层次数据分析工具,本文采用加权概念格对视觉单词进行分析与约简,提出了一种新的视觉单词生成方法。首先生成训练图像视觉词包的形式背景,并通过信息熵获取视觉单词的权值;其次针对各语义类别,根据用户所设定的内涵重要性阈值,构造出视觉词包模型频繁加权概念格;然后依据外延数阈值,提取对分类贡献大的描述图像语义的约简视觉单词,进一步提高了标注的精度和效率;最后通过实验验证了该方法是有效的和可行的。  相似文献   

2.
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构。采用加权概念格作为分类规则提取工具,通过引入加权外延支持度,给出了一种新的分类规则的提取算法CRAAF-WCL。最后,利用恒星光谱数据作为形式背景,实验验证了该算法具有较高的分类效果。  相似文献   

3.
概念格的属性约简是知识表示和数据处理的一种有力工具,已被成功应用到多个领域,寻求高效快速的属性约简算法仍然是概念格理论的主要研究热点.从信息熵和布尔矩阵的角度研究形式背景的属性约简,提出属性约简的新方法.首先,在形式背景上定义矩阵信息熵、矩阵条件熵、矩阵联合熵和矩阵互信息熵,研究它们的性质和相互之间的关系.接着,在形式背景上提出基于矩阵信息熵的矩阵熵协调集和矩阵熵约简的定义,给出了属性的重要性度量,利用矩阵信息熵刻画核心属性、相对必要属性和不必要属性的属性特征,再给出获取矩阵熵约简的方法和算法.最后,利用UCI数据集进行测试,验证了基于矩阵信息熵的矩阵熵约简算法的有效性.通过对比实验,证明该算法具有更加高效的约简性能且适用于大数据样本.  相似文献   

4.
基于信息熵的模糊多属性决策方法   总被引:3,自引:0,他引:3       下载免费PDF全文
曾三云  龙君 《广西科学》2008,15(2):135-137
针对属性值为梯形模糊数的模糊多属性决策问题,给出一种基于信息熵的模糊多属性决策方法,并用实例进行检验.该方法利用信息熵求出各属性权重,利用简单加权法来计算方案的模糊效用值,根据梯形模糊数的期望值排序方法对方案进行排序和择优.用该方法选出的方案有效、可行而且计算简单,为解决模糊多属性决策问题提供了新途径.  相似文献   

5.
提出一种面向概念漂移集成分类的基分类器三支过滤方法.首先基于信息熵理论计算出基分类器的不确定性值,并融合其准确性作为基分类器的质量度量,然后通过预设阈值 α、β 对基分类器进行三支过滤.其过滤策略为:删除质量权值小于等于阈值 β 的基分类器;保留质量权值大于等于阈值 α 的基分类器;对于质量权值大于 β小于 α的基分类...  相似文献   

6.
分析了概念格与关联规则之间的关系,提出了将频繁项集及其支持度存储在概念格上,然后在创建好的概念格上提取关联规则的方法,概念格的每个节点本质上是一个最大项目集,非常有利于关联规则的提取。然而目前对于概念格的研究,一般都假定由属性集所组成的概念格的内涵同等重要,而在现实数据库中,组成内涵的属性重要性往往是不同的,因此,内涵并非同等重要。为了充分利用概念格实现关联规则提取,提出了一种新的概念格结构:加权概念格,并给出其渐进式构造算法及基于该格结构上的关联规则提取算法。  相似文献   

7.
决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.  相似文献   

8.
SLOF算法采用了空间对象的空间属性和空间关系确定空间邻域,并结合非空间属性的权值来计算对象在其邻域内的离群度,但在计算属性权值时,仍然由邻域专家决定,存在人为因素.文中采用计算每个对象的每个非空间属性的去一划分信息熵增量,并通过这个值来反映各个属性对对象离群的贡献程度,给出一种改进的SLOF算法.实验结果表明,算法具有计算效率高和对用户依赖性小的优点.  相似文献   

9.
针对评估数据缺失的问题,提出了一种新的缺失数据填充方法.从信息熵的角度对评估系统进行描述,并提出一种建立在区间值信息系统上的加权广义信息熵,对这种信息熵的非负性、单调性和极值性进行证明.在此基础上,通过研究评估系统数据缺失前后信息熵的变化情况,建立一种基于加权广义信息熵的缺失数据填充方法,并从知识粒度的角度论述加权广义信息熵的机制.通过实例分析与现有的部分算法进行比较,进一步证明文中算法对评估系统缺失数据填充的有效性.  相似文献   

10.
为了解决数据挖掘过程中挖掘的知识粒度过粗或过细问题,并利用概念格的偏序特性,提出了一种基于量化概念格的属性归纳算法.首先对概念格的外延进行量化,得到量化概念格,再根据概念格的哈斯图,采用概念的爬升进行相应的泛化,从而获得基于量化概念格的多层、多属性归纳.与面向属性归纳(AOI)算法相比较,结果表明所提算法不仅能实现AOI的单一属性归纳,还能进行多层、多属性的归纳,其属性泛化的路径不是惟一的,并且很容易在量化概念格的哈斯图中寻找合适的泛化路径和阈值,以此得到用户要求的、合理的属性归纳结果.  相似文献   

11.
基于属性值并的权熵思想,通过构建模型,给出了一个属性的某几个属性值并的权熵之和不小于该属性单个属性值的权熵之和的结论,从理论上证明了ID3算法的合理性,为ID3算法提供了理论基础.  相似文献   

12.
概念格是数据分析与知识发现的重要理论.知识发现的一个重要方面是知识约简,因而找到简单有效的约简方法是非常必要的.本文从形式背景上ECⅡ代数结构的角度出发,研究了概念格的属性约简定理,约简方法及属性特征.  相似文献   

13.
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。  相似文献   

14.
将信息熵引入形式背景中,研究对象导出三支概念格的熵属性约简. 首先,定义对象导出三支概念格的信息熵、条件熵和互信息等概念;其次,根据属性在约简过程中的重要性探讨核心属性和非核心属性的熵判定条件,并得出对象导出三支概念格的熵协调集等价于OEG协调集(对象导出三支概念格的粒协调集),对象导出三支概念格的熵约简集等价于OEG约简集;最后,给出决策形式背景中对象导出三支概念格的熵协调和熵约简等概念,并给出启发式熵约简的方法.  相似文献   

15.
不确定性多属性决策中确定属性熵权的一种方法   总被引:9,自引:0,他引:9  
针对属性值以区间数形式给出的不确定性多属性决策中确定属性权重的问题,提出了一种区间数熵权的确定方法·依据多属性决策中传统熵权确定方法的思路,首先,通过构建两个最优化模型,求得区间熵;然后根据传统熵权确定公式及区间数运算法则得到以区间数形式表示的属性熵权·该方法具有概念清晰、实用的特点,得出的属性熵权能够较好地反映各属性信息的差异程度·最后通过一个算例说明了该方法的实用性和有效性·  相似文献   

16.
在解决属性值为直觉模糊数的多属性决策问题中,其权重信息未知.先采用熵值法来求其权重,并用直觉梯形模糊数权重平均算子求出各指标的平均属性值,给出了直觉梯形模糊数得分函数公式,期望函数公式.并提出了解决此类问题的方法与步骤,根据得分函数值大小进行排序,选择出最优方案.通过一个实例对此方法进行验证.  相似文献   

17.
0 Introduction Watermarking relational database become a hotspot in recent years, it aims to protect copyrights by intro- ducing small errors into the original content without af- fecting the usability for intended purpose. Although some pioneer efforts h…  相似文献   

18.
概念格是数据分析与知识提取的一种有效工具,具有精确性和完备性等特点.目前,基于概念格的分类规则提取算法很多,但在提取到规则的数量上和规则的形式上并不能达到令人满意的效果.针对基于概念格的分类规则提取方法进行了研究,在改进内涵缩减的增量式计算方法基础上给出了基于内涵缩减的确定的分类规则和近似的分类规则的提取方法,通过有效限制计算内涵缩减的节点的范围降低了内涵缩减的计算规模,利用分类规则基,降低了需要计算的分类规则的数量,提高了分类规则的提取效率.为验证本研究提出分类关联规则的挖掘方法,用C++实现了上述算法.测试结果表明,本文给出的算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号