首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

2.
具有全局聚类的多属性离散化算法   总被引:1,自引:1,他引:0  
为了减少连续属性离散化后有用信息的丢失和信息系统总的断点数量,提出了一种具有全局聚类效果的多属性离散化算法.算法根据各属性预插入断点对信息系统近似分类质量的影响,来确定要插入断点的属性,从全局属性范围选择最佳断点.根据Ameva统计量来判断属性中最佳断点的位置,并以保证决策表的近似分类质量作为算法的终止条件.实验采用多...  相似文献   

3.
提出了基于断点辨别力的粗糙集离散化算法.通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化.离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息.采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验.实验结果表明此算法是有效的,而且当候选断点个数增多时仍有较高的计算效率.  相似文献   

4.
提出了基于断点辨别力的粗糙集离散化算法.通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化.离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息.采用多组数据对该算法的性能进行了检验,并与其它算法做了对比实验实验结果表明该算法是有效的,而且当候选断点个数增多时仍具有较高的计算效率.  相似文献   

5.
针对在使用粗糙集理论处理决策表时需要事先对连续属性进行离散化处理的问题,提出了一种基于连续属性分布特征的离散化算法.并通过实例分析说明该算法能在保证决策表原始分类能力不变的前提下,获得较少的断点数.  相似文献   

6.
针对目前离散化信息量度无法准确表征数据离散后有效分类信息量的问题,提出了一种基于有效信息比率的离散化算法.在构建离散化方案相依表的基础上,分析了离散区间内类属性分布与分类信息蕴含量间的关系,并根据类属性分布信息引入有效信息比率,用于表征各离散区间内有效分类信息量.然后,依据离散化方案的离散区间数及其有效信息比率,设计出表征离散化方案划分质量的离散化评价指标,从而提高了数据的离散化效果.仿真实验和实际应用的结果表明,该算法离散化后在有效分类信息量和分类预测精度上高于主流基于信息论的离散化算法.  相似文献   

7.
提出了基于断点辨别力的粗糙集离散化算法通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化。离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息。采用多组数据对该算法的性能进行了检验,并与其它算法做了对比实验。实验结果表明该算法是有效的,而且当候选断点个数增多时仍具有较高的计算效率  相似文献   

8.
提出了基于断点辨别力的粗糙集离散化算法。通过分析候选断点与决策类之间的相关性,定义了候选断点对决策类的辨别力,并以此作为断点重要性的度量,实现连续属性的离散化。离散化后的决策系统不改变原有的相容性,而且能最大限度地保留有用信息。采用多组数据对此算法的性能进行了检验,并与其他算法做了对比实验。实验结果表明此算法是有效的,而且当候选断点个数增多时仍有较高的计算效率。  相似文献   

9.
从理论上研究了决策表中决策值细化程度与信息粒度、近似分类的精度及近似分类质量之间的关系,结果表明,决策属性的属性值划分得越细,则该属性的信息粒度、近似分类精度和近似分类质量的值就越小.仿真实验同时证明,在基于决策属性划分之下,对任意一个条件属性集经决策细化后的决策表所对应的信息粒度、近似分类精度和近似分类质量的值,都不大于决策细化前决策表所对应的信息粒度、近似分类精度和近似分类质量的值,这个结果对研究决策表属性约简和决策规则的有效性等问题都有指导作用.  相似文献   

10.
离散化是Rough集理论研究的一个重要内容,目前基于Rough集的离散化算法很难做到高效率和高识别率兼顾.文中分析了基于断点重要性算法和基于属性重要性算法的特点,确定了离散化思路,提出了一种基于Rough集的集成离散化算法.该算法能够有效降低候选断点的数目,快速地实现决策表的离散化.实验结果表明,文中算法保持了与已有算法可比的识别率,且运行效率更高.  相似文献   

11.
对基于粗糙集的决策系统,从理论上分析了决策数据细化的程度对规则近似质量、近似分类精度、核属性和信息熵的影响.证明了决策属性的属性值划分越细,则其规则近似质量、近似分类精度和信息熵就越小,并且决策表中决策属性值细化后所得到的核属性集一定包含细化前的核属性集.因此,在对决策属性离散化时,决策数据细化的程度要适宜.研究结果对研究决策表属性的约简、决策规则的形成和有效性等问题具有实际意义.  相似文献   

12.
匹配是实现图像分类的关键问题,由于匹配问题的复杂性,目前还没有一个较好的解决办法。该文提出了一种基于Fourier变换和信息熵相结合的匹配算法,对Logo的分类问题进行了研究。通过Fourier变换在图像的频域中找到最佳匹配,使用相关度阈值与信息熵差比作为衡量标准。实验中选取了大量商品图像对Logo匹配问题中查准率和查全率进行了统计分析。实验结果表明,当选取适当相关度阈值与信息熵差比的情况下,该算法能有效提高商品图像按Logo的分类效果。  相似文献   

13.
为了提高分类的精确度,提出一种基于粗糙集理论的增强学习型分类器。采用分割算法对训练数据集中连续的属性进行离散处理;利用粗糙集理论获取约简集,从中选择一个能提供最高分类精确度的约简。对于不同的测试数据,由于离散属性值的变化,相同的约简可能达不到最高的分类精确度。为克服此问题,改进了Q学习算法,使其全面系统地解决离散化和特征选择问题,因此不同的属性可以学习到最佳的分割值,使相应的约简产生最大分类精确度。实验结果表明.该分类器能达到98%的精确度.与其它分类器相比.表现出较好的性能。  相似文献   

14.
借鉴邻域粗糙集处理连续型数据的优势,为解决传统谱聚类算法需要人工选取参数的问题,提出基于自适应邻域互信息与谱聚类的特征选择算法。首先,定义各对象在属性下的标准差集合与自适应邻域集,给出自适应邻域熵、平均邻域熵、联合熵、邻域条件熵、邻域互信息等不确定性度量,利用自适应邻域互信息对特征与标签的相关性进行排序。然后,结合共享近邻自适应谱聚类算法,将相关性强的特征聚到同一特征簇内,使不同特征簇内的特征强相异。最后,使用最小冗余最大相关技术设计特征选择算法。在10个数据集上选择特征个数与分类精度的实验结果,验证了所提算法的有效性。  相似文献   

15.
基于启发式信息熵的粗集数值属性离散化算法   总被引:1,自引:0,他引:1  
在一致性假设前提下,以数据集的统计性质作为启发式知识,从候选离散点集中选择离散点,根据数据集的期望值和方差来确定搜索最优离散点的区域,提出一种新的基于信息熵粗集数值属性离散化算法,并采用UCI国际标准数据集来验证新算法.新算法与已报道的算法所得到的离散断点集完全一致,决策表的离散化结果也相同,但时间代价不同,新算法比其计算效率提高40%~50%.  相似文献   

16.
针对曲率模态对振型节点较不敏感且无法定量估计损伤的问题,在广义局部信息熵的基础上引入曲率模态,推导出广义局部曲率模态信息熵的公式,并建立相应的损伤指标.利用有限元软件Midas civil建立一简支梁桥损伤模型,提取并处理该简支梁的动力参数,将一阶曲率模态和广义局部曲率模态信息熵分别作为神经网络的输入参数,对损伤进行识...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号