首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
研究表明,高维数据的聚类都隐含在低维的子空间内,而这些子空间就是把原始数据投影到某些维度上的交集,于是相应的聚类算法就变成如何寻找合适的子空间内容。在此提出了一种新的划分子空间方法——基于Parzen窗子空间划分方法,并在这基础上提出了新的投影聚类方法PCPW。通过与最新的EPCH算法的实验结果对比表明,两者聚类效果相当,但PCPW算法更简单,易于实现。  相似文献   

2.
文中给出了基于属性值出现的频率的连续属性离散化的一种方法。在离散化问题描述的基础上,利用属性值出现的频率确定频数候选断点,再利用边缘断点算法进一步减少断点数目,达到离散化目的。该方法提高了决策属性关于条件属性的支持度,提高了属性约简的满意度。  相似文献   

3.
目前常用的离散算法多为单属性离散化算法.利用该类算法对多维连续属性进行离散化时,逐次对单个属性进行离散化,割裂了多维属性之间的关系.基于此提出了一种基于遗传算法和变精度粗糙集的多属性离散化算法.该算法基于变精度粗糙集所具有的较好数据分类容错和抗噪能力,通过变精度粗糙集近似分类精度建立遗传算法适宜度评价函数,并利用遗传算法在多维连续属性候选断点集上寻找最优断点子集.基于UCI数据集比较了所提算法与多种常用的离散化算法的差异,实验结果表明,该算法可以获得相对较好的离散化效果.  相似文献   

4.
提出了在没有任何领域知识可供借鉴的情况下,基于聚类思想,利用遗传算法对数量型属性进行离散化的新算法——遗传C均值算法.该算法利用遗传算法具有全局寻优的特性,对训练样本根据其每一属性值进行聚类,将样本划分为不同的类,从而为每一属性找到其值的最佳分割点.然后,对不同类赋以不同的编码.该算法的优点是能得到最优的离散化结果.在VC 6.0环境下实现了该算法.仿真实验证明该方法有效解决了利用粗糙集理论进行分类规则挖掘时,数量型属性的离散化问题。  相似文献   

5.
提出和探讨了一种新的基于模糊粗糙集和断点简约化的离散化方法.综合考虑到规则的支持度和可信度及其关系,应用属性离散指标作为离散化的标准,证明了该指标可以作为离散化彻底的充分条件.并且在时间复杂度和空间复杂度方面分析了算法的有效性,与同类算法比较可以发现该算法在基本不损失分类信息的基础上有效降低这两方面的复杂度,能有效地避免以往各种算法中出现的弊端.最后将其应用于电网故障诊断中,通过具体算例测试,证明该算法的有效性和实用性.  相似文献   

6.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

7.
一种基于加权Parzen窗的聚类算法   总被引:1,自引:0,他引:1  
提出了一种新的基于加权Parzen窗的无监督学习方法 .该方法采用加权Parzen窗获得对数据分布状态的良好描述 ,从而求出不同模式类的分界面 ,并将聚类过程转变为求解加权Parzen窗权值的线性规划问题 .实验表明 ,采用这一方法只需较少的计算时间就可以获得与Asa等人基于支持向量机的方法类似的聚类结果 .  相似文献   

8.
Parzen窗估计法在图像复原中的应用探索   总被引:2,自引:0,他引:2  
通过对降质图像离散退化模型与Parzen窗估计法基本公式的对比和对几种退化模型的点扩展函数特点的分析,揭示了点扩展函数与Parzen窗函数之间的对应关系.提出用Parzen窗函数对点扩展函数进行估计的思路和方法,从概率统计的角度对盲图像复原的方法进行了探索.  相似文献   

9.
陈浩  段彩萍  王飞 《科技信息》2013,(8):63-63,65
互联网的快速发展使得网络中的数据共享和交换行为变得越来越频繁,但与此同时也带来了隐私保护方面的诸多问题,如何在数据挖掘过程中保护好隐私已经成为一个亟待解决的问题。本文设计了一种新型的能有效提取需要的特征值而不需提供原始数据的密度估计器,拟从概率密度函数的角度出发,利用Parzen窗法估计总体样本的概率分布密度,把决策函数利用泰勒展开式展开,展开之后的模型中已不包含原始数据,从而达到隐私保护的目的。  相似文献   

10.
粗糙集理论应用中的离散化方法综述   总被引:8,自引:0,他引:8  
粗糙集理论是一种有效处理不确定、不精确、不完备信息的数学工具。但是传统的粗糙集理论只能对数据库中的离散属性进行处理,而绝大多数现实的数据库既包含了离散属性,又包含了连续属性。针对粗糙集理论的这些缺陷,综述了几种比较常用的离散化算法,并在此基础上,引申出一些启发式离散算法。最后指出,现有的离散化算法都会或多或少地损失部分信息,目前还没有确定的评判准则评论哪一种方法更好、更合适;离散化方法的一个有效思想就是“最低限度地减少信息丢失、保持数据分类能力和使最终得到的离散化最小(分类器最小)”的原则。  相似文献   

11.
针对在使用粗糙集理论处理决策表时需要事先对连续属性进行离散化处理的问题,提出了一种基于连续属性分布特征的离散化算法.并通过实例分析说明该算法能在保证决策表原始分类能力不变的前提下,获得较少的断点数.  相似文献   

12.
基于粗集理论的数据离散化新算法   总被引:20,自引:0,他引:20       下载免费PDF全文
连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路,研究了候选断点重要性的衡量方式,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点,选择的断点都能够保证信息系统的分辨关系,并能够取得较理想的离散化结果。  相似文献   

13.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

14.
离散化方法在基于粗糙集焊接建模中的比较   总被引:1,自引:0,他引:1  
粗糙集建模方法是一种新的且重要的焊接过程建模方法,离散化是粗糙集建模方法中一个必要且重要的步骤.针对已有离散化方法众多、难以取舍的特点,讨论并确立了焊接建模过程中离散化方法的选择标准.以低碳钢的脉冲钨极氩弧焊为背景,针对相同的建模数据,采用除离散化外相同的粗糙集建模步骤,并以十折交叉确认法为验证方法,对比不同离散化方法对焊接粗糙集模型的预测能力的影响.实验表明,基于熵的离散化方法更加适合焊接过程的粗糙集建模.最后,探讨了基于熵的离散化方法的参数选择.  相似文献   

15.
为了解决目前航材订货模型单纯依托人为经验,对航材消耗规律变化反应滞后且可信度不高工作量过大的问题,提出在原始订货模型的框架下,使用PAM聚类、粗糙集全局离散和粒子群算法,计算模型中的航材分类、属性离散和区间权重,从而建立启发式航材订货模型,并在测试集上对比新老模型的均方离差。结果表明,启发式航材订货模型可以使人摆脱依靠经验确定模型的繁琐工作,并且能有效提高模型的准确性和及时性,从而提高航材订货工作效率。  相似文献   

16.
针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.  相似文献   

17.
基于Rough Set理论中的不可分辨性原理,给出两个新的定义属性的最大区分值(Maximum Dis-cernibility Value,MDV)和属性冗余度(Attribute Redundancy Rate,ARR)。在数据预处理阶段,属性的MDV数值用于确定关于自组织映射网络SOM输出单元数量的启发式搜索策略;属性冗余度则用于衡量属性约简结果的信息冗余程度,并以此作为优化SOM网络输出层结构的依据。不依赖于领域经验知识,建立了MDV、SOM、ARR的组合算法模型,实现了Rough Set理论中连续属性的自动离散化计算,并明显提高了属性约简的速度。最后,通过项目实例对全过程进行有效验证。  相似文献   

18.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号