首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 69 毫秒
1.
聚类布尔和分类数据   总被引:1,自引:0,他引:1  
提出了一种判别布和分类属性相似度的准则,并在此基础上提出了一种新的聚类的算法CAC,该算克服了传统聚类算法不适合聚类布尔和分类属性数据的缺点,实验表明CAC算法比传统的聚类算法有更好的聚类效果。  相似文献   

2.
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩。该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导。针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法( heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标( clustering validation index based on sparse feature dissimilarity, CVISFD)进行启发式度量,从而实现对聚类层次的自动选取。 UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性。  相似文献   

3.
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.  相似文献   

4.
不同于传统以距离为相似度标准的聚类方法,基于模式的聚类方法旨在挖掘出数据集中存在一致性模式的簇.然而,已有的模式聚类方法只能挖掘出特定的等差或等比模式,而对其他常用模式判断不足.分析数据对象间存在的多样化模式,引入了线性模式的概念,研究其特性和运算方法,并给出了一个对符合线性模式相似性的对象进行聚类的有效算法.  相似文献   

5.
稀有类分类在许多领域有重要应用,针对稀有类在数据中所占比例少,容易被忽略的特点,提出一种基于聚类和Ripper的稀有类分类方法,该方法在一趟聚类的结果中,通过将在整个数据集中所占的比例低于15%的聚类标识为少数类,再应用Ripper分类算法分别对少数类和多数类分别进行分类建模,并按照一定的组合方式调整得出整个数据集的最终规则集.在UCI数据集上的测试结果表明,基于一趟聚类和Ripper的稀有类分类方法对稀有类可产生高质量的分类效果.可以将该方法应用于现实生活的领域中进行稀有数据的分类.  相似文献   

6.
李顺勇  余曼  王改变 《河南科学》2020,38(10):1549-1557
为了对含有多个特征向量的分类矩阵对象数据进行描述,提出了一种新的基于簇间信息的分类矩阵对象数据的聚类算法(between-cluster k-modes,简称BC-k-modes).该算法利用k-modes算法的聚类过程,对分类矩阵对象数据进行聚类,导出隶属度矩阵与聚类原型的更新公式,通过增加簇间信息对目标函数寻求局部最优解.最后在五个真实数据集上进行了实验,结果表明该算法对真实数据的聚类效果明显优于其他算法.  相似文献   

7.
通过对用户推荐项目模式进行建模, 预测新用户的推荐项目归属类别, 从而推测出目标用户对具体推荐项目的评分. 实验结果表明: 该方法可以提高推荐服务的效率, 实用性较高.  相似文献   

8.
硬聚类算法HCM的求解结果通常是局部最优解,本文将遗传算法应用于HCM聚类算法,同时考虑到该算法实现时的效率和开销,最终提出了一种新的算法MHCM聚类算法。测试数据实验表明采用MHCM聚类算法的结果90%以上能够取得全局最优解,远远超出了采用HCM算法所取得全局最优解的次数,证明了本算法的可推广性。  相似文献   

9.
基于模糊模式识别原理和核方法特性,提出了基于核的模糊聚类算法,用核目标函数取代模糊C均值中的目标函数,选用高斯核函数实例研究了模糊核聚类在遥感影像分类中 的应用。结果表明:与传统的模糊聚类算法相比,模糊核聚类算法能够有效改善遥感影像分类效果,从而拓宽了模糊模式识别的应用范围。  相似文献   

10.
覆盖聚类算法   总被引:9,自引:0,他引:9  
首先比较几类主要的聚类算法,给出每类算法的基本概念、原理、每类的代表性算法,及这些算法的主要特征。在此分析基础上,提出一种新的聚类算法———覆盖聚类算法,该算法采用覆盖的概念将比较集中的样本聚合在一起,从而发现隐含在样本集中的类,对于周围稀疏的样本结合最短距离法,获得聚类效果,并用实验数据对分层聚类方法、LBG方法与覆盖聚类算法进行比较,证明了覆盖聚类算法的可行性和有效性。最后给出了算法的研究方向。  相似文献   

11.
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。  相似文献   

12.
针对利用k-均值聚类算法形成发电系统充裕度评估中的聚类负荷模型时存在的聚类中心初始值和聚类数难以确定的问题,提出根据负荷水平对充裕度指标的贡献度,将负荷曲线分成高贡献度、中等贡献度、低贡献度等分区,分别采用层次聚类、均值-标准差、随机法来选择各分区中聚类中心初始值;定义改进效率指标,将改进效率作为收敛条件确定聚类数.利用本文方法所得的聚类负荷模型,采用状态抽样法计算IEEE RTS79电力系统可靠性测试系统的发电系统充裕度指标.算例结果表明,同采用基于传统k-均值聚类方法的负荷模型结果相比,基于混合聚类方法得出的负荷模型的计算结果更精确,收敛速度更快.  相似文献   

13.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型,存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题,提出了一种基于规范化的B样条密度模型的图像聚类算法.通过构建基于规范化的B样条密度函数的非参数混合模型,利用非参数B样条期望最大(NNBEM:Non-parametric B-spline Expectation Maximum)算法估计密度模型的未知参数,并根据贝叶斯准则实现图像的聚类.该方法不需要对模型做任何假设,可有效克服有参混合模型与实际数据分布不一致问题.对模拟图像和真实图像数据进行仿真的结果表明,规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能.  相似文献   

14.
针对有参混合模型的聚类算法需要假设模型为某种已知的参数模型, 存在模型不匹配及非参数正交多项式密度估计不是概率密度函数的问题, 提出了一种基于规范化的B样条密度模型的图像聚类算法。通过构建基于规范化的B样条密度函数的非参数混合模型, 利用非参数B样条期望最大(NNBEM: Non parametric B splineExpectation Maximum)算法估计密度模型的未知参数, 并根据贝叶斯准则实现图像的聚类。该方法不需要对模型做任何假设, 可有效克服有参混合模型与实际数据分布不一致问题。对模拟图像和真实图像数据进行仿真的结果表明, 规范化的B样条密度模型的聚类算法比其他算法具有更好的聚类性能。  相似文献   

15.
建立组合预测模型关键是单项预测方法的筛选,本文将采用灰色聚类分析方法对单项预测模型组进行筛选.首先依据所研究的实际问题,建立多个单项预测模型,然后计算每一个单项预测方法的点拟合相对误差,最后再利用这些数据,借助灰色聚类方法实行对比评估,构建组合预测模型需求的各个单项模型,以增强该模型预测的准确性.应用实例的分析表明该方法是可行的和有效的.  相似文献   

16.
基于动态聚类分析的空袭编队判断模型   总被引:1,自引:1,他引:0       下载免费PDF全文
空袭编队是由担负不同作战任务的飞机组成的战术机群,其分布是防空作战指挥员分析空袭企图和定下作战决心的重要依据。空袭编队具有数量多、分布范围大,空情分析要求实时性强的特点,依据空中目标的数据特征,首先建立了基于动态聚类法对空中目标群进行分类的方法和步骤,该算法具有较好地收敛性,能够满足防空指控系统的高实时性要求。在此基础上提出了目标群内和目标群间作战参数的计算方法,并依据空袭编队数量分布及航路捷径给出了主要来袭方向和攻击企图分析模型。最后给出了一个具体算例,其运行结果与指挥员的判断基本吻合。工程实际应用表明,该模型能对空中目标进行快速聚类,可为区域防空指挥员准确掌握空情和快速决策提供量化依据。  相似文献   

17.
介绍了聚类误差平方和准则,指出了误差平方和准则的不足,提出了误差绝对值和准则、最大误差准则以及误差p次方和准则.  相似文献   

18.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

19.
基于聚类算法的选择性神经网络集成   总被引:11,自引:0,他引:11  
为了提高集成个体的差异度,提出了一种利用聚类算法去除冗余个体的选择性集成方法,该方法通过使用神经网络作为基学习器,并在多值分类数据集上进行实验.结果表明,该技术计算效率高,精度与稳健性也与基于遗传算法的选择性集成方法相当甚至占优.  相似文献   

20.
Gustafson-Kessel(GK)聚类算法可以有效地搜索超椭球、平面和线型的数据类,但仍然存在对初始聚类中心较敏感、易于陷入局部最优的缺陷.为此,文中根据鱼群觅食与聚类的相似性,利用人工鱼群(AFS)算法对聚类中心进行初始化,提出了改进的G-K聚类算法,并利用人工数据集和IRIS数据集进行仿真研究.结果表明,文中算法能有效地发现数据集中的聚类结构,聚类效果优于GK聚类算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号