首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 109 毫秒
1.
一种基于结构信息总结树的XML文档聚类方法   总被引:2,自引:0,他引:2  
提出一种有效的XML文档结构信息表达方法,用数字化的结构总结树SST对XML文档的结构信息进行编码,在此基础上给出结构距离的定义,并采用遗传算法对XML文档进行聚类.实验证明该方法分类准确率高,易于实现,且不需先验的DTD知识.  相似文献   

2.
提出一种基于模糊聚类的可解释性建模方法.利用提出的一种含有熵的聚类有效性函数来评价模糊聚类方法的有效性和可解释性,从而确定模糊规则数和模型前提参数,然后利用最小二乘法来辨识模型的结论参数,最后采用梯度下降法来调整模型的参数.该方法应用于Box-Jenkins 数据仿真实例,仿真结果表明该方法不但能保证系统的精确性,还具有很高的可解释性.  相似文献   

3.
基于分层聚类的k-means算法   总被引:8,自引:0,他引:8  
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。  相似文献   

4.
一种改进的K means聚类彩色图像分割方法   总被引:1,自引:1,他引:0  
图像分割是从图像处理到图像分析的关键步骤.图像分割的目的是将图像分割为多个互不重叠且又各具特性的区域,主要应用于图像压缩、目标提取、模式识别等.以往的图像分割技术主要应用于灰度图像,随着计算机技术的进步,彩色图像分割逐渐受到关注.该文在前人对彩色图像分割问题的大量研究成果基础上,提出了一种将K-means聚类、蚁群算法以及分水岭算法相结合的分割方法.本方法有效的克服了聚类数目必须依据先验知识提前设定、最初的聚类中心是随机选取的、聚类的效果好坏依赖于距离判定公式的缺陷.  相似文献   

5.
一种基于SOM和层次凝聚的中文文本聚类方法   总被引:2,自引:0,他引:2  
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

6.
针对矩形文档碎片的拼接提出了一种聚类的碎片边缘灰度匹配算法,这种算法主要涉及碎片的预处理、边缘灰度的提取、碎片的聚类以及匹配,其中碎片聚类和匹配是碎片拼接中最关键的组成部分.碎片聚类可以使计算机搜索待匹配碎片的数量减少,提高匹配的正确率.碎片的匹配算法选取了碎片的左、右(或上、下)两边界的部分边缘灰度值,大大压缩了信息量,它不仅可以提高计算机处理速度,而且匹配精度高、效果好.实验证明,此算法适用于矩形碎片的拼接,具有高效、快速、稳定的特点.  相似文献   

7.
针对K-均值算法易受孤立点影响、对初始中心点选择敏感、易陷入局部最优的问题,对K-均值算法进行了改进,提出了一种自适应优化选择初始中心点的K-均值算法。实验结果表明,改进后的算法不仅较大程度上弥补了传统K-均值算法的不足,并且提高了聚类的稳定性和准确率。  相似文献   

8.
为了在动态环境中快速地跟踪变化后的最优解集,提出一种基于聚类预测模型的动态多目标优化算法.通过对种群聚类,提高预测解集的分布性与广泛性,为分段预测做准备,然后利用历史信息对每个子类的中心点和形状进行预测,在环境变化后,预测产生的每个子类共同构成整个新的初始种群,有引导性地增加了种群的多样性,使算法能快速跟踪新的最优解集.在标准动态测试问题上进行算法测试,实验结果表明所提算法能快速地适应环境的动态变化,所获解集具有较好的收敛性和分布性.  相似文献   

9.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

10.
缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。  相似文献   

11.
基于免疫聚类和遗传算法的RBF网络设计方法   总被引:7,自引:0,他引:7  
基于人工免疫机制和遗传算法,提出了一种训练径向基函数(RBF)网络的混合算法.该算法采用了一种可以实现数据聚类的人工免疫机制根据输入数据集合自适应地确定RBF网络隐层中心的数量和初始位置;采用遗传算法训练RBF网络,能够使优化过程趋于全局最优.将该方法用于多用户检测问题的实验结果表明,采用这种混合算法训练的RBF网络结构精简,具有很好的抗多址干扰的性能.  相似文献   

12.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

13.
提出了一种基于k均值聚类的混合异构图像隐写分析算法. 在训练阶段,根据图像纹理复杂度对图像库
进行聚类,并针对每一类图像训练相应的分类器. 在测试阶段,根据测试图像的纹理复杂度对其进行类别判断,然
后送至相应类别的分类器中进行隐写检测,从而减弱了失配状态对现有隐写分析算法造成的影响. 实验结果表明,
该算法较好地提高了现有隐写分析算法的检测精度.  相似文献   

14.
应用于工程中的径向基函数(RBF)神经网络模型,当训练样本量很大时常存在训练学习速度慢和拟合精度不高的问题.针对这一情况提出了一种基于聚类的RBF神经网络(BC-RBFNN)模型.该模型首先通过对训练样本进行聚类分析,将其分为不同的类,接着根据每类的训练样本构造一个RBF子网并获取其相关参数,接着再将各个子网组织成一个BC-RBFNN模型.通过对其进行理论分析和性能检验试验,结果表明该模型能加快网络训练学习速度,缩小的模型规模,提高网络的预测精度.  相似文献   

15.
采用可编程逻辑器件FPGA(Field Programmable Gate Array,FPGA)来实现二值图像的快速扫描聚类算法,并给出了部分VHDL程序说明满足系统实时性的要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号