首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 158 毫秒
1.
对层次聚类算法的改进   总被引:5,自引:0,他引:5  
介绍了层次聚类算法的基本思想,在原算法的基础上,通过对类间距离进行预排序从而避免合并类时重新计算类间距离,该算法降低了计算的复杂度.实验表明,改进后的算法在与原算法聚类效果相同的情况下运行速度明显提高.  相似文献   

2.
采用一种改进密度空间聚类算法进行巡检图像分割,算法采用简单线性迭代聚类(SLIC)进行预处理,有效降低了内存消耗并提高了运行效率,同时有效改善了图像中目标边界作为背景来处理的问题;算法采用斜交空间距离作为距离度量,充分考虑变量间的相关性,改善了高维聚类不准确的问题.改进算法与DBSCAN对比实验表明:改进算法的聚类结果能有效分离目标和背景,保持边缘完整和连续,运行效率与聚类准确性有很大的改善,可以对巡检图像进行更有效的分割.  相似文献   

3.
随着大规模网络数据的增加,可扩展性成为推荐系统的一个关键因素,为此提出一种基于并行化谱聚类的协同推荐算法.首先通过并行化改进的谱聚类方法对项目进行聚类;然后在基于用户的协同推荐算法基础上,结合已聚类的项目打分信息,提出一种改进的相似用户计算方法,并进行推荐;最后在数据集上进行测试.结果表明,该算法可以有效降低时间复杂度,推荐精确度和推荐效率也有显著提高.  相似文献   

4.
利用传统的聚类算法对直觉模糊集进行聚类分析时,存在对异常值敏感、复杂度较高的问题,不适用于大规模直觉模糊数据的聚类。针对上述问题,提出了一种基于密度峰值思想和加权兰氏距离的直觉模糊聚类算法(WIFDPL),用来提高算法对直觉模糊数据的检测精度,降低算法的复杂度。由于现有直觉模糊距离算子不满足距离度量的定义,提出了一种新的直觉模糊兰氏距离算子,减少了数据的偏移程度,降低了对异常值的敏感程度;由于凝聚型层次聚类算法复杂度较高,采用密度峰值聚类算法对直觉模糊集进行聚类,显著提高了算法的运行效率。实验结果表明,利用改进的直觉模糊兰氏距离提高了聚类精度,且新算法复杂度较低,更适用于大规模直觉模糊集的聚类。  相似文献   

5.
基于改进Single-Pass算法的BBS热点话题发现   总被引:1,自引:0,他引:1  
详细介绍了经典增量式聚类算法Single-Pass的特点,针对该算法中"聚类质心不唯一"的缺陷提出"设定唯一聚类质心"的改进方案,降低了算法的时间复杂度;针对"算法聚类中心随机性强"的不足提出了"不断优化聚类中心"的改进方案,使得聚类中心的代表性更强.最后,基于"中华网BBS"文本数据对改进后的算法进行验证、分析,并与经典Single-Pass算法的聚类结果进行对比,得到了更为理想的实验结果,表明算法可行有效.  相似文献   

6.
提出一种基于单维分割的高维数据聚类算法HDCA_SDP, 该算法利用单维空间能划分数据的性质,对整个数据集进行逐维聚类,解决了传统聚类算法带来的维度困扰问题,对数据集大小和数据空间维数具有良好的可伸缩性,且聚类结果的精度比传统的高维聚类算法有较大的提高. 实验结果表明,该算法在处理高维大规模数据时是有效的.  相似文献   

7.
在推荐系统中,往往会存在数据的非实时性、稀疏性和冷启动性等问题,文中通过引入遗忘曲线来跟踪用户对资源偏好程度随时间变化情况,利用提出一种改进的K-Means聚类算法对用户集进行聚类,根据改进的个性化推荐算法对用户进行推荐,建立了一种基于动态时间的个性化推荐模型. 通过实验验证,文中提出的个性化推荐模型能够获取准确的用户偏好信息,并缓解冷启动问题,降低算法计算的时间空间复杂度,提高个性化推荐算法的推荐质量.  相似文献   

8.
基于JPEG2000低内存低复杂度的图像编码算法   总被引:1,自引:0,他引:1  
针对JPEG2000内存需求大、计算复杂度高等问题,提出了用提升格式实现的基于行的小波变换方法.以累进方式完成列向的小波变换,可在不影响变换结果的前提下降低对存储容量的需求;同时利用提升格式的特点,进一步节省内存和加快计算速度.针对EBCOT算法3个通道编码、三次扫描操作浪费大量运算时间的情况,应用一次扫描完成3个通道编码操作的算法对其进行改进,不用重复形成上下文,大大减少了运算时间,并保持了JPEG2000的优异性能.  相似文献   

9.
针对目前子空间聚类算法存在精度差、效率低的问题,设计了一种子空间聚类算法DSUB.提出了裁剪候选对象的方法,减少了候选聚类对象的个数且对候选对象分组,使得待搜索的聚类簇只能是某个组的子集,可降低后续聚类处理的复杂度.此外,提出了新的邻域查询方法和抽样覆盖策略用以提高密度聚类的处理速度.实验结果表明:DSUB算法精度高,能够发现任意形状的聚类簇;计算复杂度与数据量呈线性关系;抗噪声性能强;聚类结果与处理顺序无关.DSUB算法非常适合处理子空间聚类.  相似文献   

10.
文章针对KNN存在的复杂度过高的问题,提出应用把BIRCH算法的层次聚类思想近似地计算weight的Bireh Out算法,以降低其复杂度,同时利用孤立点挖掘的思想做异常检测.通过在KDD99数据集上的实验,我们验证了算法的有效性.  相似文献   

11.
To construct a high efficient text clustering algorithm, the multilevel graph model and the refinement algorithm used in the uncoarsening phase is discussed, The model is applied to text clustering. The performance of clustering algorithm has to be improved with the refinement algorithm application, The experiment result demonstrated that the muhilevel graph text clustering algorithm is available,  相似文献   

12.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果.  相似文献   

13.
针对离散制造业质量管理系统中维度高,且存在较多一致性数据的情形,设计了一种基于信息论中的信息熵,即互信息的改进聚类算法。通过实验分析,采用改进的聚类算法可有效提高聚类的正确率,并且通过演化聚类理论和方法的应用可对离散制造业质量管理提供有效的决策参考信息。  相似文献   

14.
基于矩阵分解和聚类提出一种协同过滤推荐算法. 先利用交替最小二乘(ALS)算法进行矩阵分解, 再利用改进的k-均值聚类算法弥补单一ALS算法在后期协同过滤阶段产生的大计算量问题, 解决了由于减小原始矩阵高维度、 高稀疏性带来的推荐准确度较低的问题, 极大提高了计算速度和推荐精度. 实验结果表明, 改进算法在推荐准确性上有明显提高.  相似文献   

15.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

16.
针对K-Means算法对初始聚类中心的依赖性较高,容易出现局部最优停滞的问题,提出一种改进樽海鞘群算法优化 K-Means 的小麦覆盖度提取算法。首先,将小麦图像转换到HSV色彩空间;然后,用改进樽海鞘群算法进行全局寻优,以获得全局最优值作为K-Means算法的初始聚类中心,接着运用K-Means算法进行局部寻优,直到迭代完成;最终,输出经过分割的小麦图像。为了评估算法性能,使用12个基准函数对ISSA及其他智能优化算法进行对比测试,同时将改进樽海鞘群算法优化K-Means应用于小麦覆盖度提取。结果表明,ISSA算法在优化精度和收敛速度上均超越其他算法,鲁棒性也得到了显著提高。与其他算法相比,ISSA-K算法分割后的小麦图像纹理比较清晰,效果更佳,同时具有更加高效的优势,可用于小麦覆盖度的提取,具有较强的实用性。  相似文献   

17.
为解决高多元时间序列聚类算法的问题,采用了一种基于主元分析方法的多元时间序列聚类分析方法,利用MTS序列的前z个主元与每个簇的代表元素之间的Eros距离,将原有的复杂数据降维.在此基础上通过改进K-means算法对选取的多元时间序列的主元进行聚类分析,最后得到K个MTS聚类.理论分析和实验结果表明该算法能有效解决聚类问题.  相似文献   

18.
针对全国100家电子商务示范企业的相关数据, 先采用因子分析法对高维数据进行降维处理; 再通过改进DBSCAN(density based spatial clustering of applications with noise)算法对降维后的密度不均数据进行聚类分析, 得到了更合理的聚类结果; 最后根据聚类结果对相关示范企业提出改进建议.  相似文献   

19.
一种自适应局部线性嵌入与谱聚类融合的故障诊断方法   总被引:4,自引:1,他引:3  
针对数据维数高、非线性且从高维观测空间分析数据模式困难的问题,将改进的流形学习算法引入到数据聚类中,提出了一种结合自适应局部线性嵌入和递归调用规范切融合的新方法.采用自适应局部线性嵌入对原始数据进行非线性降维,应用递归调用规范切对低维空间数据进行聚类,通过对3组UCI标准测试数据集的仿真实验表明,新方法能够将高维数据有效地映射到低维本质空间,克服了传统方法对数据集结构的依赖性,从而显著提高了谱聚类算法分类的准确性和稳定性.同时,对于田纳西-伊斯曼过程的数据实验,表明了该方法对故障模式识别的可行性和有效性.  相似文献   

20.
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将MFCC特征参数和LPCC特征参数相结合,从而完善说话人的个性信息.并在k-means的基础上增加AE-SOM神经网络,利用该网络实现输入特征的降维、说话人数的判定和聚类中心的选取,从而弥补k-means算法的缺陷.仿真实验表明两种声学特征融合之后,改进的聚类算法可有效地提高说话人聚类的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号