首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
根据竞争情报分析需要,会产生不同竞争情报分析模型,这些分析模型的构造大多建立在竞争情报数据的聚类统计之上。提出采用改进的近邻传播(Affinity propagation, AP)聚类算法实现大规模竞争情报数据聚类统计。根据竞争情报数据样本建立相似矩阵,初始化偏向参数;通过布谷鸟搜索优化偏向参数,将偏向参数作为布谷鸟巢进行训练,设置轮廓指标值作为布谷鸟算法适应度函数;通过鸟巢位置更新优化后的偏向参数进行AP聚类运算,不断更新AP算法的决策和潜力阵;最终获得稳定的聚类结果。试验证明,通过合理设置布谷鸟宿主发现概率、移动步长和AP算法阻尼因子等参数,能够获得较好的聚类效果。相比常用竞争情报聚类算法,所提改进AP聚类算法能够获得更高的轮廓指标值和最短的欧式距离性能,在竞争情报数据分析统计中的适用度高。  相似文献   

2.
近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度.  相似文献   

3.
针对近邻传播算法中偏向参数调优难的问题,提出了一种基于和声搜索的近邻传播算法(HS-AP),利用和声搜索自动为数据集匹配最佳偏向参数,进而提高算法聚类精度。HS-AP算法首先把偏向参数编码为和声,利用和声算法自动搜索最佳和声,并将搜索到的和声解码为偏向参数进行运算。在UCI标准数据集上进行实验对比表明HS-AP算法在准确率,兰德指数,正则化互信息三个指标方面均有提升。准确率平均提升了6.36%,兰德指数平均提升了4.677%,正则化互信息平均提升了19.04%。  相似文献   

4.
近邻传播算法(AP)不需要事先指定聚类数目,在程序运行过程中,能够自动识别聚类中心及聚类数目。在同一批数据集上,AP算法聚类结果稳定,鲁棒性好。除此之外,AP聚类算法可以采用多种距离度量方式,聚类结果精确。针对近邻传播算法(AP)不能对异构数据进行聚类的问题,提出一种基于张量距离的高阶AP聚类算法。该算法首先利用张量表示异构数据对象,然后将张量距离引入AP聚类算法,用来度量异构数据对象在张量空间的相似度。张量距离的引入,不但能够度量异构数据对象在数值上的差异,同时能够度量异构数据对象在高阶空间中位置的差异性,有效的捕捉异构数据对象的分布特征。实验结果表示,提出的高阶AP算法能够有效的对异构数据对象进行聚类。  相似文献   

5.
针对传统吸引子传播算法(AP)聚类性能受偏向参数影响较大的问题, 提出一种改进的吸引子传播算法, 即基于稳定阈值的吸引子传播聚类算法(STAP). 该算法通过稳定阈值, 衡量获得真实类数时的收敛状态, 然后捕捉该状态下的偏向参数; 为加快算法的收敛速度, 采用S型函数作为收敛因子调节阻尼系数. 仿真模拟实验结果表明, 与传统吸引子传播聚类算法相比, 基于稳定阈值的吸引子传播聚类算法聚类精度更高, 收敛速度更快.  相似文献   

6.
为了提高文本聚类的性能,采用近邻传播(Affinity propagation, AP)算法进行文本聚类,并采用知识图谱进行样本预分析,以提高AP的文本聚类适用度。采用知识图谱进行样本预处理,对待聚类的文本进行知识图谱三元分析,并生成对应概念、实体和关系的样本集合;建立AP文本聚类模型,并通过差分进化(Differential evolution, DE)算法优化偏向参数;利用DE算法求解的最优个体的偏向参数进行AP聚类运算,不断更新AP算法的决策和潜力阵,从而获得稳定的聚类结果。试验结果表明,经过知识图谱分析之后,通过合理设置DE算法的差分缩放因子和交叉速率,DE-AP算法能够获得更优的聚类准确度,且聚类准确度的均方根误差(Root mean squared error, RMSE)值更低;和常用文本聚类算法相比,该文算法获得了更高的聚类准确度。  相似文献   

7.
传统基于概率分布的不完整数据聚类填充算法,未综合分析数据对象的类别属性,数据填充效率和精度较低。因此,本文提出一种新的聚类填充算法,利用近邻传播(AP)算法聚类不完整数据,采用元祖相似度算法对不同类别的不完整数据实施填充。通过数据挖掘方法获取多类别不完整云计算网络系统中的加权关联规则,实施常规缺失数据的填充,采用数据推荐筛选方案实施元组相似度运算,完成异常缺失数据的填充,最终获取完整的云计算网络数据集,提高云计算网络数据的有效利用率。实验表明,本文设计的聚类填充算法具有较高的填充效率和精度。  相似文献   

8.
基于局部线性嵌入的半监督仿射传播聚类算法   总被引:1,自引:0,他引:1  
针对运用半监督仿射传播聚类算法处理高维数据时聚类精度低和计算量大的问题,提出一种基于局部线性嵌入的半监督仿射传播聚类算法.该算法首先通过LLE算法将高维输入数据集映射到低维空间得到低维数据集,计算低维数据集的相似度矩阵,再用半监督算法调整相似度矩阵,最后用仿射传播聚类算法对低维数据进行聚类分析.仿真结果表明,本文提出的算法与半监督仿射传播聚类算法相比,在处理高维数据时聚类效果更好,精度更高,迭代次数更少.  相似文献   

9.
谱聚类算法建立在谱图划分理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。然而,谱聚类算法涉及如何选取合适的尺度参数σ构造相似度矩阵的问题。并且,在处理大规模数据集时,聚类的过程需要较大的时间和内存开销。研究从构造相似度矩阵入手,以传统NJW算法为基础,提出一种基于K近邻的自适应谱聚类快速算法FA-SC。该算法能自动确定尺度参数σ;同时,对输入数据集分块处理,并用基于K近邻的稀疏相似度矩阵保存样本信息,减少计算的内存开销,提高了运行速度。通过实验,与传统谱聚类算法比较,FA-SC算法在人工数据集和UCI数据集上能够取得更好的聚类效果。  相似文献   

10.
对于多模型软测量建模,聚类效果、子模型的建模和融合方式对其模型精度有重要影响。对此,该文提出一种基于改进仿射传播聚类的多模型软测量建模方法。为提高聚类精度,在仿射传播聚类算法划分样本数据的基础上,采用人工鱼群算法对仿射传播聚类算法的偏向参数和阻尼系数寻优,同时针对距离较近类别边界处的样本再建立重叠类,采用支持向量机建立各类样本的回归子模型。分别用标准数据集仿真和工业双酚A生产装置的现场数据建模仿真,结果证明该方法是有效的。  相似文献   

11.
针对传统SVR(Support Vector Regression)及其相关改进模型在不同时间阶段的能源消耗样本数据具有差异较大的不同函数规律或分布特征的条件下,难以进行合理预测这一问题,提出了基于优化AP(Affinity Propagation)聚类算法的AP-SVR模型。首先,在滚动预测的算法框架下建立了运用能源消耗累积规律进行预测的模型,并对AP聚类算法进行了优化;其次,结合优化AP聚类算法构建了最优化训练集,并运用SVR得到预测结果。算例分析表明,AP-SVR模型可有效识别样本训练集中能耗数据累积规律的差异,将聚类为同一类别数据作为训练集的条件下,SVR的拟合精度得到明显提升。通过多种模型计算效果的比较发现,剔除不同类型数据后的训练集明显更加适合于SVR模型的预测,在降低预测误差和改善预测结果可信度等方面优化了模型预测效果。  相似文献   

12.
针对网络入侵检测系统中的一般聚类算法速度较慢和精度较低的问题,提出了一种基于简化群优化的最优路径森林聚类算法(SSO-OFC).首先,将数据集解析为图,将其节点作为样本;然后,将每个样本连接到其给定特征空间中的k-近邻,图的节点由它们的概率密度函数(pdf)值加权得到;最后,通过样本及k-近邻之间的距离计算得到pdf值.提出的算法主要贡献是快速估计最佳k值,并将最优路径森林聚类应用于网络入侵检测.在5个公开的数据集上进行实验.结果表明,SSO-OFC的精度非常稳定,除了KddCup数据集,其他数据集上的精度都在95%以上,相比基于数据聚类的SSO和自组织映射更加稳定有效.  相似文献   

13.
设计一种基于AP聚类算法和SVM分类器相融合的新的混合分类器, 使用AP聚类算法优化数据集, 得到了高质量、 小样本的SVM分类器训练集. 实验结果表明: 与传统的SVM分类器相比, 混合分类器具有更高的分类精度; 在心脏病预测上, 该分类器的效果较好.  相似文献   

14.
在近邻传播聚类算法基础上提出了基于偏向参数p可变的分簇路由算法CPAP,该算法针对异构无线传感器网络的特殊背景,改变AP算法偏向参数p的常规设置方式,综合考虑能量、距离因素解决分簇问题;另外,分析了算法中K参数的影响,取得其近似最优值。仿真结果表明:CPAP与PECBA相比,第一死亡节点出现时间推迟了28.5%,将更多的能量用于网络开始死亡之前,提高了网络的能量利用率。  相似文献   

15.
提出了一种基于流形分析与近邻传播(AP)算法的径向基函数(RBF)神经网络分类算法.通过流形分析算法对数据集进行初步处理,然后通过指数函数调整相似度矩阵,再重新进行AP聚类,在此基础上构造RBF神经网络分类器,通过拟合正确率来判断算法是否收敛,并对分类结果运用FMI指标进行评价.实验结果表明:改进算法中RBF网络隐节点数普遍得到增加,使得RBF神经网络拟合精度得以提高;从分类结果可以看出该算法对训练数据集都获得了很好的拟合正确率,对测试数据集也获得了较高的测试正确率.  相似文献   

16.
提出了一种基于多层次聚类的算法,此算法相对传统算法降低了空间和时间复杂度,并减少了对参数的敏感度,适合处理大规模数据集.该算法包括粗分、代表点聚类和细分三个阶段.首先,利用亲和传播聚类(AP)算法对所有数据进行粗分,为了节省空间和时间,仅考虑每个点和离自己最近的t个近邻之间的相似度,所以构造的相似度矩阵远远小于原始AP算法所构造的相似度矩阵;其次,为了进一步提高效率和性能,在第二阶段采用密度峰值算法(FDP)对上一阶段所得结果进行再划分;最后,结合两个阶段划分的结果得到所有数据的划分.实验表明:所提算法可以快速准确地进行图像分割,和经典聚类算法FCM(模糊C均值)、Kmeans以及SOM(自组织映射)的对比实验也证明了所提算法的有效性.  相似文献   

17.
利用多尺度变换将高维数据映射成低维数据,便于近邻传播聚类。仿真证明,与传统近邻传播算法相比,基于多尺度变换的近邻传播算法聚类精度高,收敛速度快。  相似文献   

18.
针对近邻传播(Affinity Propagation,简称AP)算法在对非团状数据集聚类过程中出现的局部聚类较多、精准度不高等问题,提出了一种基于改进AP算法的聚类质量评价模型.首先,在AP算法初步聚类的基础上,通过合并相似度较大的簇,减小聚类上限值k_(max),进一步压缩聚类区间范围;其次,给出一个新的内部评价指标,用分属不同簇的样本对的平均距离代表簇间距离,削弱噪声数据的影响,平衡簇间分离度与簇内紧致度的关系.在UCI和KDD CUP99数据集上的实验结果表明,新模型可以给出精准的最优聚类数(范围),能够在保持较低漏报率的同时,有效提高样本的检测率和分类正确率.  相似文献   

19.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

20.
针对目前高光谱图像半监督降维算法中基于流形学习的开放性选择近邻参数问题,以及利用传统算法不能有效地获取标签数据的局部信息,提出了一种无需考虑近邻参数的半监督局部稀疏嵌入(SELSE)算法.该算法基于稀疏表示理论,通过求解范数优化问题构建稀疏系数图,并且利用有限的标签数据最大化类间信息,提取高光谱图像的特征.在AVIRIS高光谱遥感图像的Indian Pine数据集上进行仿真实验,结果表明所提出算法在分类精度和计算效率上都有所提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号