首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 82 毫秒
1.
视觉词典树是通过视觉词袋(Bag of Visual Words,Bo VW)模型将一组图像形成单词表征场景。它主要通过聚类算法构造视觉词典树,为了改进K-Means在寻找聚类中心的过程中受到噪声异常维度的干扰,基于K中心算法提出了一种分层视觉词典树构造方法。该方法提出了从每次迭代后的聚类特征点中随机地选取新的中心点,可避免因噪声异常维度使计算中心点位置时有较大误差,从而可提高聚类质量,使类簇更加紧凑。在图像的分类实验中,分别使用K-Means和K中心算法对构建的视觉词典树进行性能评价,实验结果证明通过K中心算法构造的分层视觉词典树可有效提高图像分类准确率。  相似文献   

2.
DBSCAN方法是一种典型的基于密度的聚类算法,因此该方法具有可以发现任意形状的类的特点,但其聚类的效率并不是很高.如果考虑将传统的网格技术引入到DBSCAN聚类算法中,虽然一定程度上会提高聚类的效率,但其聚类的质量显得较为粗糙.文章通过引入自适应网格技术,使得DBSCAN聚类算法的效率和质量都有所提高.对比数值实验表明,基于自适应网格的DBSCAN聚类算法的聚类效果是良好的.  相似文献   

3.
为解决有限区域内分布的稀疏不均的、具有一定分布结构数据集的聚类分析难题,在近邻思想、网格化空间划分及万有引力叠加原理的启发下,提出了一种基于单元网格近邻势的聚类方法。该方法是基于近邻势的聚类方法在单元网格层次上的一种可以提高聚类速度的扩展。为有效实现并在时空效率上对这种聚类方法进行尽可能的改进,使用了单元网格、网格密度、多维网格划分法、多维索引树等一些比较重要的概念和方法。仿真实验中, 先使用多个不同类型的人工数据集将提出的算法与几个经典聚类算法在聚类精度、聚类速度等方面进行适当的比 较,采用两副图片在RGB(red, green,blue)色彩空间的像素点集来验证该算法的聚类压缩效果。仿真实验说明了这种方法比一些经典的聚类算法在聚类建设、聚类质量方面具有一定的有效性和优越性  相似文献   

4.
提出了一种基于八邻域网格聚类的多样性XML近似查询算法.首先给出了支持XML文档间语义距离计算的3种编辑操作代价模型,再利用XML文档间的语义距离建立XML文档的向量模型并设计基于八邻域网格的XML文档聚类算法,进而利用聚类过程中得到的物理和逻辑聚类中心对静态有序选择算法的查询评估策略进行优化,这样做只需定位聚类中心所在组群的局部范围,并在该范围内进行目标查询,而无需遍历整个XML数据库,从而快速返回满足用户需求的查询结果.经汽车外形智能化设计实验表明,所提算法的查询速度比静态有序选择算法平均提高了3~4倍.  相似文献   

5.
面向社交网络的情感社区检测,可应用于公共健康、舆情监测等领域.以新浪微博为平台建立一种情感社区检测框架,首先融合微博情感表情特征和情感词典,提出基于朴素贝叶斯算法的半词典半表情(naive Bayes based semi-lexicon and semi-emoji,SL-SE-NB)分类模型以实现对文本的情感极性预测;提出一种基于潜在狄利克雷分配(latent Dirichlet allocation,LDA)话题模型的用户-超话题-关键词(user-topic-keywords,UTK) 模型抽取用户话题;基于标签传播算法(label propagation algorithm,LPA)并加入话题概念,提出基于种子集与最小边介数的标签传播情感社区发现算法(label propagation algorithm based seeds and min-edge betweenness,SMB-LPA).最后通过实验验证了所提出算法的有效性和高效性.  相似文献   

6.
聚类是数据挖掘领域中的一个重要研究课题.聚类在电子商务、图像处理、模式识别、文本分类等领域有广泛的应用.本文首先建立了数据挖掘中聚类方法的比较标准,然后从基于优化、关系、变换这样一个新的角度对聚类方法进行了分类和比较,最后对数据挖掘中常用聚类算法进行了分析,以便于人们更易于选择研究方向和选择适合于具体问题的聚类算法.  相似文献   

7.
张伟 《科技资讯》2013,(24):18-18
本文提出了一种基于参考点和密度的网格聚类算法GRDCA.GRDCA算法保持了基于密度的聚类算法的上述优点和网格聚类的高效性,而且提出了基于参考点的网格单元重构方法避免了网格聚类质量低的缺陷,因此GRDCA算法适合对大规模数据的挖掘,理论分析和实验结果也证明了GRDCA算法具有处理任意形状的聚类、对噪音数据不敏感的特点.  相似文献   

8.
在数据挖掘中,聚类有着非常重要的地位。本文分别介绍了基于划分、基于层次、基于密度、基于网格和基于模型的聚类方法。对这五类聚类方法中的典型算法的聚类思想和特点做了相应的介绍,并分析了算法的优缺点,对聚类算法做了初步的总结。在具体问题的应用中,需多方面考虑算法的特性才能得到最佳聚类结果。  相似文献   

9.
基于分类的统计语言模型是解决N-gram语言模型中数据稀疏问题的有效方法之一,词的自动聚类算法一直是一个难点.如何设计一种计算速度快、收敛性好的算法是关键.提出一种根据词的上下文环境,综合考虑语言模型的困惑度和词的相似度的自动聚类算法.把词的自动聚类和提高基于分类的语言模型的性能联合起来考虑.实验结果表明,该算法执行效率高、聚类效果好.  相似文献   

10.
针对聚类算法在图像分割上存在分割效果和时间效率上的不足,基于网格聚类算法ShrinClus,提出一种新的图像分割方法,该方法通过把图像的RGB空间分割成网格,将所有像素点分配到原子网格当中,然后对非空原子网格集合进行收缩聚类,通过查找低密度的边缘网格来确定簇的边界,最终将原子网格的分类结果映射至像素点.该方法能有效地分割在RGB空间中存在部分重叠的图像,算法具有接近线性的时间复杂度.最后通过实验验证了新方法的有效性.  相似文献   

11.
一种基于网格的层次聚类算法   总被引:1,自引:0,他引:1  
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.  相似文献   

12.
一种基于密度的启发性群体智能聚类算法   总被引:3,自引:0,他引:3  
提出一种基于密度的启发性群体智能聚类算法.针对以往群体智能聚类算法中分类错误率较高、算法运行时间较长等不足,提出记忆体方法和基于密度的先行(look ahead)策略.用人工数据集和真实数据集进行实验,将实验结果进行比较分析.分析结果表明,基于密度的启发性群体智能聚类算法能够得到令人满意的聚类结果,其分类错误率和运行时间明显小于其它聚类算法.  相似文献   

13.
基于高斯混合密度模型的医学图像聚类方法   总被引:2,自引:1,他引:1  
研究了医学图像的聚类问题,提出一种基于高斯混合密度模型的K-EM聚类算法,并将此算法用于人体腹部图像数据,实现肝、肾、脾等主要器官的分类.在算法中,随机选取腹部图像像素数据,用QAIC信息准则确定训练样本的最佳类别数;用K均值聚类算法得到混合模型的初始参数;用期望最大(EM)算法多次迭代建立腹部图像数据的混合密度模型;运用贝叶斯准则,将腹部图像所有像素值划分到混合模型中相应的模型分支,得到每个器官像素值划分的正确率与误判率.试验结果表明,新算法分类的平均正确率高于85%、误判率低于10%,优于K均值算法.  相似文献   

14.
基于粒子群聚类算法的大坝安全监控模型   总被引:2,自引:1,他引:1  
将粒子群算法与模糊聚类算法相结合,建立了基于粒子群聚类算法的大坝安全监控模型.该算法将分类矩阵作为粒子的编码形式,依据粒子的个体极值和全局极值,充分利用正反馈计算信息,自适应性地确定模糊分类矩阵和聚类中心.工程算例表明:粒子群聚类算法进一步提高了聚类算法的区间预报能力;对于高维优化问题,粒子的搜索过程比较复杂,该算法的收敛速度较慢.  相似文献   

15.
针对视频跌倒检测中对目标运动状态描述不完整和识别准确率不高的问题,提出一种基于聚类和超限学习机分类模型的跌倒检测算法,通过聚类算法对视频进行关键帧采样,建立特征模型,构建基于超限学习机的跌倒检测分类器,从而实现对跌倒行为的判断。结果表明:采用聚类的方法提取关键帧能够有效地剔除冗余图像帧,提高算法的准确度,也证明了超限学习机分类模型相较于其他分类器具有更好的分类性能。  相似文献   

16.
基于空间金字塔词袋模型的图像分类算法相比于传统的词袋模型的图像分类算法的准确率有了一定的提高,仍无法满足实际的高标准图像分类的需求。为此提出了一种基于改进的空间金字塔词袋模型的图像分类算法,即使用轮盘法的改进的K-means聚类方法和支持向量机的直方图交叉核函数。分别优化改善了K-means聚类算法的聚类容易陷于局部最优的缺陷和支持向量机使用径向基核函数可能产生非常严重的过拟合问题。通过仿真验证了基于改进的空间金字塔词袋模型的图像分类算法的准确率明显高于原基于空间金字塔词袋模型的图像的分类算法。  相似文献   

17.
空间数据库中存储了海量的实时数据,常规的算法在数据挖掘过程中无法根据空间数据流的特征进行聚类.针对该问题,我们提出一种基于网格和距离阈值的空间数据流聚类算法,该算法分为离线和在线部分,为实时数据赋予时间相关的距离值,利用网格进行聚类.实验证明此算法对于空间数据流聚类具有理想的结果.  相似文献   

18.
聚类算法是数据挖掘领域中一个非常重要的研究方向.至今为止人们已经提出了许多适用于大规模的、高维的数据库的聚类算法.基于密度的聚类算法是其中一个比较典型的研究方向,文中以DBSCAN为基础,提出一种基于密度的网格动态聚类算法.新算法将网格的原理运用到基于密度的聚类算法中,并采用了动态的参数法,能自动根据数据的分布情况进行必要的参数更改,有效减少DBSCAN对初始参数的敏感度,从而提高了聚类的效率和效果,降低了算法I/O的开销.算法不仅能挖掘出各种形状的聚类,并能准确的挖掘出数据集中突出的聚类.  相似文献   

19.
新的基于网格聚类算法(GCAB)利用网格处理技术对数据进行了预处理, 并引进了网格密度阈值处理和网格中心点两种技术. 实验表明, GCAB算法不仅具有DBSCAN算法准确挖掘各种形状的聚类和很好的噪声处理能力的优点, 而且具有较高聚类速度.  相似文献   

20.
基于差异度聚类分析,提出了一种新的异常入侵检测算法DCAIDA,详细介绍了基于差异度聚类分析的用户行为模型建立算法和异常入侵检测算法.通过对原始用户行为数据进行差异度聚类分析,建立用户行为模型,并依据聚类模型对实时的用户行为进行分类,以此判断是否发生入侵.在KDD CUP 1999上的仿真实验结果表明:该算法检测率高、误报率低,且对新攻击类型有一定的检测能力,可实现预期效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号