首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 216 毫秒
1.
提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%.  相似文献   

2.
目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果、但是,大多数已有的谱聚类算法需要事先给定聚类数.在k-means算法、EM等聚类方法中也存在相似的问题、在此介绍了一种简单的容易实现的谱聚类算法,可以自动确定合适的聚类数.实验表明本算法结果很好、  相似文献   

3.
基于数据模式聚类算法的离群点检测   总被引:1,自引:0,他引:1  
针对传统模式挖掘算法在事务包含模式定义上未考虑模式间的包含关系而使聚类结果不够优良的问题, 提出一种新的基于模式聚类的离群点检测算法PCOT, 该算法适合于高维数据空间, 采用一种新的事务包含模式, 通过将模式表示成超图, 用超图分割方法对模式进行聚类. 实验与分析结果表明, 该算法能有效地在高维稀疏空间中发现离群点.  相似文献   

4.
提出了一种基于Mean-shift聚类的交互式图像分割算法。首先利用Mean-shift聚类算法初步分割图像,然后用户只需简单地输入交互信息,大致标识出部分对象点和背景点,再根据区域间的最大相似性准则合并区域,分割出感兴趣区域。实验表明,此算法简单有效,能准确地从复杂背景中提取对象轮廓。  相似文献   

5.
提出一种基于单维分割的高维数据聚类算法HDCA_SDP, 该算法利用单维空间能划分数据的性质,对整个数据集进行逐维聚类,解决了传统聚类算法带来的维度困扰问题,对数据集大小和数据空间维数具有良好的可伸缩性,且聚类结果的精度比传统的高维聚类算法有较大的提高. 实验结果表明,该算法在处理高维大规模数据时是有效的.  相似文献   

6.
本文描述了模糊聚类Fuzzy C-Means(FCM)算法实现CT图像分割的方法和过程,该算法的主要特点是提供了一种非监督方式的模糊聚类,它可满足CT图像工作站以非监督方式分割图像的要求。 介绍了CT图像模糊分割的特点,并对实验过程和结果进行了讨论。  相似文献   

7.
基于视觉颜色聚类的彩色图像分割   总被引:17,自引:0,他引:17  
根据视觉的颜色聚类特性,提出一种图像分割算法.根据从色彩空间(RGB)到(HLC)的变换公式和NBS颜色距离的概念,首先将彩色图像量化为256或更少量化级,而不使图像质量降低;然后依据NBS颜色距离的概念将色彩分类;最后,根据某种规则将颜色区域进行分块,并删除小的颜色块.给出了静物图像和自然景物图像的实验结果。  相似文献   

8.
基于图分割的蚁群聚类算法   总被引:2,自引:0,他引:2  
提出了采用两种策略更新信息素来控制蚂蚁行进路径的方法.根据信息素的浓度确定图边的权值,运用了图分割算法断裂所得图的边,从而达到对数据进行聚类的目的.实验结果证明算法是有效的.  相似文献   

9.
本文从利用空间信息的角度进行了研究,从邻域距离约束的角度出发,提出一个新的聚类目标函数,得到基于邻域距离约束的FCM图像分割算法。将该算法用于人工图像和实际图像的分割实验,实验结果表明了该算法的有效性以及对噪声的鲁棒性。  相似文献   

10.
为了得到FCM聚类多阈值分割中最佳聚类个数,针对Bezdek熵在数字图像数据聚类有效性判别中的不足,提出一种改进的聚类有效性判别函数.新函数通过在Bezdek划分熵中增加补偿项来突出最佳聚类时的函数值,提高有效性判别的正确性.试验结果表明,基于改进初始隶属度矩阵生成方法的FCM算法,计算迭代次数为传统FCM方法的55%,计算用时减少了约45%,而且由改进聚类有效性判别函数得到的最佳聚类数目和试验图像相符,效果明显优于Bezdek熵方法,由最佳聚类数得到的分割图像能够体现目标绝大多数信息,证明了本算法的有效性和正确性.  相似文献   

11.
针对一维定常对流扩散反应方程,提出了一种四阶精度的有理型紧致差分格式,其局部截断误差为O(h4);然后通过Richardson外推技术和算子插值法将本文格式的精度提高到六阶.因为格式仅涉及到3个网格基架点,所以对于Dirichlet边值问题,由差分格式可得三对角线性方程组,可采用追赶法进行求解.最后通过数值算例验证了本文方法的精确性和可靠性.  相似文献   

12.
由于词语的多语义问题和传统的文本表示与聚类过程相互独立的问题,导致文本聚类准确率较低。针对上述问题提出一种基于多语义文本表示的自适应模糊C-均值(Multi-semanticSrepresentationSbasedSadaptiveSfuzzySC-means, MSR-AFCM)聚类算法。通过将词语软聚类划分成多个词簇构建多个语义空间,将语义空间个数作为文本初始聚类数目,利用词语的语义隶属度计算每个文本属于文本空间的语义隶属度,并以此为对隶属度进行初始化。在算法运行过程中,根据更新的文本语义隶属度和文本分布状况,逐步剔除冗余的文本空间,以达到优化聚类数目的目标。实验结果表明,MSR-AFCM算法相较于传统的聚类算法有更高的准确率和兰德系数,验证了算法的有效性。  相似文献   

13.
本文提出了利用文本频谱进行中文文本轮廓分析的表征方式.该方法基于不同时代、体裁和领域的文本在文字使用方面具有偏好性的假说,以文本中单个字符为单位,通过文本频谱刻画方法统计所有单字符在文本中出现的频率,并使用刻画出的文本频谱对文本进行表征;利用频谱比对分析技术,可计算出任意文本间的距离,并以此距离为基础进行聚类分析.进一步的实验证实了该方法的有效性.  相似文献   

14.
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。如何快速地整理海量信息,对不同的文本进行有效分类,已成为获取有价值信息的瓶颈。本文用模糊聚类分析的方法对文本进行分类,较好地解决了信息的实时分类问题,在实践中收到了良好的效果。  相似文献   

15.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

16.
0 IntroductionText clusteringis the process of grouping the documentsinto the classes or clusters so that documents within acluster have high si milarityin comparisonto one another ,butare very dissi milar to documents in other clusters .In applica-tions ,the document is always represented by vector spacemodel(VSM) in which each document is represented as a vec-tor and each unique termis of one di mension of this vector .Then,documents are clustered bycalculating distance or si mi-larity[1], …  相似文献   

17.
利用网页的结构特征,提出一种多级网页聚类方法。该方法首先对网页进行分块,然后使用网页的块特征对网页进行聚类。在聚类过程中,通过调整阈值,能够提供三级聚类:同站点网页聚类、同站点同结构网页聚类、同站点同结构同模板网页聚类。与已有的网页聚类方法相比较,该方法能够提供多级聚类结果,满足不同的聚类需求,而且在聚类的准确率和效率方面有本质上的提高。  相似文献   

18.
稀土金属是一个国家重要的战略资源,我国作为稀土资源大国,却由于缺乏核心专利技术制约了稀土资源的深度开发。为了研究稀土核心专利技术的演进过程,解决我国稀土专利布局的问题,本文利用Lingo文本聚类算法对国内外稀土领域专利信息进行了深入的分析,研究和探索了稀土萃取领域专利申请主体的迁移和研究主题的变迁,并通过可视化的专利地图加以展示。本文的研究结果为我国追踪稀土萃取专利研究热点提供一定的借鉴和参考,对于我国企业专利信息应用、技术研发和知识产权规划布局具有重要意义。  相似文献   

19.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

20.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号