期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李向利毕胜王佩源《重庆师范大学学报(自然科学版)》2023,40(5):136-144

图像聚类是当前的研究热点，非负矩阵分解（non-negative matrix factorization, NMF）算法在图像聚类领域得到了广泛应用。但是单一的NMF算法无法应用于所有数据集，并且NMF算法直接在数据的原始空间进行处理，抗噪能力较差。集成聚类可以解决上述问题，集成聚类将若干个基础聚类结果合成一个一致性结果，不仅可以提高聚类的求解质量，还可以增强算法的鲁棒性。因此本文提出一种层次预处理的NMF加权集成聚类算法。该算法将层次划分、集成聚类和二部图的思想引入到NMF算法中。在预处理阶段，利用层次划分得到聚类数目。之后采用局部加权的方法得到协关联矩阵。最后利用基于二部图的一致性函数进行划分得到最终的聚类结果。在5个数据集上进行实验，验证了本文算法相对于传统算法和其他集成算法的有效性。相似文献

2.

一种提高文本聚类算法质量的方法 总被引：1，自引：0，他引：1

冯少荣《同济大学学报(自然科学版)》2008,36(12)

针对基于VSM(vector space model)的文本聚类算法存在的主要问题,即忽略了词之间的语义信息、忽略了各维度之间的联系而导致文本的相似度计算不够精确,提出基于语义距离计算文档间相似度及两阶段聚类方案来提高文本聚类算法的质量.首先,从语义上分析文档,采用最近邻算法进行第一次聚类;其次,根据相似度权重,对类特征词进行优胜劣汰;然后进行类合并;最后,进行第二次聚类,解决最近邻算法对输入次序敏感的问题.实验结果表明,提出的方法在聚类精度和召回率上均有显著的提高,较好解决了基于VSM的文本聚类算法存在的问题. 相似文献

3.

图像分割的谱聚类集成算法 总被引：2，自引：2，他引：0

贾建华焦李成柳炳祥《西安交通大学学报》2010,44(6)

针对谱聚类算法对尺度参数敏感的问题,利用集成学习算法良好的鲁棒性和泛化能力,提出了一种无监督集成学习算法——谱聚类集成算法.该算法先利用谱聚类的内在特性产生集成学习所需的多个聚类个体,再采用Hungarian算法对生成的聚类个体进行重新标记,计算每个样本点关于每一个类别所占的比例,得到一个成分向量,然后运用对数比变换将所得的成分向量映射到另一个空间,去除成分数据的不适定性,最后对映射后的数据进行聚类,从而得到最终的集成结果.通过对UCI数据集和纹理图像的仿真实验表明,所提算法的聚类准确率与常用的共识函数具有一定的可比性,且运算代价较小,所需时间大约为MCLA算法的一半,同时避免了精确选择谱聚类算法的尺度参数. 相似文献

4.

四维文档向量模型的k-means新闻文本聚类算法

高飞鱼江任芳黄保瑞次旺多吉《西藏大学学报》2013,(1):109-112

传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法. 相似文献

5.

基于核函数的最大间隔聚类算法 总被引：8，自引：0，他引：8

阎辉张学工李衍达《清华大学学报(自然科学版)》2002,42(1):132-134

提出了基于最优超平面与支持向量机思想的最大间隔聚类算法。该方法借鉴了最优超平面思想和用核函数非线性映射构造支持向量机的思想。通过构造一个二次规划问题 ,得到了使分类后两类间距最大的聚类方法 ,并且借助非线性核函数将该方法推广到非线性情况。仿真试验表明 :该方法可以较好地解决很多非监督分类问题 ,得到的结果基本不受数据分布形状的影响相似文献

6.

四维文档向量模型的k-means新闻文本聚类算法

高飞鱼江任芳黄保瑞次旺多吉《西藏大学学报》2013,(4)

传统3DVM(3-Dimension Document Vector Model)由于没有使用新闻报道的时间因子,这使得该模型表示的新闻报道具有不准确性,进而影响新闻报道的聚类结果.本研究在三维文档向量模型的基础上加入了时间因子,提出了四维文档向量模型表示新闻报道.最后,用k-means聚类算法进行新闻报道的的无监督聚类.实例验证结果表明本文提出的4DVM和k-means相结合的聚类算法优于3DVM以及VSM(vector space mode)和k-means相结合的聚类算法. 相似文献

7.

基于词间语义相关度的搜索结果聚类算法 总被引：1，自引：1，他引：0

沙芸张国英《郑州大学学报(理学版)》2009,41(1)

将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高. 相似文献

8.

一个基于谱图分割的简单聚类算法

田娟王崇骏李静陈兆乾《复旦学报(自然科学版)》2004,43(5):810-814

目前谱聚类在文本分类、图像分割和信息检索等领域的应用越来越引起研究者的重视,并取得了一定的成果、但是,大多数已有的谱聚类算法需要事先给定聚类数．在k-means算法、EM等聚类方法中也存在相似的问题、在此介绍了一种简单的容易实现的谱聚类算法,可以自动确定合适的聚类数．实验表明本算法结果很好、相似文献

9.

基于成对约束的主动学习半监督聚类算法

蒋伟进许宇晖郭宏许宇胜王欣《应用基础与工程科学学报》2014,(6)

半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能. 相似文献

10.

利用本体技术的文本聚类模型

李少博邸书灵范通让《河北省科学院学报》2014,(2):79-82

文本聚类作为一种自动化程度较高的无监督机器学习方法,能够实现对文本信息的有效组织、摘要和导航,近年来已经广泛应用在信息检索领域。笔者针对使用向量空间模型进行聚类时对于同义词和多义词的处理存在的缺陷,提出了基于本体的文本聚类模型。首先使用WordNet词典对文档中的词进行语义标注,得到文档的概念集合;然后对每个文档的概念集合进行概念聚类,生成文档的概念主题;最后通过计算主题的相似度完成文本聚类。该模型减少了相似度计算量,改善了聚类结果和聚类性能。相似文献

11.

基于改进后缀树算法中英文聚类引擎的实现

胡海龙孙晨赫枫龄左万利《吉林大学学报(理学版)》2009,47(2):299-304

提出一种基于改进后缀树与交互聚类思想相结合的算法ISTC算法, 通过改造传统后缀树结构实现了对文档标题和摘要的层次化聚类, 同时用交互聚类的方式替代了传统的递归算法. ISTC算法具有语言无关性, 不仅适用于基于单词的西方文字, 而且可以在不引入词典分词技术的情况下有效地处理基于单字的中文字符. 在此算法基础上, 设计并实现了基于改进后缀树算法的交互聚类引擎, 在不同的网络环境下对其进行了系统测试, 并与其他元搜索引擎进行了对比. 实验结果表明, 使用改进后缀树算法进行实时交互式聚类是可行的. 相似文献

12.

基于遗传算法的动态文本聚类 总被引：1，自引：0，他引：1

乐兵王明文《江西师范大学学报(自然科学版)》2006,30(3):278-281

为了解决动态文本聚类中聚类中心陷于局部极值点的问题,该文提出了基于遗传算法的动态文本聚类方法.采用二进制编码方式对聚类中心进行编码、类内中的点与其类中心的欧氏距离作为适应度函数.通过遗传算子的操作对类中心进行逐步迭代,直至适应度函数收敛,得到使聚类划分效果最好的聚类中心.实验表明该方法可以克服局部极值点的问题,且聚类结果的评价指标Purity(纯度)也比较好. 相似文献

13.

Web文本聚类的研究与实现

贾丙静吴长勤葛华《长春师范学院学报》2011,(6):26-29

Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-means算法等相关技术。最后,实现了该文本聚类系统,对采集到的Web文本进行聚类,实验证明此算法具有很好的聚类结果。相似文献

14.

结合差分进化与K均值的Web文档聚类算法研究

姜凯左风朝《聊城大学学报(自然科学版)》2012,(1):93-97

为解决文档聚类问题,提出一种基于差分进化的聚类算法,通过把文档聚类问题建模为优化问题,对聚类准则函数进行优化,来寻找初始最优聚类中心.在此基础上,进一步提出两种差分进化算法与K均值结合的混合方法,来获得更好的聚类结果.实验表明,与经典K均值算法相比,新提出的两种混合方法能够获得较好的聚类质量. 相似文献

15.

一种鲁棒的无监督聚类图像分割算法

胡雅婷李长明柳振鑫任虹宾陈营华《吉林大学学报(理学版)》2002,57(6):1425-1430

针对目前基于模糊C-均值聚类图像分割算法的噪声敏感问题, 提出一种基于无监督可能性聚类的自动加权图像分割算法. 该算法先应用均值漂移迭代确定可能性C-均值聚类算法的初始化中心, 利用可能性聚类的模式搜索性质自动确定聚类划分; 然后根据像素间灰度值关系进行图像加权, 通过将加权系数与像素噪声的可能性相关联, 降低噪声对图像分割的影响. 实验结果表明, 相对于基于模糊C-均值聚类的图像分割算法, 该算法不仅取得了较好的分割效果, 而且无监督分割时计算效率更高, 对噪声的鲁棒性更强. 相似文献

16.

基于连通图动态分裂的聚类算法

邓健爽郑启伦彭宏邓维维《华南理工大学学报(自然科学版)》2007,35(1):118-122

当前大部分的聚类算法都难以处理任意形状和大小、存在孤立点和噪音以及密度多变的簇,为此,文中提出了一种基于连通图动态分裂的聚类算法.首先构造数据集的l-连通图,然后采用动态分裂策略对l-连通图进行分割,把数据集分成多个互不相连的连通图子集,每个连通图子集为一类.实验结果表明,所提出的算法能够有效地解决任意形状和大小、存在孤立点和噪音以及密度多变的簇的聚类问题,具有广泛的适用性. 相似文献

17.

局部特征聚类联合区域增长的桥梁裂缝检测

贺福强平安罗红姚学练《科学技术与工程》2019,19(34):272-277

针对传统裂缝检测算法抗干扰能力弱,浅层裂缝易误判等问题,提出一种局部特征聚类联合区域增长的桥梁裂缝检测算法。首先,针对混凝土表皮脱落及渗水等干扰问题,采用Gauss-Frangi双重滤波对图像模糊化处理,退化噪声的特征信息,并增强图像中的线性结构。其次,针对常规算法无法识别弱特征的浅层裂缝问题,根据局部区域裂缝点间的空间相关性,提出基于网格聚类联合区域增长算法实现局部区域裂缝的动态分割。最后,针对分割图像中伪裂缝等顽固噪声,提出一种基于形状特征及结构相似性原理方法剔除噪声。实验表明,所提算法可检测出更多的裂缝细节信息,且保持较高的精确率,提高了裂缝图像分割质量。相似文献

18.

一种基于集合划分的鲁棒性自适应模糊聚类分割算法

朱威威赵岩松李艳灵《信阳师范学院学报(自然科学版)》2019,(1):146-152

模糊C均值算法(FCM)是图像分割最常用的算法之一,这种方法需要提前确定初始聚类中心和聚类数.为此,提出了一种新的自适应模糊聚类算法(AFCM),AFCM算法中构造的观察矩阵、判断矩阵和集合划分可以自动确定合适的聚类数.为了得到更好的图像分割效果,采用核距离作为相似性度量,提出了一种鲁棒性自适应模糊C均值算法(RAFCM).实验结果表明,与FCM算法相比,AFCM和RAFCM算法不仅能自动地确定聚类数目,还可以得到更好的图像分割质量. 相似文献

19.

改进的基于后缀树的Web搜索结果聚类算法

董亚则李万龙李航郑山红《吉林大学学报(信息科学版)》2016,34(4):543-549

为提高Web 搜索精度和检准率, 在后缀树聚类算法基本模型的基础上, 提出了一种改进的基于后缀树的搜索结果聚类算法。将向量空间模型与后缀树聚类相结合, 改善了基类合并的效果, 综合基类节点对应文本数、短语包含词语长度、短语权重及是否包含查询词作为聚类标签的筛选条件, 改进了聚类标签的合理性和可读性。以搜狗语料库中的文本分类语料库为数据源进行的实验结果表明, 该方法在一定程度上提高了聚类结果的准确率。相似文献

20.

一种基于黑洞算法的模糊C均值文本聚类方法

柳玉辉王伟超孟磊《东北大学学报(自然科学版)》2017,38(8):1065-1069

FCM算法应用于文本聚类时,由于初始聚类中心点选择的随机性,以及容易陷入局部最优的问题,导致文本聚类效果较差.为了提高FCM算法的聚类精度,提出了采用黑洞算法寻找FCM最优初始聚类中心的方法.黑洞算法是一种启发式优化方法,在FCM初始聚类中心寻优的过程中,始终保持黑洞为全局最优解,最终发现FCM的最优初始聚类中心.实验结果表明,基于黑洞算法的FCM文本聚类方法可以解决FCM算法对初始中心点敏感和容易陷入局部最优的问题,聚类精度明显提高. 相似文献