共查询到18条相似文献,搜索用时 125 毫秒
1.
2.
一种基于SOM和层次凝聚的中文文本聚类方法 总被引:2,自引:0,他引:2
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。 相似文献
3.
通过对基因表达数据的聚类分析能够较快地发现肿瘤细胞,较为准确快速地诊断疾病。本文在稀疏主成分的基础上,研究了基于稳定稀疏主成分的基因表达数据聚类分析方法的问题。改进的方法主要应用于解决稀疏主成分的Lasso方法在高维度中缺乏变量选择的一致性。使用直接聚类、主成分聚类、稀疏主成分、稳定稀疏主成分四种聚类方法对2个基因表达数据进行K均值聚类和层次聚类,比较方法的准确率,验证了基于稳定稀疏主成分的基因表达数据的聚类分析方法的准确度更高。 相似文献
4.
《黑龙江大学自然科学学报》2016,(6)
结合现实中数据表现出复杂的多流形特点,对多流形假设下的学习算法进行了研究。利用多种聚类算法对不同类型的数据进行聚类分析,得出每种数据类型下的最优聚类方法。仿真结果表明,采用规范化切割谱聚类方法可将独立子空间高维数据成功分类;SSC算法对线性子空间聚类效果表现最佳;引入LLE的Ncut聚类算法和SMMC算法对于非线性数据的多流形聚类具有较好的效果;SSC算法和SMR算法对高维子空间聚类问题表现出较好的适用性。 相似文献
5.
《黑龙江大学自然科学学报》2016,(4)
基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。 相似文献
6.
人脑对音乐的欣赏和创作过程涵盖了几乎所有的认知过程,包括了知觉、注意、学习、记忆、情绪等,对音乐认知的研究成为认知研究的理想切入点,受到越来越多研究者的关注.对当前独立分量分析(ICA)和聚类方法的有效性和不足进行了分析,提出了将小波包、ICA与聚类相结合的方法用于音乐认知研究的新思路. 相似文献
7.
聚类分析已成为数据挖掘,模式识别等应用领域研究中非常活跃的研究课题.在聚类分析方法中,基于神经网络的算法,由于考虑到“噪声”或异常数据,可以自动确定聚类个数,可以产生鲁棒的聚类方法,而竞争学习神经网络、SOFM神经网络方法是其中有代表性的方法,对其进行了分析研究,并给出了引入可变速度的训练算法。 相似文献
8.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak, CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering, DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%... 相似文献
9.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak,CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering,DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。 相似文献
10.
基于遗传算法的可变加权FCM聚类方法改进研究 总被引:2,自引:2,他引:0
模糊C均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感.利用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行了确定,然后在FCM法中引入指标权重,并给出迭代公式和相应算法.实验结果表明,该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好. 相似文献
11.
使用两种类型的传感器组成无线传感网,通过结合多跳路由和分簇路由两种方式,对混合路由方式设计研究,用NS-2对研究结果进行仿真.将混合路由的仿真结果分别与单独使用分簇路由和多跳路由的仿真结果进行比较,得出新混合路由使得网络周期更长的结论. 相似文献
12.
13.
近几年来,单元化制造系统(CMS)作为一种由于能满足不同客户需求、缩短产品生产周期、提高企业的全球竞争力的先进制造组织模式而备受关注。本文提出了一种新的矩阵聚类方法(HERBAL)设计制造单元,并探讨了该方法与其它聚类方法如ROC、ROC2、DCA等方法在成组效率、成组功效等评价指标上的优劣,证明了该方法的可行性和高效率。同时该方法中的设备_零件矩阵(MCM)中的二元值元素,采用反映实际生产中的流程时间替代,可使聚类结果更符合实际的生产需求。 相似文献
14.
15.
16.
17.
基于分层聚类的k-means算法 总被引:8,自引:0,他引:8
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。 相似文献
18.
四棱豆种质资源遗传多样性的RAPD分析 总被引:5,自引:0,他引:5
对12个四棱豆品种的遗传多样性进行了RAPD分析,6条引物共扩增出41条DNA带,73.2%具有多态性,表明品种间存在较丰富的遗传差异.通过聚类分析,在相似系数0.68的水平上将12个四棱豆品种分为3类,并且该聚类结果与以主要农艺性状为依据进行品种类群划分基本一致. 相似文献