共查询到20条相似文献,搜索用时 375 毫秒
1.
2.
一种基于SOM和层次凝聚的中文文本聚类方法 总被引:2,自引:0,他引:2
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。 相似文献
3.
指出在基层单位员工考评中存在的问题,提出了模糊聚类方法对员工进行量化考评的模型,并给出了聚类数据在管理中的应用。 相似文献
4.
加权Web访问模式聚类算法 总被引:4,自引:0,他引:4
针对Web应用挖掘中聚类算法中的问题,提出加权Web访问模式聚类算法,该算法利用服务器日志库中保存的网页访问次数信息,提高了聚类的客观性和准确性。 相似文献
5.
6.
基于分层聚类的k-means算法 总被引:8,自引:0,他引:8
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。 相似文献
7.
迷彩设计中背景图像聚类方法的比较分析 总被引:5,自引:0,他引:5
迷彩设计中,通过对目标背景的图像信息进行归类处理,利用图像分割技术获取背景斑点,然后设计出与背景亮度和纹理相协调的迷彩图案. 目前,最常用的图像分割方法是均值聚类法,由于它直接利用灰度信息以致分割的细节不明显,容易导致模拟背景纹理失真. 针对它的不足,提出了采用基于自组织特征映射(self organizing feature map,
SOFM)神经网络的分割方法对背景进行聚类分割. 该方法将整幅图像作为神经网络的输入,聚类分割后的颜色作为输
出,按照自组织特征映射网络的学习过程,使用其函数进行迭代运算直至学习停止. 比较实验结果表明,SOFM方法能更好地保留图像的细节纹理,得到较为理想的设计效果. 相似文献
8.
旅游开发利用对水体质量影响的综合评价--以张家界国家森林公园为例 总被引:10,自引:0,他引:10
对已有的水体质量评价模型及聚类权的优缺点进行了分析和比较,确定了最优水质评价模型。对聚类权的计算模型作了改进,提出了新的聚类权计算模型,在此基础上,对张家界国家森林公园境内水体质量进行了评价。结果表明,旅游开发利用已对公园内金鞭溪中、上游的水质造成了较为严重的污染,必须采取有效措施减少公园废水的排放及排放量,同时加强公园污水的净化治理,以实现公园的可持续发展。 相似文献
9.
10.
Web日志模糊聚类算法的研究 总被引:3,自引:0,他引:3
本文提出了一种新的Web事务模糊聚类算法.给出了新的Web事务定义和相异度定义,聚类准则函数是所有样本与C个代表中心的相异度之和,我们的目标是使这个聚类准则函数最小.同时给出了改进算法.经过试验证明,改进的算法更有效. 相似文献
11.
距离测度是度量两个直觉模糊集的重要方法,在聚类分析中被广泛应用.本文基于相异度矩阵的思想,在直觉模糊多属性聚类中,定义了距离测度矩阵,然后根据不同的阚值要求转化为布尔矩阵进行聚类,最后通过实例验证该方法的有效性. 相似文献
12.
《黑龙江大学自然科学学报》2016,(4)
基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。 相似文献
13.
合成了不同联苯类液晶基元,对超支化聚羟甲基醚进行改性,采用红外,核磁确定液晶基元的结构,通过POM,DSC的研究表明,改性超支化聚羟甲基醚表现出液晶性,且为向列型液晶,不同联苯类液晶基元对改性超支化聚羟甲基醚液晶性有较大的影响。 相似文献
14.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak,CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering,DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。 相似文献
15.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果. 相似文献
16.
17.
18.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak, CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering, DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%... 相似文献
19.
基于遗传算法的可变加权FCM聚类方法改进研究 总被引:2,自引:2,他引:0
模糊C均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感.利用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行了确定,然后在FCM法中引入指标权重,并给出迭代公式和相应算法.实验结果表明,该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好. 相似文献
20.
通过对基因表达数据的聚类分析能够较快地发现肿瘤细胞,较为准确快速地诊断疾病。本文在稀疏主成分的基础上,研究了基于稳定稀疏主成分的基因表达数据聚类分析方法的问题。改进的方法主要应用于解决稀疏主成分的Lasso方法在高维度中缺乏变量选择的一致性。使用直接聚类、主成分聚类、稀疏主成分、稳定稀疏主成分四种聚类方法对2个基因表达数据进行K均值聚类和层次聚类,比较方法的准确率,验证了基于稳定稀疏主成分的基因表达数据的聚类分析方法的准确度更高。 相似文献