首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 849 毫秒
1.
一种基于区间数多指标信息的聚类方法   总被引:3,自引:0,他引:3  
针对一类特征指标值及指标权重均为区间数的多指标信息聚类问题,给出了一种最大树聚类分析方法·首先对区间数多指标信息聚类问题进行了描述;然后依据传统的基于数值信息的最大树模糊聚类分析方法的基本思路,给出了解决区间数多指标信息聚类问题的计算步骤·最后,通过给出一个算例说明了所给出的聚类方法·  相似文献   

2.
针对一类特征指标值和指标权重均为语言评价信息的聚类问题,提出了一种新的聚类分析方法.首先对基于多指标语言评价信息的聚类问题进行了描述;然后依据传统的基于数值信息的编网模糊聚类分析方法的基本思路,在将语言短语转换成三角模糊数的基础上,给出了解决多指标语言评价信息聚类问题的计算步骤.最后,通过给出一个算例说明了所提出的聚类分析方法.该聚类方法拓宽了编网聚类分析方法在解决基于多指标语言评价信息聚类方面的应用.  相似文献   

3.
针对特征指标和权重指标均为区间数的多指标信息聚类问题,在传统的数值信息最大树聚类法的基础上,给出了基于区间数的多指标信息聚类问题的一种具体算法.在此过程中,加权相似矩阵的提出克服了属性权重对聚类产生的双重影响;并通过引入相对贴近度的概念,对相似区间进行排序.最后,通过实例验证了此算法的有效性.  相似文献   

4.
现有话题检测的主要方法是利用Single-Pass及其改进算法进行聚类分析,没有考虑文本的结构特点,相似度计算方法单一,从而影响准确度.针对此问题,改进了Single-Pass的相似度计算方法,综合考虑文本的标题、摘要、时间、地名以及来源等要素,采用层次分析法计算并赋以不同权重,提出一种多相似度计算组合策略.考虑到食品安全是一个广受关注的话题,实验通过网络爬虫抓取并筛选了最近3年食品安全方面的媒体信息,以此作为数据进行分析,结果表明,采用本文提出的改进Single-Pass聚类算法,话题检测准确度更高.  相似文献   

5.
聚类分析是数据挖掘与知识发现领域的一个重要研究方向.多数聚类算法中相似性是其核心概念之一,对象之间的相似性会被直接或者间接的计算出来.传统的相似性度量方法多是基于单一的粒度去观察两个被测对象.在人类认知过程中,通常采用多粒度来更合理有效地进行问题求解.本文借鉴人类的这种多粒度认知机理,提出一种新的相似性学习方法,称作全粒度相似性度量方法,基于此发展了一种全粒度聚类算法.而全粒度相似性度量从各个角度观察被测对象,进而会得到两个对象间更加真实的相似度.从UCI数据集中选取5组数据进行实验,最后通过与两种传统的聚类方法比较验证了全粒度聚类算法的合理性与有效性.  相似文献   

6.
针对具有不确定性区间数信息的聚类分析问题,提出了一种新的聚类分析方法·该方法的基本思路是:首先通过引入具有风险态度因子的区间映射函数,将区间数聚类信息映射为点值聚类信息,并使要研究的问题转化为传统的模糊聚类问题;然后在此基础上给出了基于编网的聚类方法;进一步地,可通过选取不同的风险态度因子对聚类分析结果进行灵敏度分析·该分析方法具有简单、实用的特点,它克服了研究此类聚类问题时所遇到的区间数难以排序的问题·在文中最后,通过给出一个算例说明了该方法的应用·  相似文献   

7.
文本数据具有高维、稀疏、海量的特性,给传统的聚类算法带来了极大挑战.提出一种基于t-分布随机近邻嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)的文本聚类方法.首先通过t-SNE将高维文本数据嵌入到低维空间,使得高维空间相似度较低的文本对应的映射点距离较远,而相似度较高的文本对应的映射点距离较近;然后根据低维空间映射点坐标,再采用传统的聚类分析算法进行聚类,得到最终的聚类结果.在多个基准文本数据集上进行了实验测试,验证了该方法的有效性.  相似文献   

8.
针对利用k-均值聚类算法形成发电系统充裕度评估中的聚类负荷模型时存在的聚类中心初始值和聚类数难以确定的问题,提出根据负荷水平对充裕度指标的贡献度,将负荷曲线分成高贡献度、中等贡献度、低贡献度等分区,分别采用层次聚类、均值-标准差、随机法来选择各分区中聚类中心初始值;定义改进效率指标,将改进效率作为收敛条件确定聚类数.利用本文方法所得的聚类负荷模型,采用状态抽样法计算IEEE RTS79电力系统可靠性测试系统的发电系统充裕度指标.算例结果表明,同采用基于传统k-均值聚类方法的负荷模型结果相比,基于混合聚类方法得出的负荷模型的计算结果更精确,收敛速度更快.  相似文献   

9.
针对文本在聚类或分类时,由于数据高维稀疏导致相似度值低的问题,提出一种基于改进文本相似度计算的聚类方法.首先,利用向量空间模型VSM表示文本,采用余弦函数计算文本之间的相似度;然后,基于网络中节点的相似性传播原理,通过设置阈值找到与各个文本相似度较大的文本集合,进而使用Jaccard系数将两个文本之间相似度计算转化为两个文本集合之间的相似度计算;最后根据得到的文本相似度矩阵,利用谱聚类算法对文本进行聚类.在WebKB上的实验结果表明,与传统的K-means、谱聚类方法相比,该方法提高了聚类的准确度,召回率与F值.  相似文献   

10.
针对传统聚类分析中,指标权重一般由专家直接给出,然后再在此基础上进行聚类分析的不足,提出了一种基于部分样本类别判定的聚类分析方法.首先对部分样本进行类别归属判定,然后利用类内聚类样本之间的距离应尽可能小的原理建立规划模型,通过"反推"的方式诱导出合理的权重信息,再据此进行样本聚类.该方法主要用于解决聚类样本较多,且聚类样本的指标权重难以显性确定情况下的聚类分析问题.最后给出的一个算例验证了所提方法的有效性.  相似文献   

11.
时空聚类(spatial-temporal density based spatial clustering of applications with noise,ST-DBSCAN)算法只能处理固定属性的时空数据,且其人为设定阈值的方法具有较大随机性会导致聚类结果不理想.基于ST-DBSCAN算法存在的不足,提出了一...  相似文献   

12.
子空间聚类是一种将搜索局部化在相关维上进行的聚类算法,它能有效地克服数据因维度过高引起的在全空间上聚类的困难.针对高维分类型数据,本文提出了一种自底向上的子空间层次聚类算法,该算法在全局范围内建立一个最相似线性表用来记录每个簇类与其最相似的簇类的相似度,在聚类过程中,选取最相似的簇类合并,并通过维护此线性表产生最相似的簇类.此算法在基于信息熵的意义上能够较准确地搜索簇类的子空间.通过Zoo和Soybean两个典型的分类型数据实验发现,相对于其它相关聚类算法,该算法在聚类的准确率和稳定性方面表现出较高的优越性.  相似文献   

13.
一种提高文本聚类算法质量的方法   总被引:1,自引:0,他引:1  
针对基于VSM(vector space model)的文本聚类算法存在的主要问题,即忽略了词之间的语义信息、忽略了各维度之间的联系而导致文本的相似度计算不够精确,提出基于语义距离计算文档间相似度及两阶段聚类方案来提高文本聚类算法的质量.首先,从语义上分析文档,采用最近邻算法进行第一次聚类;其次,根据相似度权重,对类特征词进行优胜劣汰;然后进行类合并;最后,进行第二次聚类,解决最近邻算法对输入次序敏感的问题.实验结果表明,提出的方法在聚类精度和召回率上均有显著的提高,较好解决了基于VSM的文本聚类算法存在的问题.  相似文献   

14.
一种基于语义距离的高效文本聚类算法   总被引:6,自引:0,他引:6  
摘 要:提出了一种基于语义进行文本聚类的新方法。该方法从语义上具体分析文档,利用文档具体语义计算文档间的相似度,使得文档聚类结果更合理。文本聚类主要采用最近邻聚类算法,并提出第二次聚类算法改进最近邻算法对输入次序敏感的问题。类特征词的选择上根据相似度权重优胜略汰类特征词,使得最后类特征词越来越逼近类的主题。实验结果表明本文所提出的算法在聚类精度和召回率上均优于基于VSM的K-Means聚类算法。  相似文献   

15.
结合Web用户浏览行为的特点,提出了一种基于路径的Web页面相似度聚类算法,使用用户的浏览行为描述和用户对页面的访问次数建立Web站点的访问矩阵,并在此基础上对站点进行URL用户聚类。最后,使用标准数据集进行了试验,证明基于此种相似度计算方法的URL聚类算法对Web用户聚类是有效的。  相似文献   

16.
适用于集群无人机的自组网安全分簇算法   总被引:1,自引:0,他引:1  
集群无人机自组网的节点数量多、移动速度快,适合采用分簇的网络拓扑结构,而安全的分簇算法是簇结构自组网安全性的重要基础。分析了集群无人机自组网的特点和其对安全分簇算法的需求,提出了一种适用于集群无人机自组网的安全分簇算法,该算法结合使用密码机制和信任机制来保证网络分簇过程中的信息安全并且选出可信度较高的簇首,分析证明了其具有较高的安全性和可行性。  相似文献   

17.
提出了不确定型时序多属性群决策的新问题,并选用区间数处理方法对不确定型时序多属性群决策方法进行了研究.构建了能同时兼顾线性算子与非线性算子特点的区间数组合加权平均算子,并针对信息集结中综合评价结果对集结路径的依赖问题,确立了基于偏差缩减的多路径集成思路,同时给出了偏差最小法、可靠性加权法、客观差异法等3种合成方法.最后,将上述方法用于目前理论及实务界广泛关注的服务创新方案选择问题中,验证了其有效性.  相似文献   

18.
为了有效提高文本聚类的质量,用聚类过程不断反馈的信息熵改进向量空间模型中特征词权重的计算,构造以文本相似性为基础的抗体-抗原亲和力和抗体浓度计算方法,提出用亲和力和抗体浓度控制的抗体克隆和变异策略寻找聚类中心,并将文本归入与聚类中心相似度最大的类簇.实验表明,该算法可得到聚类质量较高并且稳定性较好的聚类结果.  相似文献   

19.
介绍了一种融合多尺度形态学、蚁群聚类、模糊C-均值(FCM)聚类的新的彩色图像分割方法。该算法首先利用多尺度形态学提取图像边缘,再利用蚁群聚类算法的全局搜索性和鲁棒性的优点并结合边缘信息,确定聚类中心和聚类个数,将其作为FCM聚类的初始聚类中心和聚类个数,克服了FCM算法自身并不能确定聚类中心需要人为设定的缺陷。实验结果表明,该算法可以准确地分割出目标,是一种有效的图像分割方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号