首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 86 毫秒
1.
提出了一种基于图结构的文本聚类方法,采用基于图结构的文本表示方法来构建文本的图结构模型,将一个文本映射为相应的图结构,通过最大完全公共子图的求解计算文本间相似度,并进行聚类。实验结果验证了该方法的有效性。  相似文献   

2.
提出了一种基于自适应游程平滑算法和基于改进的最小张树聚类的文本行分割算法,该算法基于图的集成聚类的框架用以进一步解决文本行分割的问题,该框架可以很容易地推广到对更多的单一算法进行融合.在该融合框架中,由对应于连通部件的顶点以及顶点对之间的边构成文档图,边上的权值由两个单一文本行分割算法的结果决定.于是,文本行分割的任务就转化为如何以最小代价对文档图进行划分的问题.该融合算法在哈尔滨工业大学多人手写数据库上取得了较好的效果,召回率为99.31%,错误率为0.94%.  相似文献   

3.
针对传统聚类算法存在挖掘效率慢、 准确率低等问题, 提出一种基于最小生成树的多层次k-means聚类算法, 并应用于数据挖掘中. 先分析聚类样本的数据类型, 根据分析结果设计聚类准则函数; 再通过最小生成树对样本数据进行划分, 并选取初始聚类中心, 将样本的数据空间划分为矩形单元, 在矩形单元中对样本对象数据进行计算、 降序和选取, 得到有效的初始聚类中心, 减少数据挖掘时间. 实验结果表明, 与传统算法相比, 该算法可快速、 准确地挖掘数据, 且挖掘效率提升约50%.  相似文献   

4.
一种支持向量聚类的快速算法   总被引:7,自引:0,他引:7  
为了降低支持向量聚类(Support Vector Clustering,SVC)的运算复杂性,基于Yang等提出的邻近图法,用Merce[’核来表达Hilbert空间中的Euclidean距离,以此作为边的权重度量来生成最小生成树(Minimum Spanning Tree,MST),并只对MST的主干进行SVC连接运算.文中还定义了不相容性度量,并将其作为SVC连接运算中边的选择依据.试验证明,改进后算法的运行速度及聚类效果均优于邻近图法,特别是对大数据集的处理具有明显的优势,且具有一定的抗噪能力.  相似文献   

5.
宗瑜  金萍 《皖西学院学报》2005,21(5):108-112
聚类分析是重要的数据挖掘技术,在科学研究、工程应用等领域有着广泛的应用背景。由于经典聚类算法的时间复 杂度高、聚类质量低,因此不适合处理图像分析。本文提出的网络流聚类算法则是一种新型的图像信息分析的算法,它适用于图 像分析、分割和聚类,并且具有线性的算法时间复杂度。  相似文献   

6.
介绍了一种简单、有效的三维网格分割算法.该算法是基于最小化最大类内误差的聚类方法.先将表面网格转换成连接图,通过最短路径定义任意两个三角形之间的“距离”,然后利用新的距离度量将传统的聚类算法应用到网格表面分割问题.提出的算法不仅确保使最大类内距离实现最小,而且可以确保每个类别的所有三角形都构成网格表面上单独的一片.提出了一种受限边界直化算法,极大改善了分割后的区域形状.实验表明,这种两步(最小化最大类内距离聚类和受限边界直化)的网格分割算法在区域平面性和区域形状方面都表现出了良好效果.  相似文献   

7.
Kmeans与系统聚类法结合在脑电图中的应用   总被引:1,自引:0,他引:1  
付春梅  刘俊宁 《科技信息》2007,(29):191-192
本文引入了系统聚类法和kmeans聚类法相结合对脑电图中某个时间段上的频率进行聚类的方法,由于待聚类的数据集的分布很难确定,因此采用系统聚类法往往效果不够理想,本文先用kmeans法测试聚成几类能得到较好的结果,然后设置系统聚类中类数目,试验表明能取得较好的结果。  相似文献   

8.
介绍了广播路由选择方式中的生成树算法 ,提出了用图的广度遍历算法来实现生成树的思想  相似文献   

9.
连通图的生成树是指该图的极小连通生成子图.通过Cayley公式、递推关系式及伪类环图与伪类环图生成树数之间的关系式给出伪类环图-Sn,-An的生成树数.  相似文献   

10.
研究了二进制概念聚类相似度定义,在正特征距离(PAD)的基础上,提出了广义正特征距离(GPAD)用于计算样本之间的相似度,并将系统聚类算法应用到实例中,所得结果与PAD距离比较,取得较好的效果。  相似文献   

11.
针对当赋权连通图中存在权值相同的多条边时,传统的Kruskal算法不能计算出全部的最小生成树,提出了求解最小生成树的改进算法.实验结果表明,改进算法可以得到一个赋权连通图的所有最小生成树,进而为决策者提供更全面的最优决策方案.  相似文献   

12.
设G是连通图,G中任意两点之间的电阻距离定义为将G中的每条边用电阻(通常用单位电阻)代替后所得到的电网络中这两个节点之间的等效电阻.综述了电阻距离领域的研究进展和重要研究成果,包括电阻距离的计算公式、电阻距离的性质、电阻距离的和法则、电阻距离的递推公式以及若干重要图类的电阻距离解析计算公式.最后,给出了电阻距离研究领域...  相似文献   

13.
图之间的距离度量一直是研究的难点之一。文中提出了一种基于图谱归一化编辑距离的聚类方法。首先利用图的谱方法实现图中点的排序,再用串编辑距离进行两图之间的相似性度量,以此距离构成的不相似矩阵,应用基于矩阵理论的聚类算法实现序列图的聚类研究。考虑到图中点的多少差异,给出归一化串编辑距离的方法解决长短谱序列间距离差异误差问题。实验表明,基于图谱归一化编辑距离的聚类方法是有效的。  相似文献   

14.
文章提出基于语义相似度的Web文档聚类算法--WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阚值,并对最小树中进行切割,同时对较小的子类进行划分合并.实验表明,WECSS不仅能为具有各种不同聚类形状的数据集准确地分析出数据中存在的合理聚类和例外样本,而且避免了用户参数选择所造成聚类质最降低问题.  相似文献   

15.
李敬杰  李乔 《上海交通大学学报》2001,35(11):1730-1732,1736
设T是图G的一颗支撑树,若某顶点u满足;对任意顶点υ均有dG(u,υ)=dT(u,υ),则称u对于支撑树T是RP,如果对G的任一棵支撑树都至少存在一个RP点,则称图G是RP图,Gagliardi等在1997年证明了K2,n是一类RP图,并猜想:“K2,n以及在其顶点上加上若干树状结构所得的图是仅有的RP图”。但容易验证圈Cn也是一类RP图,因此上述猜想需要修正,本文证明了RP图的如下特征刻划:除树外,简单图中只有K2,n和Cn 以及在某若干顶点上分别外接互不相交的树状结构所得的图是RP的。  相似文献   

16.
图的直径是图中两点距离的最大值,图G的平均距离,记作D(G),它是图的任两点距离的平均值。在网络分析中,图的直径和平均距离是重要的示性数。该文对某些较简单的图类:简单圈、树等的平均距离进行估算,证明了若G是直径不超过3的n阶连通图,则它的平均距离至多是n/δ+1,这里δ是G的最小度。最后,对n阶连通图的平均距离的上界提出了一个猜测  相似文献   

17.
在风格投资分析中,传统的参数分析方法将带来分析结果的多样性,为此提出了采用具有准确拓扑序列的亚超度量空间方法.首先,计算出股票间任意两个股价间的相关系数,并在此基础上计算出超度量空间的欧式距离;其次,利用Kruskal的最小生成树算法,构建出证券组合的亚超度量空间;最后,将亚超度量空间映射为指数分层结构.对2005年7月至2007年12月的辽宁省上市公司样本的日数据进行实证研究,结果发现存在行业风格、事件风格、业绩风格及现金流风格,这表明亚超度量空间方法是有效的.  相似文献   

18.
引入Vague集(值)的距离概念及Vague集(值)的贴近度概念,并证明了这一新的贴近度的性质.利用此贴近度概念给出了基于Vague集的模糊聚类方法,这一方法对于数据挖掘研究有很好的参考价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号