首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于兴趣相似性的Web用户聚类   总被引:8,自引:0,他引:8  
按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.  相似文献   

2.
基因聚类结果的内部确认技术研究   总被引:3,自引:0,他引:3  
聚类分析是后基因组时代基因表达数据处理的主要技术之一.聚类确认是聚类分析过程中的必要环节,其目的是对聚类结果的质量和聚类算法的性能进行评估,有助于聚类结果的注释.选择有效的确认函数是正确评价聚类结果的前提.文中采用分层聚类、K-均值聚类和SOMs算法对标准基因表达数据集进行聚类分析,研究了Silhouette指数、Dunn's指数、Davies-Bouldin指数及FOM(Figure of merit)测量等内部确认函数在基因聚类分析中评价聚类结果质量的有效性.结果表明:Silhouette指数和FOM测量能较好地反映聚类算法的性能和聚类结果的质量,Dunn's指数因其对噪声的高度敏感性不能直接用于基因聚类结果的确认,Davies-Bouldin指数确认算法的能力好于Dunn's指数,但偏爱单连接聚类.上述研究结论将为基因聚类分析中聚类算法的评估与聚类结果的确认提供有价值的参考依据.  相似文献   

3.
采用基于划分的空间聚类方法对地理要素进行聚类时,若仅考虑属性数据,得到与实际空间分布不相符的聚类结果。提出一种考虑空间对象属性特征和空间位置关系的谱聚类方法,首先,计算空间对象的局部离群指数,结合空间格局将样本中的异常点剔除,然后以空间临近为约束条件进行谱聚类分析。以包头地区土壤重金属形态数据为例进行聚类分析,分析结果表明:该方法能够克服谱聚类对初始聚类中心敏感的问题,既能反映属性特征数据的相似程度,又能反映对象的空间分布特性,对空间对象的聚类分析效果优于传统的谱聚类算法。  相似文献   

4.
通过使用聚类分析的方法来进行P2P的流量识别.首先给出P2P流量的特征,接着定义聚类特征树,然后通过扫描从网络中截得的数据得到相应的初始聚类树,最后计算初始聚类的贝叶斯信息准则值得到最终聚类结果.该方法能有效利用存储空间,避免了存储所有数据对象.同时还能够根据数据特征自动得到聚类数目,减少人为因素的影响,与K均值算法相比较优.  相似文献   

5.
对于数量较大、维度较多、较为复杂的聚类对象,系统聚类较为复杂; 而模糊综合评判聚类方法聚类结果不够准确,其个数难以控制。为此,提出基于模糊综合评判的系统聚类算法,该方法对较为复杂的、由多种因素制约的事物或对象进行模糊综合评判处理,提取对象的整体特征,运用系统聚类对其进行聚类分析。最后通过对5 个班级的多次考试成绩进行了聚类分析,验证了该算法的有效性。实验结果表明,该方法具有准确性、整体性、可操作性以及简略性等。  相似文献   

6.
考虑对象方向关系的密度聚类算法   总被引:2,自引:0,他引:2  
 聚类分析是数据挖掘的一个重要研究方向.为了在大规模空间数据库中发现任意形状的聚类,Martin Ester等提出基于密度的聚类算法DBSCAN.针对DBSCAN处理聚类边界对象的不足,提出了聚类时考虑对象方向关系的改进算法,实验表明,改进算法在不改变时间、空间复杂度的情况下能得到更好的聚类结果.  相似文献   

7.
针对交通数据流聚类分析过程中生成顺序的不确定性,提出了采用基于网格和密度的D-Stream算法对交通数据流进行聚类分析,并将粒子群优化算法引入聚类过程,从而对数据流聚类分析方法进行了改进,使数据聚类能够根据本身的密度极大值有序生成,增强了用户对聚类过程的控制能力.通过昆明市实测交通数据流进行聚类分析,得到了能够反映交通状况不同特征的聚类结果和动态的控制策略,并对交通数据流的相关研究工作提供决策支持.  相似文献   

8.
特征选择得到的识别特征可以用于聚类分析,提高聚类分析的质量.受数据自表示特性和双图规则化学习的启发,提出了一种新的特征选择聚类算法.利用数据和特征的自表示特性,不仅保留了数据的流形信息,而且保留了特征空间的流形信息.此外,为了充分发挥双图模型的作用和鉴别局部聚类的效果,加入局部判别特征选择聚类,大大提高了聚类的有效性和...  相似文献   

9.
聚类分析要求较高聚类质量和快速响应能力,各行业数据仓库中的大量、高维数据对算法的效率提出了更大的挑战.CURE算法能够提供高质量聚类结果但不满足联机聚类要求.结合数据仓库数据不定期批量、增量更新的特点,提出了一种新的增量式CURE聚类算法——InCURE,利用对象的互连性和近似度,保持原算法的动态聚类特性的同时大大缩短聚类时间.5维、20维、50维的大量数据实际测试表明无论低维还是高维数据,InCURE都比CURE具有更高的效率,适合数据仓库环境下的增量式聚类分析.  相似文献   

10.
空间聚类分析是空间数据挖掘的一种方法,空间聚类分析能从空间数据库中直接发现一些有用的聚类结构。在此引入了一种基于邻接关系的空间聚类算法,该算法可以实现对空间复杂地理对象的聚类分析。在具体的模拟试验中,利用该算法可以将相邻的并且符合选取条件的空间目标聚类成一类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号