首页 | 本学科首页   官方微博 | 高级检索  
     检索      

PBC:一种基于路径的XML文档聚类方法
引用本文:梁作鹏,业宁,董逸生.PBC:一种基于路径的XML文档聚类方法[J].应用科学学报,2005,23(4):399-403.
作者姓名:梁作鹏  业宁  董逸生
作者单位:东南大学计算机科学与工程系, 江苏南京 210096
摘    要:提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.

关 键 词:XML  信息检索  文档聚类  
文章编号:0255-8297(2005)04-0399-05
收稿时间:2004-04-07
修稿时间:2004-10-29

PBC: A Path-Based Method to Clustering XML Documents
LIANG Zuo-peng,YE Ning,DONG Yi-Sheng.PBC: A Path-Based Method to Clustering XML Documents[J].Journal of Applied Sciences,2005,23(4):399-403.
Authors:LIANG Zuo-peng  YE Ning  DONG Yi-Sheng
Institution:Department of Computer Science & Engineering, Southeast University, Nanjing 210096, China
Abstract:
Keywords:XML  information retrieval  document clustering  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《应用科学学报》浏览原始摘要信息
点击此处可从《应用科学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号