首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于结构信息总结树的XML文档聚类方法
作者姓名:梁作鹏  吴文明  董逸生
作者单位:东南大学计算机科学与工程系, 江苏南京 210096
摘    要:提出一种有效的XML文档结构信息表达方法,用数字化的结构总结树SST对XML文档的结构信息进行编码,在此基础上给出结构距离的定义,并采用遗传算法对XML文档进行聚类.实验证明该方法分类准确率高,易于实现,且不需先验的DTD知识.

关 键 词:文档聚类  SST (结构总结树)  信息检索  遗传算法  XML  
文章编号:0255-8297(2005)01-0071-04
收稿时间:2003-11-01
修稿时间:2004-03-15
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《应用科学学报》浏览原始摘要信息
点击此处可从《应用科学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号