一种基于结构信息总结树的XML文档聚类方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于结构信息总结树的XML文档聚类方法

作者姓名：	梁作鹏吴文明董逸生

作者单位：	东南大学计算机科学与工程系, 江苏南京 210096

摘要：	提出一种有效的XML文档结构信息表达方法,用数字化的结构总结树SST对XML文档的结构信息进行编码,在此基础上给出结构距离的定义,并采用遗传算法对XML文档进行聚类.实验证明该方法分类准确率高,易于实现,且不需先验的DTD知识.
关键词：	文档聚类 SST (结构总结树) 信息检索遗传算法 XML
文章编号：	0255-8297(2005)01-0071-04
收稿时间：	2003-11-01
修稿时间：	2004-03-15
本文献已被 CNKI 维普万方数据等数据库收录！
	点击此处可从《应用科学学报》浏览原始摘要信息
	点击此处可从《应用科学学报》下载全文