首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种改进的基于树路径匹配的网页结构相似度算法
引用本文:廖浩伟,杨燕,贾真,尹红风.一种改进的基于树路径匹配的网页结构相似度算法[J].吉林大学学报(理学版),2012,50(6):1199-1203.
作者姓名:廖浩伟  杨燕  贾真  尹红风
作者单位:西南交通大学 信息科学与技术学院, 成都 610031
基金项目:国家自然科学基金(批准号:61152001:61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题基金(批准号:20110102);中央高校基本科研业务费专项基金(批准号:SWJTU11ZT08)
摘    要:提出一种改进的基于树路径匹配的网页结构相似度算法, 该算法定义了树路径的序列相似度和位置相似度, 找出网页的树路径集合, 通过网页间的最佳树路径匹配计算结构相似度. 实验结果表明, 用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际, 更合理有效.

关 键 词:网页结构相似度  序列相似度  位置相似度  
收稿时间:2012-05-21

An Improved Web Structure Similarity Based on Matching Algorithm of Tree Paths
LIAO Hao-wei,YANG Yan,JIA Zhen,YIN Hong-feng.An Improved Web Structure Similarity Based on Matching Algorithm of Tree Paths[J].Journal of Jilin University: Sci Ed,2012,50(6):1199-1203.
Authors:LIAO Hao-wei  YANG Yan  JIA Zhen  YIN Hong-feng
Institution:School of Information Science and Technology, Southwest Jiaotong University, Chengdu 610031, China
Abstract:An improved algorithm of Web structure similarity basedon tree path matching was proposed, which defines the sequence similarity and position similarity of the tree path, finds out all the Web tree paths, and calculates the structural similarity by best tree path matching between two Web pages. Experiments show that the proposed algorithm to calculate the Web structure similarity is more realistic and effective than the original algorithm.
Keywords:Web structure similarity  sequence similarity  position similarity  
本文献已被 CNKI 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号