首页 | 本学科首页   官方微博 | 高级检索  
     

基于概念树的主题爬取技术研究
引用本文:曾义聪 杨贯中 刘柯. 基于概念树的主题爬取技术研究[J]. 科学技术与工程, 2005, 5(12): 785-790796
作者姓名:曾义聪 杨贯中 刘柯
作者单位:湖南大学软件学院,长沙,410082;湖南大学软件学院,长沙,410082;湖南大学软件学院,长沙,410082
基金项目:教育部科研基金(200146)资助
摘    要:提出了一种新型主题爬取方法。采用概念树构造主题层次图,赋予待爬取URL对象以层次语义信息,按照语义相关性与重要性选择待爬取URL对象,搜索属于特定语义相关主题的重要Web文档的WWW子集。

关 键 词:概念  概念树  主题爬取  主题层次

Research on Focused Crawling Technology Based on the Concept Tree
ZENG Yicong,YANG Guanzhong,LIU Ke. Research on Focused Crawling Technology Based on the Concept Tree[J]. Science Technology and Engineering, 2005, 5(12): 785-790796
Authors:ZENG Yicong  YANG Guanzhong  LIU Ke
Abstract:A new method of focused crawling is presented. A diagram of topic levels is built using the concept tree. URL objects to be crawled are endowed with semantic information about topic levels by the diagram and selected according to the semantic relevance and importance. It searches only the important subset of the WWW that pertains to a specific topic of semantic relevance
Keywords:concept concept tree focused crawling topic levels  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号