首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于概念分析的主题爬虫设计
引用本文:汪涛,樊孝忠,顾益军,刘林.基于概念分析的主题爬虫设计[J].北京理工大学学报,2004,24(10):890-893.
作者姓名:汪涛  樊孝忠  顾益军  刘林
作者单位:1. 北京理工大学,信息科学技术学院计算机科学工程系,北京,100081;炮兵学院,三系,安徽,合肥,230031
2. 北京理工大学,信息科学技术学院计算机科学工程系,北京,100081
基金项目:扬州万方电子技术有限责任公司资助项目
摘    要:研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.

关 键 词:搜索引擎  主题爬虫  概念分析  相关度  信息采集  概念分析  主题爬虫  设计  Analysis  Concept  Based  Crawler  Theme  可操作性  性能  显示  结果  实验  工作  比较  方案  分析算法  主题相关度  关键词  信息采集
文章编号:1001-0645(2004)10-0890-04
修稿时间:2003年11月4日

Design of Theme Crawler Based on Concept Analysis
WANG Tao,FAN Xiao-zhong,GU Yi-jun and LIU Lin.Design of Theme Crawler Based on Concept Analysis[J].Journal of Beijing Institute of Technology(Natural Science Edition),2004,24(10):890-893.
Authors:WANG Tao  FAN Xiao-zhong  GU Yi-jun and LIU Lin
Abstract:Method of improving the design of theme crawler is discussed. A more efficient theme crawler can replace the normal crawler in the traditional search engine to complete directional information collection with higher precision. With the success of the theme crawler based on
Keywords:, an algorithm for computing the degree of correlativity based on concept analysis is proposed, A realization scheme of the theme crawler based on concept analysis is also provided, The experimental result implies improvements in the crawler's performance, The feasibility and the maneuverability are testified, It laid groundwork for exact directional information collection,Key words: search engine,theme crawler,concept analysis,degree of correlativity,information collection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《北京理工大学学报》浏览原始摘要信息
点击此处可从《北京理工大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号