首页 | 本学科首页   官方微博 | 高级检索  
     检索      

搜索引擎的渐增式爬行和备份式更新模式
引用本文:沈文勤,李庆超,邵志清.搜索引擎的渐增式爬行和备份式更新模式[J].华东理工大学学报(自然科学版),2004,30(3):284-287.
作者姓名:沈文勤  李庆超  邵志清
作者单位:华东理工大学计算机科学与工程系,上海,200237;焦作大学计算机工程系,焦作,454003
基金项目:上海市青年科技启明星计划资助项目(99QD14038)
摘    要:介绍了搜索引擎的总体结构,分析了搜索引擎中爬行器的爬行策略和网页库的更新模式。介绍了其中一种较为合理的爬行和更新模式及其实现技术,实现了渐增式地爬行高质量网页和提高网页库新鲜度的目的。

关 键 词:搜索引擎  爬行器  网页库  更新策略
文章编号:1006-3080(2004)03-0284-04
修稿时间:2003年6月14日

Incremental Crawling and Shadowing Update Strategy in Search Engines
SHEN Wen-qin,LI Qing-chao,SHAO Zhi-qing.Incremental Crawling and Shadowing Update Strategy in Search Engines[J].Journal of East China University of Science and Technology,2004,30(3):284-287.
Authors:SHEN Wen-qin  LI Qing-chao  SHAO Zhi-qing
Institution:SHEN Wen-qin~1,LI Qing-chao~2,SHAO Zhi-qing~
Abstract:This paper analyses the general architecture of search engine, especially the design and (implementation) technology of the crawling and update strategy, the crawler can download "high quality" Web pages incrementally and maintain the "freshness" of the Web repository.
Keywords:search engine  crawler  Web repository  update strategy
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号