首页 | 本学科首页   官方微博 | 高级检索  
     

网页数据库动态同步技术研究
引用本文:许文韬. 网页数据库动态同步技术研究[J]. 华东师范大学学报(自然科学版), 2006, 2006(1): 108-115
作者姓名:许文韬
作者单位:华东师范大学信,息科学与技术学院,上海,200062
摘    要:通常搜索引擎网站都有存储大量远程站点复制网页的数据库.为保持复制网页和源网页的同步,需要花费大量的时间和资源.本文提出了保持复制网页和源网页一致的多种同步新策略,并提出源端网页变化的泊松模型,给出了刷新率和刷新时长的规范性描述,对各种同步策略的性能进行了研究和比较分析,发现其较大地改善了网页数据库刷新率.

关 键 词:同步技术  网页  数据库  刷新  搜索引擎
文章编号:1000-5641(2006)01-0108-08
收稿时间:2004-12-29
修稿时间:2004-12-01

Research on Dynamic Synchronization Technology of Webpage Database(Chinese)
XU Wen-tao. Research on Dynamic Synchronization Technology of Webpage Database(Chinese)[J]. Journal of East China Normal University(Natural Science), 2006, 2006(1): 108-115
Authors:XU Wen-tao
Affiliation:School of Information Science and Technology, East China Normal University, Shanghai 200062, China
Abstract:There are plenty of local copies of pages of remote web sites on local databases on most of web search engine sites. It is necessary to pull remote web pages periodically to refresh local copies of these pages on database in order to keep copies and source pages consistent, and which takes plenty of time and resources. The article proposes serveral policies to synchronize copy and source pages , proposes a Poission model of source page change, define freshness and fresh time, studies on these policies and compares their effectiveness. It is shown that the proposed policies improve the freshness of web pages significantly.
Keywords:synchronization technology  web page  database  refresh  search engine
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《华东师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《华东师范大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号