首页 | 本学科首页   官方微博 | 高级检索  
     检索      

高性能网页索引器JU_Indexer的实现
引用本文:赫枫龄,左万利,张雪松.高性能网页索引器JU_Indexer的实现[J].吉林大学学报(理学版),2006,44(1):50-56.
作者姓名:赫枫龄  左万利  张雪松
作者单位:吉林大学,符号计算与知识工程教育部重点实验室,长春,130012;吉林大学,计算机科学与技术学院,长春,130012
摘    要:高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.

关 键 词:Web网页  网络搜索引擎  网页索引器
文章编号:1671-5489(2006)01-0050-07
收稿时间:2005-03-24
修稿时间:2005年3月24日

Implementation of a Web Page Indexer JU_Indexer with High Performance
HE Feng-ling,ZUO Wan-li,ZHANG Xue-song.Implementation of a Web Page Indexer JU_Indexer with High Performance[J].Journal of Jilin University: Sci Ed,2006,44(1):50-56.
Authors:HE Feng-ling  ZUO Wan-li  ZHANG Xue-song
Institution:College of Computer Science and Technology, Jilin University, Changchun 130012, China; Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China
Abstract:JU_Indexer,a web page indexer with high performance,uses the inverted index table to store(index) data for web pages,creates index data by multiple threads concurrently,utilizes the optimized search(algorithms) to implement the queries posed by users.First,the system architecture of JU_Indexer is given.(Then),the data structure used to store the index data in JU_Indexer,the algorithm employed to create web page index,and the strategy utilized to complete the queries proposed by users are described in great detail.The experiment result demonstrates that the queries proposed by users can be completed by JU_Indexer within milliseconds.The optimized phrase search algorithm employed by JU_Indexer shortens the time to complete the phrase querying.
Keywords:web pages  Internet search engine  web page indexer
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号