首页 | 本学科首页   官方微博 | 高级检索  
     

一种面向BBS信息检索的主题网络爬虫算法
引用本文:刘佐达,张久岭,陈茂科,李星. 一种面向BBS信息检索的主题网络爬虫算法[J]. 郑州大学学报(理学版), 2010, 42(2)
作者姓名:刘佐达  张久岭  陈茂科  李星
作者单位:1. 清华大学,电子工程系,北京,100084
2. 清华大学,网络中心,北京,100084
3. 清华大学,电子工程系,北京,100084;清华大学,网络中心,北京,100084
基金项目:国家973重大基础研究发展规划项目
摘    要:对BBS的数据结构进行了分析研究,并根据BBS特点设计了一种用于BBS信息检索的主题网络爬虫算法.通过主题网络爬虫能够提高抓取网页的效率,同时又可以保证较高的召回率.实验表明,该算法大幅提高了信息检索的效率,改善了信息检索的效果.

关 键 词:BBS  主题网络爬虫  信息检索

Focused Crawling Algorithm for BBS Information Retrieval
LIU Zuo-da , ZHANG Jiu-ling , CHEN Mao-ke , LI Xing. Focused Crawling Algorithm for BBS Information Retrieval[J]. Journal of Zhengzhou University(Natrual Science Edition), 2010, 42(2)
Authors:LIU Zuo-da    ZHANG Jiu-ling    CHEN Mao-ke    LI Xing
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号