主题爬虫的解决方案 |
| |
引用本文: | 刘林,汪涛,樊孝忠.主题爬虫的解决方案[J].华南理工大学学报(自然科学版),2004,32(Z1):137-141. |
| |
作者姓名: | 刘林 汪涛 樊孝忠 |
| |
作者单位: | 北京理工大学,计算机科学与工程系,北京,100081 |
| |
摘 要: | 对传统的综合性搜索引擎召回率和精确率低的问题,可以用主题爬虫取代其中的普通爬虫构建主题搜索引擎,为用户提供信息检索服务,满足用户伴随信息多元化的增长而不断扩展的信息需求.文中研究了主题爬虫设计中的相关度分析、概念分析和链接分析等关键技术,通过实验给出了一系列解决方案.结果表明,主题爬虫的精度高于普通爬虫,具有可行性与实用性,并有助于主题搜索引擎的设计和主题信息的采集.
|
关 键 词: | 搜索引擎 主题爬虫 相关度分析 概念分析 链接分析 信息采集 |
文章编号: | 1000-565X(2004)S-0137-05 |
修稿时间: | 2004年8月25日 |
A Resolution Scheme of the Theme Crawler |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|