垂直搜索中网页抓取技术的研究 |
| |
引用本文: | 陈哲.垂直搜索中网页抓取技术的研究[J].科技信息,2009(22):I0182-I0182. |
| |
作者姓名: | 陈哲 |
| |
作者单位: | 山东经贸职业学院; |
| |
摘 要: | 网页抓取是由一个称为网络爬虫的程序实现的,该程序是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上提取新的URL放入队列,直到满足系统的一定停止条件。
|
关 键 词: | 网络爬虫 网页搜集 网页抓取 |
本文献已被 CNKI 维普 等数据库收录! |
|