网页文档内容与格式识别的研究与实现 |
| |
引用本文: | 张东.网页文档内容与格式识别的研究与实现[J].科技资讯,2006(12):55-56. |
| |
作者姓名: | 张东 |
| |
作者单位: | 杭州师范学院,浙江杭州310018 |
| |
摘 要: | 1 前言
随着万维网(World Wide Web)在国际互连网上的推广,文本信息数量日益增加,交换日益频繁,这就需要一个高效率的信息检索系统。目前,在Internet上有数百万个Web服务器日夜不停地向人们提供着各式各样的信息服务。现有的著名搜索引擎,如Yahoo!,Looksmart等,都是利用人工分类方法将网络信息分类,将检索后的结果存入数据库。因此,研究高效率的信息检索系统得到了一些学者的重视。
|
关 键 词: | 文档内容 信息检索系统 Internet 识别 网页 Web服务器 Yahoo Wide 文本信息 信息服务 |
本文献已被 维普 等数据库收录! |
|