首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于HTML Parser的网页信息提取技术研究
引用本文:珠杰,罗潘.基于HTML Parser的网页信息提取技术研究[J].西藏大学学报,2010,25(1).
作者姓名:珠杰  罗潘
作者单位:西藏大学工学院,西藏拉萨,850000 
摘    要:在互联网上信息量激增,迫切需要一些自动化工具帮助人们在海量信息源中迅速找到真正需要的信息。文章基于开源项目HTMLParser包,以提取中关村笔记本频道产品信息的文本信息和图片信息为例,提出了信息提取系统设计方案,给出了文字信息和图片信息提取算法。

关 键 词:搜索引擎  网页信息提取

Research on Extraction of Web Information Technique Based on HTML Parser
Zhujie,Luo-pan.Research on Extraction of Web Information Technique Based on HTML Parser[J].Journal of Tibet University,2010,25(1).
Authors:Zhujie  Luo-pan
Abstract:
Keywords:HTML Parser
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号