首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于智能的网页信息提取系统的研究与设计
引用本文:刘亚东,彭舰,张达平.基于智能的网页信息提取系统的研究与设计[J].四川大学学报(自然科学版),2009,46(4):957-962.
作者姓名:刘亚东  彭舰  张达平
作者单位:四川大学计算机学院,成都,610065
基金项目:四川省应用基础基金(2008JY0027);四川省科技支撑计划项目(07GG006-040)
摘    要:随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.本文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效地分类相似网页和提取网页信息.

关 键 词:智能  Web信息提取  RoadRunner  HTML结构树

Research on Web information extraction system based on intelligence and its design
LIU Ya-Dong,PENG Jian and ZHANG Da-Ping.Research on Web information extraction system based on intelligence and its design[J].Journal of Sichuan University (Natural Science Edition),2009,46(4):957-962.
Authors:LIU Ya-Dong  PENG Jian and ZHANG Da-Ping
Abstract:
Keywords:RoadRunner
本文献已被 万方数据 等数据库收录!
点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号