首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于特定领域的网页文本提取与实现
引用本文:张斌斌,何金国.基于特定领域的网页文本提取与实现[J].中央民族大学学报(自然科学版),2013,22(3).
作者姓名:张斌斌  何金国
作者单位:中央民族大学理学院,北京,100081
摘    要:提出了针对小范围的网页文本提取的一种方法.结合对东方财富网的股评网页的HTML文件进行网页文本分析,设计出基于特定领域的网页结构特征的网页文本提取算法.该算法的设计与普通的广义网页提取算法的设计相比,设计简单,针对性较强,提取效率较高,且对股票市场的网页信息的识别与处理起到基础性的作用.

关 键 词:股票  信息提取  网页信息

Extraction and Implementation of Text Based on Specific Areas of the Webpage
ZHANG Bin-bin , HE Jin-guo.Extraction and Implementation of Text Based on Specific Areas of the Webpage[J].Journal of The Central University for Nationalities(Natural Sciences Edition),2013,22(3).
Authors:ZHANG Bin-bin  HE Jin-guo
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号