首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向领域的Web文本结构化分析
引用本文:杨春磊,刘念唐,林雨,邵堃.面向领域的Web文本结构化分析[J].合肥工业大学学报(自然科学版),2013,36(3):309-314.
作者姓名:杨春磊  刘念唐  林雨  邵堃
作者单位:合肥工业大学计算机与信息学院,安徽合肥,230009
基金项目:国家自然科学基金资助项目
摘    要:为了充分利用领域特征进行Web文本的结构化分析,文章提出了一种面向领域的Web文本结构化分析方法。该方法以领域特征为基础,依据半结构化文本的结构特征和Html文本的层次特性构造Html树;利用本体论的相关思想和方法构建领域本体,从Html树中提取有价值的信息;并结合通用词库和领域词库进行结构化分析。实验结果表明,该方法能够很好地实现Web文本的结构化分析。

关 键 词:领域特征  Web文本  结构化分析  半结构化文本  领域本体

Domain-oriented structured analysis of Web texts
YANG Chun-lei , LIU Nian-tang , LIN Yu , SHAO Kun.Domain-oriented structured analysis of Web texts[J].Journal of Hefei University of Technology(Natural Science),2013,36(3):309-314.
Authors:YANG Chun-lei  LIU Nian-tang  LIN Yu  SHAO Kun
Institution:Kun(School of Computer and Information,Hefei University of Technology,Hefei 230009,China)
Abstract:
Keywords:domain feature  Web text  structured analysis  semi-structured text  domain ontology
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号