首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于特定领域的Web文本信息获取系统的研究
引用本文:赵栓柱,陈俊杰.基于特定领域的Web文本信息获取系统的研究[J].太原理工大学学报,2006,37(2):165-168.
作者姓名:赵栓柱  陈俊杰
作者单位:太原理工大学,信息工程学院,山西,太原,030024
摘    要:从特定领域用户获取Web文本信息的实际应用角度出发,在分析了系统相关开发理论基础上,通过从内容和语义上指导Web信息的搜索,尝试设计了一个基于特定领域的Web文本信息获取系统模型,并从实现技术上提出了开发这个系统的体系结构,分析了各组成模块的主要特点及其功能。着重研究了该系统的几项关键技术:Robot技术、Web页面内容的分析和站点结构的分析技术、中文文本的分类问题,包括中文的分词、特征提取、特征匹配及权值计算等的综合应用技术。

关 键 词:Web文本信息  特定领域  分类系统  中文分词
文章编号:1007-9432(2006)02-0165-04
收稿时间:2005-05-18
修稿时间:2005年5月18日

Research and Design of a Special Field-based Text Information Achieving System on Web
ZHAO Shuan-zhu,Chen Jun-jie.Research and Design of a Special Field-based Text Information Achieving System on Web[J].Journal of Taiyuan University of Technology,2006,37(2):165-168.
Authors:ZHAO Shuan-zhu  Chen Jun-jie
Abstract:This paper discusses the development of a text information achieving system from the application requirement of specific-field users,and attempts to design a frame structure for them to obtain the needed web text quickly and intelligently.We also analyze the basic developing principle related to the system and the main characteristics and functions of each module composing the system from the implement technology.At the same time,the key technologies to realize the system is also discussed in detail,such as robot technology,analysis of Web page content,the hyperlink structure and Chinese text classification,which includes Chinese words segmentation,feature extraction,feature match and wight value calculating technology etc.
Keywords:Web text information  specific field  classification system  Chinese words segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号