首页 | 本学科首页   官方微博 | 高级检索  
     检索      

HTML文本自动分类预处理方法的研究应用
引用本文:刘冬梅,王俊义.HTML文本自动分类预处理方法的研究应用[J].内蒙古大学学报(自然科学版),2007,38(1):75-78.
作者姓名:刘冬梅  王俊义
作者单位:1. 内蒙古大学计算机学院,呼和浩特,010021;内蒙古工业大学计算机系,呼和浩特,010051
2. 内蒙古大学计算机学院,呼和浩特,010021
摘    要:研究了HTML标记对网页内容的修饰作用,以前人理论为基础设计和实现了基于HTML标记的网页分析和加权策略与算法.经实验比较,加入预处理算法后,提高了分类器的分类效率,验证了所提出方法的有效性.

关 键 词:网页自动分类  HTML  网页预处理
文章编号:1000-1638(2007)01-0075-04
修稿时间:2006年7月6日

An Application of Pretreatment on Automatic Classification of HTML Document
LIU Dong-mei,WANG Jun-yi.An Application of Pretreatment on Automatic Classification of HTML Document[J].Acta Scientiarum Naturalium Universitatis Neimongol,2007,38(1):75-78.
Authors:LIU Dong-mei  WANG Jun-yi
Abstract:The function of HTML tags which was used to decorate the webpages content was investigated.Based on prevenient theory,webpages analysis and weight tactics based on HTML tags were designed and realized.By experimentation comparing,the application of classification method based on pretreatment tactics was more effective and precise.
Keywords:webpages automatic classification  HTML  webpages pretreatment
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号