首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于SVM的网页层次分类算法
引用本文:马乐,翁智生,罗军. 一种基于SVM的网页层次分类算法[J]. 北京师范大学学报(自然科学版), 2009, 45(3)
作者姓名:马乐  翁智生  罗军
作者单位:华南理工大学广州汽车学院,510800,广州
基金项目:山东省自然科学基金资助项目(Y2007G19)
摘    要:设计了一种基于统计的多层次分类算法:在一个树状的层次分类体系中,对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的最底层子类.每一层中使用支持向量机作为分类模型,并使用类别均衡的方法解决数据稀疏的问题,在经过大规模网页语料训练后取得了很好的分类效果.

关 键 词:层次分类  支持向量机  网页分类  

A HIERARCHY CATEGORIZATION ALGORITHM BASED ON SVM
MA Yue,WENG Zhisheng,LUO Jun. A HIERARCHY CATEGORIZATION ALGORITHM BASED ON SVM[J]. Journal of Beijing Normal University(Natural Science), 2009, 45(3)
Authors:MA Yue  WENG Zhisheng  LUO Jun
Affiliation:College of Automotive Engineering;South China University of Technology at Guangzhou;510800;Guangzhou;China
Abstract:Web page classification plays an important role in information retrieval and social network.Focusing on features of various types and large scales for web pages,this paper provides a hierarchy categorization algorithm based on statistical classification algorithms.After building a categorization system for automatic classification,for a web page to be categorized,the first beginning from the root node to find the corresponding categories,and then it is categorized down until finding the corresponding recurs...
Keywords:hierarchy categorization  support vector machines  web page classification  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号