首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于SVM的日文网页分类
引用本文:王清翔,仲婷,潘金贵.基于SVM的日文网页分类[J].广西师范大学学报(自然科学版),2007,25(2):43-46.
作者姓名:王清翔  仲婷  潘金贵
作者单位:南京大学,计算机软件新技术国家重点实验室,江苏,南京,210093
基金项目:国家“863”计划基金资助项目(2004AA117010-05)
摘    要:网页分类是使用机器学习算法实现网页类别的自动标注。提出了一种基于SVM的日文网页分类方法,针对日文的特点,设计日文词素词典与规则库,并以此为基础进行日文分词和特征表示,然后使用互信息度进行特征选择,最后应用SVM来构造分类超平面,对日文网页进行分类。最后通过实验进行了验证。

关 键 词:SVM  网页分类  日文分词
文章编号:1001-6600(2007)02-0043-04
收稿时间:2006-12-18
修稿时间:2006-12-18

Classify Japanese Document by Support Vector Machine
WANG Qing-xiang,ZHONG Ting,PAN Jin-gui.Classify Japanese Document by Support Vector Machine[J].Journal of Guangxi Normal University(Natural Science Edition),2007,25(2):43-46.
Authors:WANG Qing-xiang  ZHONG Ting  PAN Jin-gui
Institution:State Key Lab For Novel Software Technology,Nanjing University,Nanjing 210093,China
Abstract:Web classification uses Machine Learning algorithm to tag Web automatically.This paper propose a method to classify Japanese Web pages based on support vector machine.The morpheme diction-ary and rule library are designed according to the feature of Japanese,which are used to segment and present features.Then use Mutual Information to select feature,build the hyperplane to classify the Japan-ese Web page.The positive results demonstrate the performance on a challenging problem.
Keywords:SVM  Web page classification  Japanese segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号