首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于SVM和规则消除组合型歧义的算法
引用本文:刘禹孜,何中市.一种基于SVM和规则消除组合型歧义的算法[J].重庆大学学报(自然科学版),2005,28(10):50-53.
作者姓名:刘禹孜  何中市
作者单位:重庆大学计算机学院,重庆400030
摘    要:歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.

关 键 词:自然语言处理  中文分词  组合型歧义  支持向量机  规则
文章编号:1000-582X(2005)10-0050-04
收稿时间:2005-05-16
修稿时间:2005年5月16日

Algorithm Based on SVM and Rules for the Disambiguation of Combinatorial Ambiguous Phrases
LIU Yu-zi,HE Zhong-shi.Algorithm Based on SVM and Rules for the Disambiguation of Combinatorial Ambiguous Phrases[J].Journal of Chongqing University(Natural Science Edition),2005,28(10):50-53.
Authors:LIU Yu-zi  HE Zhong-shi
Institution:College of Computer Science, Chongqing University, Chongqing 400030, China
Abstract:Ambiguity processing is an essential but difficult problem in word segmentation.The authors combine Support Vector Machines(SVM)with rules to propose a new algorithm(SR algorithm)to deal with the combinatorial ambiguous phrases in Chinese word segmentation.The key idea of the SR algorithm is to solve combinatorial ambiguous phrases making use of the theory of SVM and rules of parts of speech.In a test of several kinds of Chinese corpus,it indicates that the accuracy of segmentation for combinatorial ambiguous phrases reach 83%.It provides a new method for solving Chinese word segmentation problems.
Keywords:natural language processing  Chinese word segmentation  combinatorial ambiguity  support vector machine  rules
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《重庆大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《重庆大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号