首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于标记的分词算法
引用本文:亢临生,张永奎.基于标记的分词算法[J].山西大学学报(自然科学版),1994,17(3):283-286.
作者姓名:亢临生  张永奎
作者单位:山西大学计算中心
基金项目:山西省归国留学人员基金
摘    要:目前,自动分词的算法很多,但都有不能满足实用的要求。文中介绍一种在最大匹配法基础上,根据大量的真实语料中出现的语言现象,把汉语中的词按其在分词意义下的特性进行分类,并用不同的标记标识,对每一类词确定一组规则进行处理,使分词算法更接近于实用的目的。

关 键 词:分词,标记,最大匹配法

AN ALGORITHMFOR WORD SEGMENTATION BASEDONMARK
KangLinsheng,Zhangkui.AN ALGORITHMFOR WORD SEGMENTATION BASEDONMARK[J].Journal of Shanxi University (Natural Science Edition),1994,17(3):283-286.
Authors:KangLinsheng  Zhangkui
Institution:Computation Certer of Shanxi University
Abstract:Many auto matic word scgementation methods have been introdced so far, but noneof them have met the practicalneeds.It is introduced in this paper that the maximummatching method which can be used to classify chinese words and phrases according to theircharacteristics of word segmentation, mark them with different marks and process each groupof words and phraseswith a certain set of rules in order to make the word segmetationalgorithm more practical.
Keywords:segementation  mark  maximum  maching method
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号