首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种混合的中文分词算法
引用本文:陈飞,王秀峰,饶一梅.一种混合的中文分词算法[J].南开大学学报,2007,40(5):27-32.
作者姓名:陈飞  王秀峰  饶一梅
作者单位:南开大学信息技术科学学院,天津300071
摘    要:给出了一种将基于统计与基于词典方法融合而成的混合中文分词方法,利用统计方法进行词典的动态扩展,克服了基于词典算法对"完全词典"的依赖;利用词典对统计的一些参数进行估计,避免了以往靠实验得到这些参数的不确定性,同时将RMM算法与统计算法结合起来.最后通过仿真说明该混合算法比传统的基于词典和基于统计的方法更有效.

关 键 词:中文分词  交互信息  最大匹配  混合算法  中文分词算法  Chinese  Word  Segmentation  Approach  仿真  结合  统计算法  不确定性  实验  估计  参数  完全  动态扩展  统计方法  利用  分词方法  融合  词典  基于统计
文章编号:0465-7942(2007)05-0027-06
收稿时间:2005-09-01
修稿时间:2005年9月1日

A Hybrid Approach to Chinese Word Segmentation
Chen Fei,Wang Xiufeng,Rao Yimei.A Hybrid Approach to Chinese Word Segmentation[J].Acta Scientiarum Naturalium University Nankaiensis,2007,40(5):27-32.
Authors:Chen Fei  Wang Xiufeng  Rao Yimei
Abstract:
Keywords:Chinese word segmentation  mutual information  maximum match
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号