首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于隐Markov模型汉语词性自动标注的若干分析与改进
引用本文:王东海,赵伟,陈洁,梁贺.基于隐Markov模型汉语词性自动标注的若干分析与改进[J].吉林工学院学报,2007,28(1):48-52.
作者姓名:王东海  赵伟  陈洁  梁贺
作者单位:长春工业大学计算机科学与工程学院 吉林长春130012(王东海,赵伟),长春广播电视大学理工系 吉林长春130021(陈洁),吉林省通信公司长春分公司 吉林长春130051(梁贺)
基金项目:吉林省科技厅平台建设基金资助项目(20030016号)
摘    要:提出一种算法,用来高效地完成训练语料的大量工作,并解决好训练语料的扩充问题,然后基于Viterbi算法提出一些改进之策,结合训练语料工作完成后的结果在二元模型基础上,采用不同规模的训练语料对同一规模的测试语料进行测试、比较与分析,并提出模型的改进方向。

关 键 词:隐Markov模型  词性标注  Viterbi算法  训练语料  测试语料
文章编号:1006-2939(2007)01-0048-05
收稿时间:2006-07-18
修稿时间:2006年7月18日

Analysis and improvement for the automatic part-of-speech tag of Chinese based on hidden Markov model
WANG Dong-hai,ZHAO Wei,CHEN Jie,LIANG He.Analysis and improvement for the automatic part-of-speech tag of Chinese based on hidden Markov model[J].Journal of Jilin Institute of Technology,2007,28(1):48-52.
Authors:WANG Dong-hai  ZHAO Wei  CHEN Jie  LIANG He
Abstract:An algorithm is put forward for fulfilling language material training efficiently and the extension of the materials.Basing on Viterbi algorithm,some strategies for the improvement are offered.Concerning the results of material training,test,comparison and analysis are carried out based on the training at different scale to the material at one scale.The further direction is pointed out.
Keywords:hidden Markov model  part-of-speech tag  Viterbi algorithm  training corpus  testing material  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号