首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MEM和HMM的中文词性标注方法
引用本文:周潭,莫礼平,胡美琪,李航程.基于MEM和HMM的中文词性标注方法[J].吉首大学学报(自然科学版),2020,41(2):15-18.
作者姓名:周潭  莫礼平  胡美琪  李航程
作者单位:(吉首大学信息科学与工程学院,湖南 吉首 416000)
基金项目:吉首大学本科生科研项目;湖南省自然科学基金;大学生研究性学习和创新性实验计划;湖南省大学生研究性学习和创新性实验计划;国家自然科学基金
摘    要:为了进一步提高中文语料库中语料的词性标注效率,在分析最大熵模型(MEM)和隐马尔科夫模型(HMM)所涉及理论、算法及其在中文词性标注技术中的应用的基础上,进行了基于MEM和HMM的中文词性标注实验.实验结果显示,基于MEM和HMM的中文词性标注算法都获得了一致性很好且覆盖率较高的标注效果,中文词性标注的准确率、召回率和F1这3个指标均达到92%以上;MEM的标注效果总体上比HMM的稍佳.

关 键 词:最大熵模型  隐马尔科夫模型  中文词性标注  

Chinese Part-of-Speech Tagging Method Based on Maximum Entropy Model and Hidden Markov Model
ZHOU Tan,MO Liping,HU Meiqi,LI Hangcheng.Chinese Part-of-Speech Tagging Method Based on Maximum Entropy Model and Hidden Markov Model[J].Journal of Jishou University(Natural Science Edition),2020,41(2):15-18.
Authors:ZHOU Tan  MO Liping  HU Meiqi  LI Hangcheng
Institution:(College of Information Science & Engineering, Jishou University, Jishou 416000, Hunan China)
Abstract:In order to further improve the efficiency of part-of-speech tagging in Chinese corpora, experiments of Chinese part-of-speech tagging methods based on the maximum entropy model (MEM) and the hidden Markov model (HMM) are designed according to the theoretical basis, algorithms, and application technology. The experimental results show that the Chinese part-of-speech tagging algorithms based on MEM and HMM have obtained a very consistent and high-coverage tagging result and the three indicators of tagging accuracy, recall rate and F1 value have reached above 92%, with the effect of MEM better than that of HMM.
Keywords:maximum entropy model  hidden Markov model  Chinese part-of-speech tagging  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《吉首大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《吉首大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号