首页 | 本学科首页   官方微博 | 高级检索  
     

基于主动学习隐马尔可夫模型的文本信息抽取
引用本文:周顺先,林亚平,王耀南. 基于主动学习隐马尔可夫模型的文本信息抽取[J]. 湖南大学学报(自然科学版), 2007, 34(6): 74-77
作者姓名:周顺先  林亚平  王耀南
作者单位:湖南大学,计算机与通信学院,湖南,长沙,410082;湖南大学,电气与信息工程学院,湖南,长沙,410082;湖南大学,电气与信息工程学院,湖南,长沙,410082;湖南大学,计算机与通信学院,湖南,长沙,410082
基金项目:国家“863”高技术研究发展计划基金资助项目(2006AA01Z227)
摘    要:对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.

关 键 词:主动学习  隐马尔可夫模型  文本信息抽取
文章编号:1000-2472(2007)06-0074-04
修稿时间:2006-11-02

Text Information Extraction Based on Active Hidden Markov Model
ZHOU Shun-xian,LIN Ya-ping,WANG Yao-nan. Text Information Extraction Based on Active Hidden Markov Model[J]. Journal of Hunan University(Naturnal Science), 2007, 34(6): 74-77
Authors:ZHOU Shun-xian  LIN Ya-ping  WANG Yao-nan
Affiliation:1. College of Computer and Communieation,Hunan Univ, Changsha,Hunan 410082,China; 2. College of Electrical and Information Engineering , Hunan Univ, Changsha, Hunan 410082, China
Abstract:An active learning was used in text information extraction for training text,which was partly labeled.And an approach of text information extraction based on active hidden Markov model was proposed.In this approach,only the most valuable training text for training the model was selected out to label through active learning.Experimental results show that,by selecting the optimal threshold for active model parameters,the approach can reduce the user workload for labeling without affecting the performance of text information extraction.
Keywords:active learning  hidden Markov model  text information extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号