首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于规则和统计抽取模型中的主动学习算法
引用本文:周顺先,林亚平,王耀南.基于规则和统计抽取模型中的主动学习算法[J].系统仿真学报,2008,20(23):6477-6480.
作者姓名:周顺先  林亚平  王耀南
作者单位:湖南大学软件学院,湖南大学电气与信息工程学院
基金项目:国家"863"高技术研究发展计划基金 , 湖南省重点自然科学基金  
摘    要:提出了一种文本信息抽取的主动学习算法,在只有部分标记训练文本的情况下,通过主动学习的方法将最有价值的训练文本挑选出来进行标记,该算法能应用到基于包装器模型和基于隐马尔可夫模型的文本信息抽取中,在不影响抽取性能的前提下,能有效降低模型训练过程对已标记训练文本的依赖程度,很大程度减少人工标记训练文本的工作量。

关 键 词:主动学习  文本信息抽取  包装器模型  隐马尔可夫模型

Active Learning Algorithm in Extraction Model Based on Rules and Statistics
ZHOU Shun-xian,LIN Ya-ping,WAN Yao-nan.Active Learning Algorithm in Extraction Model Based on Rules and Statistics[J].Journal of System Simulation,2008,20(23):6477-6480.
Authors:ZHOU Shun-xian    LIN Ya-ping  WAN Yao-nan
Institution:ZHOU Shun-xian1,2,LIN Ya-ping1,WAN Yao-nan2
Abstract:An active learning algorithm for text information extraction was proposed.This algorithm can select out the most valuable training texts to label via active learning while only part of labeled training texts are available.It can be used for text information extraction based on wrapper model and hidden Markov model.Also it can reduce the degree of depending on labeled training texts in model training,and can lessen the user workload for labeling without affecting the performance of text information extraction.
Keywords:active learning  text information extraction  wrapper model  hidden Markov model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号