首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于隐马尔可夫模型的文本信息抽取
引用本文:刘云中,林亚平,陈治平.基于隐马尔可夫模型的文本信息抽取[J].系统仿真学报,2004,16(3):507-510.
作者姓名:刘云中  林亚平  陈治平
作者单位:湖南大学计算机与通信学院,湖南,长沙,410082
基金项目:国家自然科学基金(60272051)
摘    要:文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。

关 键 词:隐马尔可夫模型  信息抽取  文本分块  机器学习
文章编号:1004-731X(2004)03-0507-04
修稿时间:2003年1月9日

Text Information Extraction Based on Hidden Markov Model
LIU Yun-zhong,LIN Ya-ping,CHEN Zhi-ping.Text Information Extraction Based on Hidden Markov Model[J].Journal of System Simulation,2004,16(3):507-510.
Authors:LIU Yun-zhong  LIN Ya-ping  CHEN Zhi-ping
Abstract:Text information extraction is an important method of processing large quantity of text. The application of hidden Markov model to information extraction is a relatively new research topic. A new algorithm based on hidden Markov Model is proposed for text information extraction. The algorithm makes use of the information of format and list separators to segment text, and then combines hidden Markov model for text information extraction. The simulation results show that the new algorithm exceeds the original one that hasnt segment text into blocks in precision and recall.
Keywords:hidden markov model  information extraction  text block  machine learning  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号