基于特征和隐马尔可夫模型的文本信息抽取 |
| |
作者姓名: | 常军林 吴笑伟 吴芬芬 刘磊 |
| |
作者单位: | 河南交通职业技术学院,河南,郑州,450005;吉林大学,计算机科学与技术学院,吉林,长春,130012 |
| |
基金项目: | 吉林省科技发展计划项目(20050527) |
| |
摘 要: | ![]() 基于文本分块提出一种新的文本信息抽取技术,该技术利用文本的语义特征和结构特征,抽取具有特征的状态,以此结果为基础,进一步运用改进的隐马尔可夫模型,抽取剩余的无特征状态.对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇进行测试,结果显示精确度和召回率比基于单词和传统隐马尔可夫模型的方法都有所提高,并进一步提高了效率.
|
关 键 词: | 文本分块 特征提取 隐马尔可夫模型 |
文章编号: | 1672-6871(2008)02-0055-03 |
收稿时间: | 2007-04-10 |
修稿时间: | 2007-04-10 |
本文献已被 维普 万方数据 等数据库收录! |
|