首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于底表的多层扫描术语自动标注算法
引用本文:郑泽芝,敖婷.基于底表的多层扫描术语自动标注算法[J].厦门大学学报(自然科学版),2011,50(3):546-552.
作者姓名:郑泽芝  敖婷
作者单位:1. 福建卫生职业技术学院
2. 厦门大学人文学院,福建厦门,361005
基金项目:国家社会科学基金,国家语言资源监测与研究中心资助项目
摘    要:以学科教材术语语料库建设为目标,实现了一种基于底表的多层扫描术语自动标注算法.该算法首先采用预测性规则模板扫描文本中未登录术语,并进行标注;其次采用最大匹配方法识别出每个可能的候选术语,把每个候选术语看作术语的定位点,扫描其上下文语境,分别调用单位术语规则模板、例外规则、部件规则、部件例外规则、例外校正规则等对扫描结果进行判断,确定候选术语的身份,并进行标注.该方法以规则的预测和限定功能为辅,充分利用了底表术语信息,取得了较高的标注准确率和召回率,开放测试F-指数达到了84%左右.

关 键 词:术语  自动标注  规则  术语部件

Term Auto-tagging Algorithm Based on Base Glossary
ZHENG Ze-zhi,AO Ting.Term Auto-tagging Algorithm Based on Base Glossary[J].Journal of Xiamen University(Natural Science),2011,50(3):546-552.
Authors:ZHENG Ze-zhi  AO Ting
Institution:ZHENG Ze-zhi,AO Ting(College of the Humanities,Xiamen University,Xiamen 361005,China)
Abstract:A multi-scanning algorithm based on base glossary was designed for constructing a teaching material term corpus.Firstly,the term auto-tagging process scans and labels terms which match the prediction templates;secondly,finds out every candidate terms with the maximum matching algorithm based on a base glossary,and takes every candidate term as an anchor point,scans the context of the anchor point,calls the unit-term templates,exceptional-correct rules,term component and component exceptional rules in tern t...
Keywords:term  auto-tagging  rule  term component  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号