首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于登录词邻接关系的双条件概率的领域术语抽取算法
引用本文:陈黎,于中华,王亚强,秦湘清.基于登录词邻接关系的双条件概率的领域术语抽取算法[J].四川大学学报(自然科学版),2011,48(6):1300-1306.
作者姓名:陈黎  于中华  王亚强  秦湘清
作者单位:四川大学计算机学院,成都,610065
基金项目:高等学校博士学科点专项科研基金(20100181120029)
摘    要:领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入点,提出了根据登录词前后邻接关系计算邻接词之间的双条件概率自动识别领域术语.实验证明,本文提出的算法不仅能够有效地提取新术语,同时在小语料和低词频情况下也能取得较好的效果.

关 键 词:术语抽取  条件概率  领域词典  候选术语

A domain term extraction algorithm based on the relationship between adiacency word and their double conditional prohahility
CHEN Li,YU Zhong-Hu,WANG Ya-Qiang and QIN Xiang-Qing.A domain term extraction algorithm based on the relationship between adiacency word and their double conditional prohahility[J].Journal of Sichuan University (Natural Science Edition),2011,48(6):1300-1306.
Authors:CHEN Li  YU Zhong-Hu  WANG Ya-Qiang and QIN Xiang-Qing
Institution:College of Computer Science, Sichuan University;College of Computer Science, Sichuan University;College of Computer Science, Sichuan University;College of Computer Science, Sichuan University
Abstract:
Keywords:term extraction  conditional probability  domain dictionary  candidate term
本文献已被 万方数据 等数据库收录!
点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号