首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于互联网的术语定义辨析
引用本文:吴瑞红,吕学强.基于互联网的术语定义辨析[J].北京大学学报(自然科学版),2014,50(1):33.
作者姓名:吴瑞红  吕学强
作者单位:北京信息科技大学网络文化与数字传播北京市重点实验室, 北京 100101;
基金项目:国家自然科学基金(61171159,61271304);北京市教育委员会科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助
摘    要:针对一个术语的多条候选定义, 首次提出术语定义辨析模型并给出一种基于互联网的求解方法。该方法从百度百科和百度搜索构建参考释义, 总结术语及其定义来源语料中的术语定义模板, 根据参考释义和定义的模板从待辨析定义中选出最优定义。实验选取中国知网概念知识元库中部分领域的术语在学术文献和工 具书中的定义作为待辨析对象, 用所提出的模型和方法进行辨析实验, 结果表明, 该方法辨析的准确率为96.1%, 有很好的辨析效果。

关 键 词:术语定义  辨析模型  参考释义  定义模板  
收稿时间:2013-06-22

Terminology Definition Discrimination Based on the Internet
WU Ruihong,Lü Xueqiang.Terminology Definition Discrimination Based on the Internet[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2014,50(1):33.
Authors:WU Ruihong  Lü Xueqiang
Institution:Beijing Key Laboratory of Internet Culture and Digital Dissemination Research, Beijing Information Science and Technology University, Beijing 100101;
Abstract:The authors first proposed a definition discrimination model and a method to solve the problem that one terminology has multiple definitions. Baidu Ecyclopedia and Baidu Search results are used to construct the reference definition of the terminology, then the reference definition and the definition patterns summarized from the corpus are used to select the best definition from the candidate definitions. Part of the terminologies and their definitions in CNKI Concept Knowledge Library are chosen as the discrimited corpus in the experiment. Results show that the accuracy is 96.1%, which has a good performance.
Keywords:terminology definition  definition discrimination model  reference definition  definition pattern  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号