首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于排序学习的文本概念标注方法研究
引用本文:涂新辉,何婷婷,李芳,王建文.基于排序学习的文本概念标注方法研究[J].北京大学学报(自然科学版),2013,49(1):153-158.
作者姓名:涂新辉  何婷婷  李芳  王建文
作者单位:华中师范大学计算机学院,武汉430079;国家语言资源监测与研究中心网络媒体语言分中心,武汉430079;华中师范大学计算机学院,武汉430079;国家语言资源监测与研究中心网络媒体语言分中心,武汉430079;华中师范大学计算机学院,武汉430079;国家语言资源监测与研究中心网络媒体语言分中心,武汉430079;华中师范大学计算机学院,武汉430079;国家语言资源监测与研究中心网络媒体语言分中心,武汉430079
基金项目:国家自然科学基金(90920005,61003192)资助
摘    要:提出一种基于排序学习的方法CRM (concept ranking model),来实现文档的维基百科概念自动标注.首先人工对一定规模的文档进行概念标注,建立训练集合,然后利用排序学习算法在多项特征上得到对概念排序的模型,利用这个概念的排序模型对任意文档进行概念标注.实验表明,相对于传统的文档概念标注方法,此方法在各类指标上都有相当大的提高,标注结果更加接近人类的概念标注.

关 键 词:概念标注  排序学习  维基百科  显示语义分析

Learning to Rank Concept Annotation for Text
TU Xinhui,HE Tingting,LI Fang,WANG Jianwen.Learning to Rank Concept Annotation for Text[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2013,49(1):153-158.
Authors:TU Xinhui  HE Tingting  LI Fang  WANG Jianwen
Institution:1,2 1.School of Computer Science,Huazhong Normal University,Wuhan 430079;2.Network Media Branch,National Language Resources Monitoring and Research Center,Wuhan 430079
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号