基于多源知识的中文微博命名实体链接 |
| |
作者姓名: | 昝红英 吴泳钢 贾玉祥 牛桂玲 |
| |
作者单位: | 1. 郑州大学信息工程学院, 河南 郑州 450001;
2. 郑州大学外语学院, 河南 郑州 450001 |
| |
基金项目: | 国家自然科学基金资助项目(61402419,60970083,61272221);国家社会科学基金资助项目(14BYY096);国家高技术研究发展计划863计划项目(2012AA011101);河南省科技厅科技攻关计划资助项目(132102210407);河南省科技厅基础研究资助项目(142300410231,142300410308);河南省教育厅科学技术研究重点项目(12B520055,13B520381);计算语言学教育部重点实验室(北京大学)开放课题资助项目 |
| |
摘 要: | 命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。
|
关 键 词: | 命名实体 中文微博实体链接 同义词词典 百科资源 词袋模型 |
收稿时间: | 2015-03-03 |
|
| 点击此处可从《山东大学学报(理学版)》浏览原始摘要信息 |
|
点击此处可从《山东大学学报(理学版)》下载全文 |
|