首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于LDA及标签传播的实体集合扩展
引用本文:马宇峰,阮彤.基于LDA及标签传播的实体集合扩展[J].山东大学学报(理学版),2015(3):20-27.
作者姓名:马宇峰  阮彤
作者单位:华东理工大学计算机科学与工程系
基金项目:国家科技支撑计划项目(2013BAH11F03)
摘    要:实体集合扩展是指给定某类别下若干示例作为种子,扩展得到属于该类别下的更多实体。传统的实体集合扩展方法主要考虑实体之间的共现关系,根据它们之间的相似程度进行迭代式的扩展,但这会导致语义偏转问题的出现,准确率较差。对此,提出了先根据LDA(latent dirichlet allocation)主题模型获得种子词集合语义信息,再通过标签传播来进行实体集合扩展的方法。该方法通过考虑实体列表整体蕴含的语义信息,避免了单个词可能带来的歧义问题;利用LDA模型,挖掘实体列表的上下文主题,丰富实体扩展过程中的语义信息,解决语义偏转问题。在实际数据集上取得了良好的检测效果,证明了本文方法的有效性。

关 键 词:实体集合扩展  主题模型  标签传播  种子词  LDA

Entity set expansion based on LDA and label propagation
MA Yu-feng;RUAN Tong.Entity set expansion based on LDA and label propagation[J].Journal of Shandong University,2015(3):20-27.
Authors:MA Yu-feng;RUAN Tong
Institution:MA Yu-feng;RUAN Tong;Department of Computer Science and Engineering,East China University of Science and Technology;
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号