首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于平均信息熵的中文问句关键词提取
引用本文:丁菲菲,杨思春,刘仁金.基于平均信息熵的中文问句关键词提取[J].皖西学院学报,2014(5).
作者姓名:丁菲菲  杨思春  刘仁金
作者单位:1. 安徽工业大学计算机科学与技术学院,安徽马鞍山,243002
2. 皖西学院信息工程学院,安徽六安,237012
基金项目:安徽省高校省级自然科学研究重点项目(KJ2011A048)。
摘    要:关键词提取是问答系统中问句分析的重要步骤,它有助于问答系统快速、准确地返回答案。针对现有文献中基于T FIDF等方法在关键词提取准确率及效率方面的不足,提出一种基于平均信息熵的中文问句关键词提取方法。通过加入专业领域词汇,并在停用词过滤的基础上计算问句中每个词的平均信息熵,以词的信息熵值直接体现该词在问句中的重要性;同时在关键词提取过程中,通过设定不同提取比例,并在不同提取比例下观察评价标准值,以最佳提取比例获取更为合适的关键词。实验结果表明,与传统的T FIDF等其他方法相比,该方法的查准率、查全率以及 F1测度值都得到显著提高。

关 键 词:自动问答  提取  TFIDF  平均信息熵

Extracting Keywords in Chinese Question Based on Average Information Entropy Model
DING Feifei,YANG Sichun,LIU Renjin.Extracting Keywords in Chinese Question Based on Average Information Entropy Model[J].Journal of Wanxi University,2014(5).
Authors:DING Feifei  YANG Sichun  LIU Renjin
Abstract:
Keywords:question answering  keywords extraction  TFIDF  average information entropy
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号