首页 | 本学科首页   官方微博 | 高级检索  
     检索      

特定主题词库建立的相关技术的研究
引用本文:王夙娟.特定主题词库建立的相关技术的研究[J].科技信息,2012(14):115-116.
作者姓名:王夙娟
作者单位:菏泽学院计算机与信息工程系
摘    要:本文对分类文档提取主题词,建立按主题划分的主题词库,用于信息提取和主题分类。通过对文档预处理,运用权重计算公式,按权重大小提取每篇文档的主题词,并通过对文档的不断训练,扩充主题词库,最终形成按主题分类的主题词库。通过实验表明,该方法对主题词的抽取具有较高的准确率,建立的主题词库对专业文档的主题词的提取既快速又准确。该词库的建立满足了对专业文档处理的要求,对于信息提取和文本分类提出了新方法和思路。

关 键 词:主题词库  TF-IDF  主题词  文本分类
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号