特定主题词库建立的相关技术的研究 |
| |
引用本文: | 王夙娟.特定主题词库建立的相关技术的研究[J].科技信息,2012(14):115-116. |
| |
作者姓名: | 王夙娟 |
| |
作者单位: | 菏泽学院计算机与信息工程系 |
| |
摘 要: | 本文对分类文档提取主题词,建立按主题划分的主题词库,用于信息提取和主题分类。通过对文档预处理,运用权重计算公式,按权重大小提取每篇文档的主题词,并通过对文档的不断训练,扩充主题词库,最终形成按主题分类的主题词库。通过实验表明,该方法对主题词的抽取具有较高的准确率,建立的主题词库对专业文档的主题词的提取既快速又准确。该词库的建立满足了对专业文档处理的要求,对于信息提取和文本分类提出了新方法和思路。
|
关 键 词: | 主题词库 TF-IDF 主题词 文本分类 |
本文献已被 CNKI 维普 等数据库收录! |
|