一种OA系统主题词提取算法设计 |
| |
引用本文: | 林钦. 一种OA系统主题词提取算法设计[J]. 齐齐哈尔大学学报(自然科学版), 2012, 28(4) |
| |
作者姓名: | 林钦 |
| |
作者单位: | 福建江夏学院电子信息科学系,福建福州,350108 |
| |
摘 要: | 设计了一种用于OA系统主题词提取算法,该算法包括单句聚类、抽取代表句、代表句分词和主题词提取几个步骤。采用层次凝聚法作为单句聚类算法,研究公文句子的特点,设计了代表句抽取算法,根据公文群体较为单一的特点,建立主题词词库以及主题词提取规则库,对机械分词法进行改进,设计了代表句的分词算法,实现了公文搜索主题词的自动生成。
|
关 键 词: | OA 单句聚类 代表句 主题词 |
Design of an algorithm for the keywords extraction in the OA system |
| |
Abstract: | |
| |
Keywords: | OA single sentence clustering represent sentence keyword |
本文献已被 万方数据 等数据库收录! |
|