基于改进NSGA-Ⅲ的文本空间树聚类算法 |
| |
引用本文: | 马武彬,王锐,吴亚辉,邓苏.基于改进NSGA-Ⅲ的文本空间树聚类算法[J].华中科技大学学报(自然科学版),2020,48(5):86-92. |
| |
作者姓名: | 马武彬 王锐 吴亚辉 邓苏 |
| |
作者单位: | 国防科技大学信息系统工程重点实验室,湖南长沙 410073;国防科技大学信息系统工程重点实验室,湖南长沙 410073;国防科技大学信息系统工程重点实验室,湖南长沙 410073;国防科技大学信息系统工程重点实验室,湖南长沙 410073 |
| |
基金项目: | 湖南省自然科学基金;国家自然科学基金 |
| |
摘 要: | 构建倒排文本空间索引树(IR)分裂聚类多目标模型,对非支配排序遗传算法(NSGA-Ⅲ)的求解过程进行改进,提出一种基于先验初始种群策略的非支配排序遗传算法(PIPS-NSGA-Ⅲ),使其更适应于倒排文本空间对象分裂聚类问题的求解.通过PIPS-NSGA-Ⅲ算法寻求对象最小包围矩形(MBR)之间的重叠与覆盖面积、对象群间平均距离以及语义相似度等目标的最优前端解.通过对比PIPS-NSGA-Ⅲ,NSGA-Ⅱ,NSGA-Ⅲ和SPEA-Ⅱ进化多目标算法,从对象分类时间、效率、查询时间和准确度等多个方面来评估算法的优劣.实验结果表明:PIPS-NSGA-Ⅲ算法对文本空间对象聚类分裂具有较高的效率;相对于简化传统R树(STR树)与R树空间索引结构,基于改进NSGA-Ⅲ文本空间索引的平均查询时间减少24.8%,平均准确度提高3.75%.
|
关 键 词: | 倒排文本空间索引 遗传算法 非支配排序 先验初始种群策略 多目标优化 |
本文献已被 CNKI 万方数据 等数据库收录! |
|