首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于本体的文本聚类方法
引用本文:朱会峰,左万利,赫枫龄,彭涛,纪文彦.一种基于本体的文本聚类方法[J].吉林大学学报(理学版),2010,48(2):277-283.
作者姓名:朱会峰  左万利  赫枫龄  彭涛  纪文彦
作者单位:吉林大学 计算机科学与技术学院, 长春 130012,吉林大学 符号计算与知识工程教育部重点实验室, 长春 130012
基金项目:国家自然科学基金(批准号:60973040;60903098);;教育部高等学校博士学科点专项科研基金(批准号:200801830021);;吉林省自然科学基金(批准号:20070533);;吉林大学基本科研业务费交叉学科与创新项目基金(批准号:200810025)
摘    要:基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性.

关 键 词:本体    WordNet    关键概念集    概念特征向量  
收稿时间:2009-04-09

A Novel Text Clustering Method Based on Ontology
ZHU Hui-feng,ZUO Wan-li,HE Feng-ling,PENG Tao,JI Wen-yan.A Novel Text Clustering Method Based on Ontology[J].Journal of Jilin University: Sci Ed,2010,48(2):277-283.
Authors:ZHU Hui-feng  ZUO Wan-li  HE Feng-ling  PENG Tao  JI Wen-yan
Institution:College of Computer Science and Technology, Jilin University, Changchun 130012, China|Key Laboratory ofSymbol Computation and Knowledge Engineering of |Ministry of Education, Jilin University, |Changchun 130012, China
Abstract:The text clustering method based on ontology applies WordNet and key concept set during text reprensentation,and the concept nodes and the semantic relations between the concepts in the ontology WordNet are used to reduce the number of features so as to improve clustering effect.And during text clustering,the algorithm uses the key concept set and the concept feature vector to calculate the similarity and uses key concept set to provide an explanation for every cluster of the result.The experimental results...
Keywords:ontology  WordNet  key concept set  concept feature vector  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《吉林大学学报(理学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号