首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于语义相似度的文本表示降维方法
引用本文:赵长伟,孙素环,李晓培.基于语义相似度的文本表示降维方法[J].河南科技大学学报(自然科学版),2008,29(5).
作者姓名:赵长伟  孙素环  李晓培
作者单位:1. 河南科技大学,电子信息工程学院,河南,洛阳,471003
2. 中国一拖集团公司拖拉机学院,河南,洛阳,471004
摘    要:数据降维是文本表示中不可或缺的一个环节,有效的数据降维方法不仅能够减少计算量,同时有助于文本处理精度的提高.不同于传统的利用统计信息进行降维的方法,本文提出了一种基于词汇的语义相似度的文本表示的降维方法,该方法结合自然语言处理的知识,在降维环节考虑了特征词的语义信息和词性信息.实验结果表明:该方法能够有效地降低文本表示的维数,并在降维后的空间获得较高的文本处理精度,基于语义相似度的降维方法是一种适合文本处理的降维方法.

关 键 词:语义相似度  知网  特征选取

Dimension Reduction for Text Expression Based on Semantic Similarity
ZHAO Chang-Wei,SUN Su-Huan,LI Xiao-Pei.Dimension Reduction for Text Expression Based on Semantic Similarity[J].Journal of Henan University of Science & Technology:Natural Science,2008,29(5).
Authors:ZHAO Chang-Wei  SUN Su-Huan  LI Xiao-Pei
Institution:ZHAO Chang-Wei1,SUN Su-Huan1,LI Xiao-Pei2(1.Electronic Information Engineering College,Henan University of Science & Technology,Luoyang 471003,China,2.Tractor College,China YTO Group Corporation,Luoyang 471004,China)
Abstract:Data dimension reduction plays an important role in the field of text expression.An effective dimension reduction method can not only reduce the amount of calculation,but help to improve the accuracy of text classification.The paper presents a new method of dimension reduction which is based on word semantic similarity.Being different from the traditional method which usually uses the statistical information of word,natural language processing knowledge is used in our method which considers semantic informa...
Keywords:Semantic similarity  Hownet  Feature selection  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号