首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于量化同义词关系的改进特征词提取方法
引用本文:徐建民,刘清江,付婷婷,戴旭.基于量化同义词关系的改进特征词提取方法[J].河北大学学报(自然科学版),2010,30(1).
作者姓名:徐建民  刘清江  付婷婷  戴旭
作者单位:1. 河北大学,数学与计算机学院,河北,保定,071002
2. 河北大学,传媒实验教学中心,河北,保定,071002
基金项目:国家博士后科学基金资助项目(20070420700)
摘    要:提出一种基于量化同义词关系的改进的TF-IDF文本特征词提取方法.该方法将在同一文本中出现的某个词的同义词做为一个集合,在传统TF-IDF方法计算的词语权重的基础上对同义词集合中的词语及其相关词进行权重调整,通过相似度对同义词集合中的词语进行了合并加权.实验证明该方法对文本中的同义词及其相关词进行了有效处理,提高了文本特征词提取的准确性.

关 键 词:特征提取  TF-IDF  同义词  知网  同现概率

Improved Feature Selection Method Based on Similarity of Synonymous
XU Jian-min,LIU Qing-jiang,FU Ting-ting,DAI Xu.Improved Feature Selection Method Based on Similarity of Synonymous[J].Journal of Hebei University (Natural Science Edition),2010,30(1).
Authors:XU Jian-min  LIU Qing-jiang  FU Ting-ting  DAI Xu
Institution:1.College of Mathematics and Computer Science;Hebei University;Baoding 071002;China;2.Center of Media Experimental Teaching;China
Abstract:A method of improved feature extraction based on synonymous was proposed.The method collected synonyms in the text as a set,adjustment the weights of synonyms in the set and related words based on TF-IDF,and combined synonyms through the similarity.The experimental results display that the new method improves the accuracy of feature extraction.
Keywords:feature extraction  TF-IDF  synonymous  hownet  co-occurrence  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号