首页 | 本学科首页   官方微博 | 高级检索  
     检索      

人名、机构名在基于概念的文本分类中的应用研究
引用本文:吴志峰,田学东.人名、机构名在基于概念的文本分类中的应用研究[J].河北大学学报(自然科学版),2004,24(6):657-661.
作者姓名:吴志峰  田学东
作者单位:河北大学,数学与计算机学院,河北,保定,071002;河北大学,数学与计算机学院,河北,保定,071002
基金项目:河北省自然科学基金资助项目(F2004000132)
摘    要:基于概念的文本分类方法,能对同义词、多义词进行比较好的处理,是一种比较优秀的文本分类算法.但是此方法往往对人名、机构名等具有分类特征的词不能很好地处理,依然停留在关键词的层次.提出了一种将语义词典与一部人名、机构名构成的专有名词词典相结合的新的概念分类方法,并经过实验验证了其有效性.

关 键 词:文本分类  概念分类  KNN  朴素贝叶斯
文章编号:1000-1565(2004)06-0657-05
修稿时间:2003年9月3日

Application of Name of People and Institution in Text Categorization
WU Zhi-feng,TIAN Xue-dong.Application of Name of People and Institution in Text Categorization[J].Journal of Hebei University (Natural Science Edition),2004,24(6):657-661.
Authors:WU Zhi-feng  TIAN Xue-dong
Abstract:Text categorization based on concept is a new method that was introduced in recent years.It offset some shortcomings of the tradition method,such as the phenomenon of synonymy.But this new method can't dispose the name of people and the name of institution.A new method for Text Categorization based on concept was introduced.In our experience we formed a new dictionary that included a lot of name of people that often appeared in text.At last we checked our method is efficiency by experience.
Keywords:text categorization  concept categorization  KNN  naive bayes
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《河北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《河北大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号