首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于主题本体扩展特征的短文本分类
引用本文:湛燕,陈昊.基于主题本体扩展特征的短文本分类[J].河北大学学报(自然科学版),2014,34(3):307-311.
作者姓名:湛燕  陈昊
作者单位:河北大学数学与计算机学院,河北省机器学习与计算智能重点实验室,河北保定071002
基金项目:国家自然科学基金资助项目(60903088);河北省自然科学基金资助项目(F2013201064;A2010000188);河北大学自然科学研究计划青年基金资助项目(2010Q23);河北省软科学研究计划项目(14450318D)
摘    要:短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性.

关 键 词:短文本分类  主题本体  案例维护  

Short text categorization based on theme ontology feature extended
ZHAN Yan;CHEN Hao.Short text categorization based on theme ontology feature extended[J].Journal of Hebei University (Natural Science Edition),2014,34(3):307-311.
Authors:ZHAN Yan;CHEN Hao
Institution:ZHAN Yan;CHEN Hao;Key Laboratory of Machine Learning and Computational Intelligence,College of Mathematics and Computer Science,Hebei University;
Abstract:
Keywords:short text categorization  theme ontology  case-base maintenance  
本文献已被 CNKI 等数据库收录!
点击此处可从《河北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《河北大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号