首页 | 本学科首页   官方微博 | 高级检索  
     检索      

多层文本分类性能评价方法
引用本文:宋胜利,鲍亮,陈平.多层文本分类性能评价方法[J].系统工程与电子技术,2010,32(5):1088-1093.
作者姓名:宋胜利  鲍亮  陈平
作者单位:(西安电子科技大学软件工程研究所, 陕西 西安 710071)
基金项目:国家"十一五"国防预研基金,陕西省自然科学基金(SJ08F25)资助课题 
摘    要:为了准确评价多层文本分类方法,解决传统平面分类评价指标应用到多层分类中的局限性,在研究基于概念树的多层文本分类方法基础上,有效利用多层结构中类别之间的层次关系和“亲疏”关系,提出了一组能够准确描述多层分类性能的扩展评价指标。利用错误分类样本分布定义了错误分类集中度,在评价分类结果的同时能够指导训练样本的选择过程,使得训练样本更具有代表性。通过中文新闻语料的分类实验,证明了扩展评价指标对于多层分类结果的评价更为准确,错误分类集中度有助于训练出更加准确的分类模型。

关 键 词:模式识别  文本分类  类别层次  错误分类分布  分类模型

Hierarchical text classification and evaluation
SONG Sheng-li,BAO Liang,CHEN Ping.Hierarchical text classification and evaluation[J].System Engineering and Electronics,2010,32(5):1088-1093.
Authors:SONG Sheng-li  BAO Liang  CHEN Ping
Institution:(Software Engineering Inst., Xidian Univ.,   Xi’an 710071, China)
Abstract:To evaluate hierarchical classification methods and resolve the limitations of conventional flat classification measures for hierarchical classification evaluation,after studying the hierarchical classification method based on concept tree,a set of extended measures are put forward to accurately describe its performance,by effectively using the level and affinity among the categories in hierarchical structure.And further a definition of error classification concentration ratio(ECCR) is given based on the di...
Keywords:pattern recognition  text classification  hierarchical category  error classification concentration ratio(ECCR)  classification model  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《系统工程与电子技术》浏览原始摘要信息
点击此处可从《系统工程与电子技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号