首页 | 本学科首页   官方微博 | 高级检索  
     

研究中文文本分类技术的辅助平台
引用本文:白若鹞,董渊,张素琴,徐大伟. 研究中文文本分类技术的辅助平台[J]. 清华大学学报(自然科学版), 2008, 48(7)
作者姓名:白若鹞  董渊  张素琴  徐大伟
作者单位:清华大学,计算机科学与技术系,北京,100084;长春大学,计算机科学技术学院,长春,130022
基金项目:国家自然科学基金,国家海洋局数字海洋项目
摘    要:为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台.该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究.实验结果表明: 该平台可以通过计算分类器分类准确率的宏平均值比较分类算法与特征选择算法的性能,可以评估语料库的可用性,能够用于研究中文分词、特征选择、分类算法等中文文本分类技术问题.

关 键 词:自动文本分类  中文分词  特征选择  分类算法

Support platform for researching Chinese text categorization technologies
BAI Ruoyao,DONG Yuan,ZHANG Suqin,XU Dawei. Support platform for researching Chinese text categorization technologies[J]. Journal of Tsinghua University(Science and Technology), 2008, 48(7)
Authors:BAI Ruoyao  DONG Yuan  ZHANG Suqin  XU Dawei
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号