首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Hadoop的Web文本分类系统设计研究
引用本文:赵文娟.基于Hadoop的Web文本分类系统设计研究[J].兰州大学学报(自然科学版),2014(6):892-896.
作者姓名:赵文娟
作者单位:山西大学商务学院信息学院,太原,030031
基金项目:国家自然科学基金项目,山西省高等学校科技创新项目,全国教育信息技术研究十二五规划课题项目
摘    要:针对传统Web文本分类方法无法解决大规模分类问题,在深入分析当前主流并行计算平台Hadoop的基础上,提出基于Hadoop的Web文本分类系统,该系统主要包括文本预处理、向量表示、文本分类、结果评价等模块.真实数据集上的比较实验表明所建系统的有效性.

关 键 词:Web文本分类  Hadoop  HDFS  Mapreduce

Research on designing a web text classification system based on Hadoop
ZHAO Wen-juan.Research on designing a web text classification system based on Hadoop[J].Journal of Lanzhou University(Natural Science),2014(6):892-896.
Authors:ZHAO Wen-juan
Institution:ZHAO Wen-juan;School of Information, Business College of Shanxi University;
Abstract:
Keywords:Web text classification  Hadoop  HDFS  Mapreduce
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号