首页 | 本学科首页   官方微博 | 高级检索  
     

搜索服务中基于云计算的垃圾网页识别研究
引用本文:李艳平,徐雅斌,陈俊伊. 搜索服务中基于云计算的垃圾网页识别研究[J]. 华中科技大学学报(自然科学版), 2012, 0(Z1): 249-253
作者姓名:李艳平  徐雅斌  陈俊伊
作者单位:北京信息科技大学计算机学院;北京信息科技大学网络文化与数字传播北京市重点实验室
摘    要:为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少.

关 键 词:搜索服务  垃圾网页识别  支持向量机  云计算  Hadoop  MapReduce

Research on spam pages identification in search service based on cloud computing
Li Yanpinga,b Xu Yabina,b Chen Junyi. Research on spam pages identification in search service based on cloud computing[J]. JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE, 2012, 0(Z1): 249-253
Authors:Li Yanpinga  b Xu Yabina  b Chen Junyi
Affiliation:a(a School of Computer;b Beijing Key Laboratory of Internet Culture and Digital Dissemination Research,Beijing Information Science and Technology University,Beijing 100101)
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号