首页 | 本学科首页   官方微博 | 高级检索  
     

基于特征串的网页去重算法
作者姓名:姚新波,  马治坤
作者单位:宁夏大学数学与计算机学院,宁夏农垦集团
摘    要:用户在互联网中网页检索时,经常会得到大量内容相同的冗余页面,不仅浪费了存储资源,而且给用户带来许多不便。本文对现有的几种重复网页识别技术的优缺点进行了比较,并且重点讨论了基于特征串的网页快速去重算法。

关 键 词:重复网页识别  特征串  召回率
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号