首页 | 本学科首页   官方微博 | 高级检索  
     

网页去重在基于Web企业竞争情报平台中的应用与研究
引用本文:杨申彦,黄青松. 网页去重在基于Web企业竞争情报平台中的应用与研究[J]. 云南民族大学学报(自然科学版), 2008, 17(4)
作者姓名:杨申彦  黄青松
作者单位:昆明理工大学,信息工程与自动化学院,云南,昆明,650051
基金项目:昆明市科技型中小企业技术创新资助项目
摘    要:互联网上大量重复网页的存在,严重地影响信息的检索质量.因此提出了一种基于特征码散列的网页去重算法,利用特征码对特征语句集散列以缩小其比较的范围,提高了网页去重的准确性.实验表明该算法准确率高,性能良好,基于上述算法实现了基于Web的企业情报竞争平台中的网页去重.

关 键 词:网页去重  特征码  特征语句集

The Application and Research of Duplicated Web Pages Based on the Web Platform of the Competitive Intelligence
Yang Shenyan,Huang Qingsong. The Application and Research of Duplicated Web Pages Based on the Web Platform of the Competitive Intelligence[J]. Journal of Yunnan Nationalities University:Natural Sciences Edition, 2008, 17(4)
Authors:Yang Shenyan  Huang Qingsong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号