首页 | 本学科首页   官方微博 | 高级检索  
     

基于相似度的快速网页排序算法
引用本文:毕硕本,曾晓文. 基于相似度的快速网页排序算法[J]. 科学技术与工程, 2014, 14(13): 67-70
作者姓名:毕硕本  曾晓文
作者单位:南京信息工程大学遥感学院,南京信息工程大学遥感学院
基金项目:国家自然科学基金资助项目(41071253、41271410)资助
摘    要:将经典的PageRank算法和汉明距离相似度算法结合,提出一种新的网页排序方法。通过结合汉明距离(Hamming distance)相似度算法,计算检索词和网页文本相似度,提高搜索查准率;在增加检索词的同义词的搜索过程中,通过改进汉明距离相似度算法,提高搜索查全率。实验结果表明,该方法与PageRank算法相比,拥有了更好的效果。

关 键 词:PageRank算法  汉明距离  相似度算法  同义词  查准率  查全率
收稿时间:2013-11-30
修稿时间:2013-11-30

A Quickly Webpage ranking Algorithm Based on Similarity
BI Shuo-ben and ZENG Xiao-wen. A Quickly Webpage ranking Algorithm Based on Similarity[J]. Science Technology and Engineering, 2014, 14(13): 67-70
Authors:BI Shuo-ben and ZENG Xiao-wen
Affiliation:School of Remote Sensing,Nanjing University of Information Science and Technology
Abstract:A new page ranking algorithm is proposed by combining the classic PageRank algorithm and Hamming distance similarity algorithm. The algorithm by combining the Hamming distance similarity algorithm to calculate the similarity of the search term and the web page text to improve precision. In the search process of increasing the synonyms of the search term, improved Hamming distance similarity algorithm to improve search recall. Experimental results show that the method is better compared with the PageRank algorithm.
Keywords:PageRank Algorithm   Hamming Distance    Similarity Algorithm   Synonyms   Precision   Recall
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号