首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于超级链接结构的WWW模糊聚类算法
引用本文:陈晓平,许卓明.一种基于超级链接结构的WWW模糊聚类算法[J].江苏技术师范学院学报,2002,8(2):47-52.
作者姓名:陈晓平  许卓明
作者单位:常州技术师范学院人事处 江苏常州213001 (陈晓平),河海大学计算机及信息工程学院 江苏南京210098(许卓明)
摘    要:搜索引擎是目前最主要的WWW信息检索的工具 ,然而 ,用户对当前搜索引擎的检索效果并不满意。论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软 )聚类算法HTSC。对HTSC算法进行了理论分析 ,并对其中的核心算法进行了初步的实验验证。该算法可对搜索引擎返回的结果进行模糊聚类 ,以方便用户从中找到真正需要的信息。

关 键 词:万维网信息检索  搜索引擎  聚类  模糊聚类  相似度  内容分析  超链分析
修稿时间:2001年9月2日

WWW Fuzzy Clustering Algorithm Based on Link Structure
CHEN Xiao-ping,XU Zhuo-ming.WWW Fuzzy Clustering Algorithm Based on Link Structure[J].Journal of Jiangsu Teachers University of Technology,2002,8(2):47-52.
Authors:CHEN Xiao-ping  XU Zhuo-ming
Institution:CHEN Xiao-ping1,XU Zhuo-ming2
Abstract:Today, search engines are the most commonly used tools for Web information retrieval. Howe-ver, their current status is still far from user's satisfaction. This paper presents a fuzzy (soft) clustering algorithm (Hyperlink-Text based Soft Clustering ) using a mixed similarity metric of document contents and intercocument hyperlinks, for clustering Web search results from a search engine in order to help users find relevant Web information more easily. This paper includes the following: an effective method for computing interdocument similarities based on contents and link analysis: presenting a fuzzy (soft) clustering algori-thm HTSC base on a mixed similarity metric of contents and link: theoretic analysis and preliminary exp-eriments of the algorithm
Keywords:Web information retrieval  search engine  clustering  fuzzy clustering  similarity  contents analysis  link analysis  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号