首页 | 本学科首页   官方微博 | 高级检索  
     检索      

网络数据的挖掘
引用本文:曹晓声,乔杰华.网络数据的挖掘[J].辽宁工程技术大学学报(自然科学版),2006,25(Z1):214-215.
作者姓名:曹晓声  乔杰华
作者单位:1. 中国航天员科研与训练中心,第四研究室,北京,100094
2. 63601部队,甘肃,兰州,732750
摘    要:对当前实用的搜索引擎技术作了较为全面的综述,主要介绍了搜索引擎中较为核心的两大技术:信息采集及数据搜索技术,对当前较为先进和常用的相关技术进行了列举,并对各类技术的优缺点作了简要的比较及说明。特别对信息采集中网络蜘蛛的工能及原理进行了介绍,详细介绍了著名的互联网搜索引擎Google在数据检索方面所使用的PageRank算法,最后较为全面的给出了几种主要的中文分词技术。利用个别现有的著名搜索引擎实例对相关技术的实现进行了举例和说明。

关 键 词:搜索引擎  数据挖掘  网络蜘蛛  分词
文章编号:1008-0562(2006)增刊1-0214-02
修稿时间:2006年3月19日

Network data mining
CAO Xiao-sheng,QIAO Jie-hua.Network data mining[J].Journal of Liaoning Technical University (Natural Science Edition),2006,25(Z1):214-215.
Authors:CAO Xiao-sheng  QIAO Jie-hua
Abstract:This paper summarizes current useful search engines and introduces two great techniques of them: techniques for information collection and the data searching,compared with several primary techniques.It makes simple comparison and introduction of several kinds of techniques.Especially,the paper introduces function and theory of network spider among information collection.It also tells PageRank arithmetic of Google data searching engine in detail.And finally the paper presents some main separate words technologies to readers.It also uses some current famous searching engines to illustrate the former techniques.
Keywords:search engine  data mining  network spider  separate words
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号