首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
Web结构挖掘算法探讨   总被引:15,自引:0,他引:15  
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink—InducedTopic Search)算法。Hub页面的多主题性、无关页面和无关链接等对于HITS算法有较大影响。针对这些问题,提出了HITS算法的改进算法。  相似文献   

2.
张佳  梁少华 《科技信息》2007,(2):20-20,53
Web结构挖掘是对Web页面之间的结构进行挖掘。挖掘对象主要是页面的超链接结构,这种结构为人们增强对网页的分析处理提供了极大的帮助。本文对基于超链接的Web结构挖掘进行了概述,并对其主要算法PageRank进行了研究。  相似文献   

3.
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。  相似文献   

4.
广义Web内容挖掘模型算法   总被引:2,自引:0,他引:2  
在信息时代的今天,网络以几何速度飞速发展,成为现代人获取信息的主要来源之一.也正因为网络信息增长太快,人们反而面临“信息爆炸”与“知识贫瘠”共存的局面.数据挖掘(DM)是通过数据获取知识的最佳工具,由此,产生了Web数据挖掘,即KDW的概念.本文重点论述广义Web内容挖掘的特点与发展、狭义的内容挖掘中页面内和页面间挖掘的区分及应用的主要算法、结构挖掘中的两大算法及其优劣.  相似文献   

5.
Intemet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文就Web挖掘技术的概念、分类、研究现状及其相关实现技术做了详细的阐述,并在此基础上指出其发展方向和趋势。  相似文献   

6.
Web数据挖掘技术及应用研究   总被引:1,自引:0,他引:1  
Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的结果。本文介绍了Web数据挖掘的定义,Web数据挖掘的分类以及各自相关技术,并对Web数据挖掘的应用前景进行了探讨。  相似文献   

7.
Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。讨论Web数据挖掘技术中各种类型的Web数据挖掘的基本过程以及它们所使用的一些相关技术,分析Web数据挖掘的特点及面临的挑战.  相似文献   

8.
Web挖掘技术的应用之一就是Web搜索引擎。对于搜索引擎中的Web结构挖掘,通过对经典的超链接分析算法的研究,对Web超链结构进行深入分析的基础上,针对HITS算法的缺陷,通过引入权值和调整因子对其进行改进。实验表明,改进后的算法表现更加出色。  相似文献   

9.
介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题.  相似文献   

10.
本文分析了Web网页的数据挖掘最新技术及发展方向,介绍了基于XML的Web数据挖掘的特点,提出了基于XML的数据抽取技术,最终得到所需的数据并通过一个通用的应用模式进行挖掘的全过程.  相似文献   

11.
现有的查询结果多样化研究很难准确得到用户多样性需求并提供与用户查询各个方面需求相关的文档。针对这个问题,本文基于HITS算法的网页间链接分析特性,根据网页链接图直接计算查询结果列表中的文档可能满足用户多样性需求的程度,并将其应用到结果列表的重排序中以实现搜索结果多样性。在TREC大规模数据集合上的实验结果表明了该方法的有效性。  相似文献   

12.
基于IIS和web日志的关联关系的挖掘   总被引:4,自引:0,他引:4  
针对隐藏在web日志的大量记录中的规律性开展研究,提出了一种基于微软的ⅡS合理构建web日志并进行数据预处理的方案,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系,将数据预处理过程提前到web日志的建立过程中,可极大地降低数据准备的复杂性,将日志数据导入关系数据库中进行净化处理,大幅度减少了工作量,该方案可用于ⅡS下的商业网站。  相似文献   

13.
基于Web的数据挖掘应用模式研究   总被引:8,自引:0,他引:8  
如何对Web上的海量信息进行高效的应用 ,使之能做到信息处理的智能化、个性化、自动化 ,是当今数据挖掘技术的最重要的应用。本文从分析Web上数据信息的特点入手 ,研究面向Web的数据挖掘需解决的主要问题 ,提出了一种基于Web数据挖掘的应用模式框架 ,并着重从功能的角度介绍了Web数据挖掘的演进过程。  相似文献   

14.
0 IntroductionSincethemostservicesinInternetareofferedviaWeb ,WorldWideWebbecomesmoreimportantthanbefore.TheWebsitestructureisbecomingmorecomplex .InWebsite’splanninganddesigning ,theWebsitestructureisdependantonthedesigner’sexperienceforlackingofmodelandmethod,whichleadstounreasonableWebstructureforusersaccessingandlossesmanyvisitors.Itisagreatpityforcommercesiteorenterprisebusinesssite.Fromtheviewofthepointofsoftwareengineering ,theperformanceofWebsiteshouldbeevaluatedineveryperiodof…  相似文献   

15.
全方位的对各类聚类算法进行总结和归纳,并且对一些在特殊领域中应用聚类算法进行深度解析,然后从以下三个部分,算法思想,关键技术以及算法特点等方面进行基本概括,对一些代表性的聚类算法进行比较分析以及聚类算法新领域研究的展望,这对将来聚类发展具有重大意义.  相似文献   

16.
XML与Web数据挖掘技术   总被引:2,自引:1,他引:2  
数据挖掘技术的核心部分已发展了近十年,研究领域涉及数理统计、人工智能、机器学习等。由于Web数据存在方式的特殊性,使Web数据控制变得十分复杂,XML的出现为解决Web数据挖掘的难题带来了机会。若XML成为具有相互连接特性的因特网标准,那么新一代因特网的关键在于把握XML。因此,研究XML在Web数据挖掘中的应用显得十分重要。文中主要讨论了XML的基本概念及XML在Web数据挖掘中的应用。  相似文献   

17.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

18.
Web挖掘在电子商务中的应用   总被引:1,自引:0,他引:1  
首先介绍了Web挖掘的概念,以及Web使用挖掘和Web内容挖掘这两个主要类型,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘在电子商务中的具体应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号