期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Web结构挖掘算法探讨 总被引：15，自引：0，他引：15

宋建康张礼平《华东理工大学学报(自然科学版)》2003,29(5):537-540

在分析Web结构挖掘现有算法的基础上，重点研究了HITS(Hyperlink—InducedTopic Search)算法。Hub页面的多主题性、无关页面和无关链接等对于HITS算法有较大影响。针对这些问题，提出了HITS算法的改进算法。相似文献

2.

Web结构挖掘与其基于超链接结构的算法

张佳梁少华《科技信息》2007,(2):20-20,53

Web结构挖掘是对Web页面之间的结构进行挖掘。挖掘对象主要是页面的超链接结构,这种结构为人们增强对网页的分析处理提供了极大的帮助。本文对基于超链接的Web结构挖掘进行了概述,并对其主要算法PageRank进行了研究。相似文献

3.

基于PageRank与HITS的改进算法的网页排名优化

下载免费PDF全文

库珊刘钊《武汉科技大学学报》2019,(2):155-160

针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。相似文献

4.

广义Web内容挖掘模型算法 总被引：2，自引：0，他引：2

高宏朱耀稷《天津理工大学学报》2005,21(2):29-32

在信息时代的今天,网络以几何速度飞速发展,成为现代人获取信息的主要来源之一．也正因为网络信息增长太快,人们反而面临“信息爆炸”与“知识贫瘠”共存的局面．数据挖掘(DM)是通过数据获取知识的最佳工具,由此,产生了Web数据挖掘,即KDW的概念．本文重点论述广义Web内容挖掘的特点与发展、狭义的内容挖掘中页面内和页面间挖掘的区分及应用的主要算法、结构挖掘中的两大算法及其优劣．相似文献

5.

Web数据挖掘的技术研究

苏晶《中国新技术新产品精选》2008,(17):13-13

Intemet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文就Web挖掘技术的概念、分类、研究现状及其相关实现技术做了详细的阐述,并在此基础上指出其发展方向和趋势。相似文献

6.

Web数据挖掘技术及应用研究 总被引：1，自引：0，他引：1

李争艳《科技资讯》2007,(14):95

Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的结果。本文介绍了Web数据挖掘的定义,Web数据挖掘的分类以及各自相关技术,并对Web数据挖掘的应用前景进行了探讨。相似文献

7.

Web数据挖掘技术初探

周军《镇江高专学报》2009,22(1):46-49

Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。讨论Web数据挖掘技术中各种类型的Web数据挖掘的基本过程以及它们所使用的一些相关技术,分析Web数据挖掘的特点及面临的挑战. 相似文献

8.

一种基于结构分析的改进HITS算法

仲婷金浩冯茜芦潘金贵《广西师范大学学报(自然科学版)》2007,25(2):214-217

Web挖掘技术的应用之一就是Web搜索引擎。对于搜索引擎中的Web结构挖掘,通过对经典的超链接分析算法的研究,对Web超链结构进行深入分析的基础上,针对HITS算法的缺陷,通过引入权值和调整因子对其进行改进。实验表明,改进后的算法表现更加出色。相似文献

9.

基于Web页面链接结构的挖掘算法

王一蕾林世平《福州大学学报(自然科学版)》2004,32(4):476-478

介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题. 相似文献

10.

基于XML的Web数据挖掘及应用模式研究

史哲《科技咨询导报》2011,(2):29-30

本文分析了Web网页的数据挖掘最新技术及发展方向,介绍了基于XML的Web数据挖掘的特点,提出了基于XML的数据抽取技术,最终得到所需的数据并通过一个通用的应用模式进行挖掘的全过程. 相似文献

11.

基于HITS算法的查询结果多样化方法

陈飞张敏刘奕群马少平《山东大学学报(理学版)》2011,46(5):44-48

现有的查询结果多样化研究很难准确得到用户多样性需求并提供与用户查询各个方面需求相关的文档。针对这个问题,本文基于HITS算法的网页间链接分析特性,根据网页链接图直接计算查询结果列表中的文档可能满足用户多样性需求的程度,并将其应用到结果列表的重排序中以实现搜索结果多样性。在TREC大规模数据集合上的实验结果表明了该方法的有效性。相似文献

12.

基于IIS和web日志的关联关系的挖掘 总被引：4，自引：0，他引：4

张静田忠和《华中科技大学学报(自然科学版)》2002,30(8):37-39

针对隐藏在web日志的大量记录中的规律性开展研究，提出了一种基于微软的ⅡS合理构建web日志并进行数据预处理的方案，在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系，将数据预处理过程提前到web日志的建立过程中，可极大地降低数据准备的复杂性，将日志数据导入关系数据库中进行净化处理，大幅度减少了工作量，该方案可用于ⅡS下的商业网站。相似文献

13.

基于Web的数据挖掘应用模式研究 总被引：8，自引：0，他引：8

林建勤《贵州师范大学学报(自然科学版)》2004,22(3):92-96

如何对Web上的海量信息进行高效的应用 ,使之能做到信息处理的智能化、个性化、自动化 ,是当今数据挖掘技术的最重要的应用。本文从分析Web上数据信息的特点入手 ,研究面向Web的数据挖掘需解决的主要问题 ,提出了一种基于Web数据挖掘的应用模式框架 ,并着重从功能的角度介绍了Web数据挖掘的演进过程。相似文献

14.

Evaluation method of Web site structure based on Web structure mining

Li Jun |e Zhou Dong |ru . Computer Center Wuhan University Wuhan Hubei China . School of Computer Wuhan University Wuhan Hubei China 《武汉大学学报:自然科学英文版》2003,8(3):791-796

0　IntroductionSincethemostservicesinInternetareofferedviaWeb ,WorldWideWebbecomesmoreimportantthanbefore.TheWebsitestructureisbecomingmorecomplex .InWebsite’splanninganddesigning ,theWebsitestructureisdependantonthedesigner’sexperienceforlackingofmodelandmethod,whichleadstounreasonableWebstructureforusersaccessingandlossesmanyvisitors.Itisagreatpityforcommercesiteorenterprisebusinesssite.Fromtheviewofthepointofsoftwareengineering ,theperformanceofWebsiteshouldbeevaluatedineveryperiodof… 相似文献

15.

聚类算法在数据挖掘领域的研究

蔡程宇娄渊胜《哈尔滨商业大学学报(自然科学版)》2015,(2):237-241

全方位的对各类聚类算法进行总结和归纳,并且对一些在特殊领域中应用聚类算法进行深度解析,然后从以下三个部分,算法思想,关键技术以及算法特点等方面进行基本概括,对一些代表性的聚类算法进行比较分析以及聚类算法新领域研究的展望,这对将来聚类发展具有重大意义. 相似文献

16.

XML与Web数据挖掘技术 总被引：2，自引：1，他引：2

林建勤《贵州师范大学学报(自然科学版)》2003,21(2):106-110

数据挖掘技术的核心部分已发展了近十年,研究领域涉及数理统计、人工智能、机器学习等。由于Web数据存在方式的特殊性,使Web数据控制变得十分复杂,XML的出现为解决Web数据挖掘的难题带来了机会。若XML成为具有相互连接特性的因特网标准,那么新一代因特网的关键在于把握XML。因此,研究XML在Web数据挖掘中的应用显得十分重要。文中主要讨论了XML的基本概念及XML在Web数据挖掘中的应用。相似文献

17.

一种分布式Web使用模式挖掘模型及算法

张克君杨炳儒赵耿曲文龙李欣《北京科技大学学报》2006,28(9):896-901

给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性. 相似文献

18.

Web挖掘在电子商务中的应用 总被引：1，自引：0，他引：1

刘建国《重庆工商大学学报(自然科学版)》2004,21(4):384-387

首先介绍了Web挖掘的概念，以及Web使用挖掘和Web内容挖掘这两个主要类型，论述了电子商务中Web挖掘的过程和方法，最后阐述了Web挖掘在电子商务中的具体应用。相似文献