期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄志强贾宇波《广西师范大学学报(自然科学版)》2007,25(2):69-73

在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。相似文献

2.

Web挖掘的体系研究 总被引：6，自引：0，他引：6

李亚飞刘业政《合肥工业大学学报(自然科学版)》2004,27(3):305-309

互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖掘包括信息提取和信息检索,Web信息提取的主要过程包括向量表示、特征提取、特征缩减和文本挖掘;对于信息检索,文章从搜索引擎的原理、分类以及最新的发展技术方面对其进行了论述;而对于结构挖掘和使用记录挖掘,文章主要论述了其算法和过程。相似文献

3.

Web日志挖掘及AprioriAll算法的改进 总被引：2，自引：0，他引：2

王彤何丕廉《天津理工大学学报》2007,23(1):13-17

阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求. 相似文献

4.

面向隐含语义文本的WEB数据挖掘研究

李旭董争鸣吴洪森《中国人民公安大学学报(自然科学版)》2010,16(1):58-61

针对目前Web挖掘的传统算法执行效率低、挖掘结果相关度低的缺陷,从Web挖掘的内容方面入手,在分析基于Web语义化文本数据挖掘关联规则结构的基础上,改进传统的Apriori算法,提出面向语义化的隐含文本数据挖掘算法,仿真结果表明改进后的算法具有较高的执行效率及较好的挖掘相关度,对于面向文本的Web挖掘算法研究具有一定的借鉴意义。相似文献

5.

基于关联规则的用户频繁访问模式研究

柴巧叶《太原师范学院学报(自然科学版)》2011,10(2):87-89

Web挖掘是将数据挖掘和WWW两个领域中的多种技术和方法结合起来的热门研究课题.它的研究领域包括Web内容挖掘、Web结构挖掘和Web使用挖掘.关联规则算法已成为数据挖掘算法中的重要课题.通过对关联规则挖掘算法进行分析,指出了该算法存在的一些问题,并提出了一种用户频繁访问模式结构. 相似文献

6.

基于PageRank和HITS的Web结构挖掘算法研究 总被引：1，自引：0，他引：1

刘栋刘希玉郝婷婷《山东科学》2006,19(4):11-14

在对Web结构挖掘的典型算法探讨的基础上,提出了一种PageRank算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。相似文献

7.

一种基于时间感知的搜索引擎模型 总被引：2，自引：0，他引：2

张乃洲曹薇陈珂锐李石君《山东大学学报(自然科学版)》2013,(11):80-86

目前许多用户查询与网页信息的时效性密切相关,但当前的搜索引擎在处理许多具有时间属性的查询时还不尽如人意。通过引入基于时间感知的用户查询理解、索引结构和页面排序算法,提出一种基于用户查询日志挖掘的时间感知搜索引擎模型,来克服当前主流搜索引擎在处理具有时效性查询时存在的不足在真实的Web环境下广泛进行的实验结果表明了该模型的有效性。相似文献

8.

Web日志挖掘技术应用研究 总被引：9，自引：2，他引：9

吕佳《重庆师范大学学报(自然科学版)》2006,23(4):39-44

随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望. 相似文献

9.

基于Web页面链接结构的挖掘算法

王一蕾林世平《福州大学学报(自然科学版)》2004,32(4):476-478

介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题. 相似文献

10.

基于免疫聚类的Web日志挖掘

吕佳《重庆师范大学学报(自然科学版)》2007,24(2):32-35

Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。相似文献

11.

Web日志挖掘改进网站结构的研究 总被引：1，自引：0，他引：1

王丽娜姚青山《河南科学》2008,26(10)

Web日志挖掘是目前Web挖掘研究的一个热点课题.针对Web日志挖掘中存在的问题,研究和分析了一个基于网站访问矩阵的路径挖掘算法.在此基础上设计和实现了一个Web日志挖掘系统(WLMS),通过发现用户访问的最优路径和网站访问的统计结果,改进网站性能和组织结构,提高用户查找信息的质量和效率. 相似文献

12.

电子商务站点中的频繁查找路径挖掘技术

边小勇张晓龙《武汉科技大学学报(自然科学版)》2006,29(4):388-390

Web上用户行为的挖掘是Web日志挖掘的重要内容，挖掘到的查找路径能够提供决策支持。分析频繁项集挖掘和路径挖掘的不同之处，提出了类Apriori算法，使之适用于路径挖掘，然后在VC＋＋中针对预处理过的日志数据进行实验分析，获得了一些可信度高的关联页面，这些页面关联信息将有助于改进商业站点结构，提高站点的访问率。相似文献

13.

基于Web挖掘的用户个性化服务研究 总被引：1，自引：0，他引：1

丁一孙玉霞《湖北师范学院学报(自然科学版)》2005,25(3):23-27

随着WWW的广泛应用及相应的Web技术的出现．使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理，解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。相似文献

14.

面向专题的智能化中文搜索引擎

陈华梁循杨健《广西师范大学学报(自然科学版)》2007,25(2):103-106

讨论了智能专题搜索引擎的相关设计和实现,通过信息搜索技术、自然语言理解技术、语义网络技术以及数据挖掘技术的引入,改进了传统搜索引擎的搜索结构,进而采用这些技术实现了一个专题搜索的实例。相似文献

15.

基于WEB的数据挖掘研究综述 总被引：5，自引：0，他引：5

蒋望东黄发良《湖南工程学院学报(自然科学版)》2007,17(1):61-64

运用数据挖掘技术进行Web数据挖掘成为数据分析领域中的一个重要研究热点,与传统数据相比较,Web数据具有结构复杂、形式多样与内容广泛等特点,且用户对其需求亦是五花八门的,这对数据分析领域提出了更大的挑战.基于为研究Web数据挖掘提供参考,将Web数据挖掘粗略地分为三类:内容挖掘、结构挖掘和使用挖掘,并分别进行了综述,然后根据当前的应用现状分析了这一研究领域的几个研究方向. 相似文献

16.

基于投影聚类算法的Web文本挖掘证券投资系统

袁赟张英杰《邵阳学院学报(自然科学版)》2009,6(4):61-65

随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点．Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识．本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高．最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中．相似文献

17.

Web挖掘技术及其在网站管理中的应用

王继明杨国林《内蒙古师范大学学报(自然科学版)》2007,36(2):188-191

将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中，实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个性化布局的功能，显著提高了网站管理中处理大量信息的效率，增强了网站的个性化特征．相似文献

18.

基于DBSCAN聚类算法的Web文本挖掘

傅华忠茅剑《科技信息》2007,(1)

Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法．以及它在文本挖掘中的具体实现过程。相似文献