共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
Web日志中挖掘用户浏览模式的研究 总被引:24,自引:0,他引:24
研究了Web日志挖掘的机理,提出了使用频繁遍历径作为用户浏览模式,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。 相似文献
3.
一种有效的Web使用挖掘体系结构 总被引:1,自引:1,他引:1
潘钧 《扬州大学学报(自然科学版)》2005,8(2):40-44
对Web挖掘的特征、分类及与其相关的技术和工具进行了分析,针对现有的Web使用挖掘研究中缺乏统一而有效的结构模型的问题,提出了一种有效的Web使用挖掘的体系结构,并详细地分析了利用该结构模型处理Web使用挖掘的过程,最后,利用某大学网站的Web日志数据验证了该结构的有效性. 相似文献
4.
Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。 相似文献
5.
本文介绍了Web挖掘的概念、意义、分类以及研究现状,并重点对Web使用挖掘过程中模式发现阶段所使用的各种关键技术作了详细全面的分析。最后指出了Web使用挖掘在将来的主要研究方向。 相似文献
7.
基于XML的Web数据挖掘技术 总被引:5,自引:0,他引:5
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法. 相似文献
8.
9.
10.
Web使用挖掘中的一种改进的会话识别方法 总被引:19,自引:0,他引:19
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,为合理有效。 相似文献
11.
一种基于改进的AprioriAll算法的Web路径模式挖掘 总被引:2,自引:0,他引:2
对路径模式挖掘的原理做了详细的阐述,并且针对挖掘对象的特性,对AprioriAll算法中生成侯选序列的函数做了相应的改进。最后通过实例说明了改进的AprioriAll算法在路径模式挖掘中的有效性。 相似文献
12.
基于XML的Web数据挖掘 总被引:4,自引:0,他引:4
介绍了数据挖掘、Web数据挖掘以及XML的基础知识,阐述了将XML技术应用于Web数据挖掘,构建基于XML的Web数据挖掘系统结构. 相似文献
13.
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息. 相似文献
14.
基于XML的WEB数据挖掘系统框架的设计与实现 总被引:9,自引:0,他引:9
互联网的广泛应用使Web数据挖掘成为当前数据挖掘技术研究的热点,而XML正逐渐成为新一代互联网数据组织和交换的事实标准,两者的结合-基于XML的Web数据挖掘技术成为Web数据挖掘中一个重要的研究课题。分析了Web数据挖掘技术的难点,提出了一个基于XML的Web内容数据挖掘系统框架。 相似文献
15.
随着语义Web技术的出现,传统的Web挖掘面临新的挑战.文章讨论了语义Web的体系结构、Web挖掘和Agent技术的有关概念,提出了基于多Agent的语义Web挖掘系统模型,并对其进行了分析.实验结果表明,该系统模型具有较高的准确性和效率. 相似文献
16.
Web数据挖掘是将数据挖掘技术和理论应用于对互联网资源挖掘的一门新兴研究领域.XML能够为web数据挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型. 相似文献
17.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性. 相似文献
18.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容. 相似文献
19.
基于HTML的“瘦客户机”Web模型是当前流行的应用程序开发模型,但这种模型存在数据结构复杂、数据的可读性差、数据的共享性差和数据重复利用率低等弱点。为了解决这些问题,笔者提出了一种基于XML的多层次的Web应用程序模型,充分利用了XML技术的数据与表现形式分离所带来的特点,从而为解决上述问题提供了一种途径。 相似文献