首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 152 毫秒
1.
Web文本挖掘在人们的日常生活和决策分析过程中起到了越来越重要的作用。介绍了Web挖掘的概念和基本特征,在此基础上重点研究了Web文本挖掘方法,引出了Web文本挖掘的模型WebMiner。结合知识库概念,尝试对WebMiner模型进行改进,提出了基于知识库的Web文本挖掘模型K-WebMiner,希望可以提高Web内容挖掘的效果。  相似文献   

2.
Web挖掘就是从Web文档和Web活动中抽取感兴趣的潜在的有用模式和隐藏的信息。本文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。  相似文献   

3.
随着Internet/Web技术的快速普及和迅猛发展使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于web的应用.文章就web挖掘技术的概念、分类及文本挖掘和用户访问模式挖掘的实现技术做了详细地阐述,在此基础上列举了Web挖掘中的难点,并简要介绍了一下Web挖掘技术在电子商务、网站设计等领域的应用.  相似文献   

4.
Web挖掘的体系研究   总被引:6,自引:0,他引:6  
互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖掘包括信息提取和信息检索,Web信息提取的主要过程包括向量表示、特征提取、特征缩减和文本挖掘;对于信息检索,文章从搜索引擎的原理、分类以及最新的发展技术方面对其进行了论述;而对于结构挖掘和使用记录挖掘,文章主要论述了其算法和过程。  相似文献   

5.
一种基于WEB站点的多媒体数据挖掘方法   总被引:1,自引:1,他引:0  
随着Web技术及Web数据挖掘技术的成熟和发展,对Web中多媒体的挖掘已经开始成为人们研究的一个热点。基于国内现阶段对Web数据挖掘的研究大多停留在对文本的挖掘,而对多媒体挖掘的研究还很少的状况,采用了基于内容的多媒体相联规则方法——最大出现次数算法,对多媒体数据进行挖掘.先建立了挖掘的基本框架,然后具体介绍这种方法,并详细描述了挖掘的基本流程,最后展望了该领域将要作进一步研究的内容.  相似文献   

6.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。  相似文献   

7.
张柱和 《科技信息》2009,(19):51-52
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面太广,而用户需要的却只是其中很少的一部分。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的、有用模式和隐藏的信息。本文主要研究了Web数据挖掘的内容,包括Web挖掘的特点、Web挖掘的分类和Web挖掘流程等。  相似文献   

8.
探讨了Web挖掘的相关理论,包括Web文本信息的表示及特征提取,关联规则分析和信息分类,综合Web挖掘的关键技术,提出了一个基于Web挖掘技术的信息分类模型系统,使用户能够对已分类的资源进行浏览、检索,从而更方便、快捷地获取所需信息。  相似文献   

9.
基于Web的数据挖掘技术   总被引:1,自引:0,他引:1  
随着Internet的发展,Web数据挖掘已成为一个热门研究的主题,并有着越来越广泛的应用。本文介绍了Web数据挖掘的关键技术,提出了一种基于Web数据挖掘的应用模式框架,最后对Web数据挖掘的应用前景进行了探讨。  相似文献   

10.
目前上存有大量的数据信息,如何对这些数据进行有效的应用已经成了当前数据库技术研究的重点。基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究主题。本文介绍了基于移动Agent的Web数据挖掘技术,各挖掘算法集中到移动Agent子系统中,并根据要求动态地创建,然后派遣它们到数据站点数据库中进行数据挖掘,提出了一种基于Web数据挖掘的模型。  相似文献   

11.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

12.
在分析Web文本挖掘过程、关键技术的基础上,针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的Web文本挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约减,从而获得表示用户不同主题感兴趣概念向量。  相似文献   

13.
基于Web的数据挖掘方法的研究及实现   总被引:3,自引:0,他引:3  
Web上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XML、JAVA的新型数据挖掘技术。  相似文献   

14.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

15.
随着3D Web技术的成熟与发展,第二代Web离我们越来越近,从3D Web中挖掘多媒体数据是一个新兴的研究领域.提出了一种基于VRML标准的多媒体数据模型——VMDM,该模型能够充分表达3D Web中的多媒体对象的特征,且易于实现,尤其易于可视化的数据挖掘.同时,在此模型基础上,提出了基于兴趣的个性收索方法,并给出了部分算法,最后,给出了基于VMDM模型的3D Web多媒体数据查询语言VMQL,并展望了在该领域将要进一步研究的内容.  相似文献   

16.
Web使用挖掘是将数据挖掘和WWW这两个领域中的多种技术和方法结合起来的热门研究课题。Web使用挖掘中,数据预处理是基础、挖掘访问模式是核心、模式分析与显示是目的。在数据预处理阶段,结合时间启发方式和引用启发方式提出了时间引用启发方式的会话构造方法。该方法不仅利用了用户会话的时间特性,而且考虑了用户的浏览特性。  相似文献   

17.
给出了一种分布式Web日志挖掘模型DWLMS. 根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难. 在实验室对该方法进行了简单实现和实际日志数据的测试,结果表明了算法的有效性.  相似文献   

18.
研究从区块链学术文献和区块链社区两个方面,以CiteSpace和Web文本挖掘作为工具,从非结构化文本数据分析入手,梳理2015—2022年国内区块链的学术研究以及协同创新社区两方面的关注热点,以期全方位了解区块链研究的创新知识热点变化趋势,为未来区块链的研究和发展提供借鉴。  相似文献   

19.
Web日志挖掘技术应用研究   总被引:11,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号