首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
在分析Web文本挖掘过程、关键技术的基础上,针对训练文本集中往往存在多个主题类别的问题,提出一种基于聚类分析策略的Web文本挖掘方法。其基本思路是对训练文档集进行聚类处理,然后对同主题文档进行共性分析,并经过特征权值调整和特征约减,从而获得表示用户不同主题感兴趣概念向量。  相似文献   

2.
Web文本挖掘研究   总被引:4,自引:0,他引:4  
介绍Web文本的概念、一般过程和挖掘的关键技术,为智能化Web奠定一定基础。  相似文献   

3.
Web上有海量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。  相似文献   

4.
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取.  相似文献   

5.
张筱丹 《科技信息》2009,(4):165-166
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。  相似文献   

6.
Web挖掘技术   总被引:7,自引:1,他引:7  
万维网的出现使计算机拥有海量的信息资源 ,而其中蕴含的知识却未能得到充分利用。为此 ,Web挖掘技术成为一项重要研究课题。文中对Web挖掘分类、与Web挖掘相关的各种技术以及Web挖掘应用加以阐述。最后提出了一个综合Web挖掘原型系统SWMS。  相似文献   

7.
Web信息挖掘现状及应用前景   总被引:2,自引:0,他引:2  
介绍了Web信息挖掘的环境与分类,论述了Web挖掘技术,展望了信息挖掘的应用前景。  相似文献   

8.
将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中,实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个性化布局的功能,显著提高了网站管理中处理大量信息的效率,增强了网站的个性化特征.  相似文献   

9.
基于Web的数据挖掘是一种结合了数据挖掘和互联网系统的热门研究课题.随着互联网的高速发展,Web挖掘由于其独特的优点,在Web交易中扮演了越来越重要的角色.运用Web挖掘对Web交易服务器的日志文件和客户交易信息进行挖掘,有助于企业了解客户的访问行为,挖掘潜在客户群和开展有针对性的服务.对Web挖掘技术进行综述,并介绍了该技术在Web交易中的几个应用.  相似文献   

10.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

11.
不完全信息系统的粗集Web挖掘方法   总被引:1,自引:0,他引:1  
针对电子商务环境下的客户关系管理的特点,提出了基于粗集理论对不完全信息系统的Web挖掘方法.从 已知数据的原始决策表出发,利用基于粗集的Web挖掘方法,选用某种评价算法,以得到决策表及每个数据对象的 决策规则.并结合算例,说明这种Web挖掘方法的使用.  相似文献   

12.
Rough set theory is a new soft computing tool, and has received much attention of researchers around the world. It can deal with incomplete and uncertain information. Now, it has been applied in many areas successfully. This paper introduces the basic concepts of rough set and discusses its applications in Web mining. In particular, some applications of rough set theory to intelligent information processing are emphasized.  相似文献   

13.
刘飞  高红艳 《江西科学》2008,26(2):304-307
使Web信息检索发展到一个新的水平。对Web数据挖掘技术作了概要的介绍,分析了Web信息检索的现状。针对Web信息检索的一些不足,提出了一些观点。将数据挖掘技术的研究成果应用到Web信息检索中,提高了Web信息检索的效率和质量。  相似文献   

14.
Web使用记录挖掘是采用数据挖掘技术对Web服务器上日志文件中的数据进行挖掘,以发现用户访问Web的方式及页面间存在的某种关联,从而可以为网站设计、提供网络个性化服务及其他电子商务活动提供决策依据.事务识别是Web使用记录挖掘前的一种数据预处理技术,本文介绍事务识别的基本方法,并给出一个最大前向引用序列事务识别新方法.  相似文献   

15.
一种网络日志挖掘的高效算法   总被引:1,自引:1,他引:0  
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。  相似文献   

16.
针对现有的搜索引擎难以满足企业不断增长的需求的问题,在传统搜索引擎的基础上提出了一种企业专用搜索引擎的模型框架,给出了利用粗糙集和数据挖掘方法进行Web内容分析的算法以及基于Bayes方法的个性化学习算法,从而使搜索策略得到了优化,提高了搜索引擎的智能。最后给出了企业专业搜索引擎的体系结构,讨论了系统的实现并验证了系统的可行性。  相似文献   

17.
Web用户访问模式挖掘   总被引:3,自引:0,他引:3  
随着网站内容的不断丰富和访问量的增加,网站结构变得越来越复杂,导致信息获取和推送都比较困难.将数据挖掘技术应用于用户访问模式,形成了Web访问模式挖掘.Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息,据此可以形成关联规则、序列模式、聚类模式和分类模式等4类信息,这对于优化站点结构、为不同类别的用户提供个性化服务,有效地实现信息获取和信息推送是非常必要的.Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题,结合研究工作,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述.  相似文献   

18.
陈红丽 《科学技术与工程》2012,12(8):1928-1930,1935
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。 文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。  相似文献   

19.
基于Web数据挖掘的数字图书馆个性化信息服务   总被引:2,自引:0,他引:2  
阐述了Web数据挖掘技术的有关问题,论述了Web数据挖掘在个性化信息服务中的作用.提出了基于一个Web数据挖掘的个性化信息服务体系结构,  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号