首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
Web挖掘的体系研究   总被引:6,自引:0,他引:6  
互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖掘包括信息提取和信息检索,Web信息提取的主要过程包括向量表示、特征提取、特征缩减和文本挖掘;对于信息检索,文章从搜索引擎的原理、分类以及最新的发展技术方面对其进行了论述;而对于结构挖掘和使用记录挖掘,文章主要论述了其算法和过程。  相似文献   

2.
Web信息提取中多策略学习算法的研究   总被引:1,自引:1,他引:1  
将一种新的机器学习方法-多策略学习算法应用于Web信息提取领域,在原有的机械学习,统计学习和相关学习等三种机器学习法基础之上充分考虑各学习方法的利弊,将三者有机结合,使得结合后的新算法在提取Web信息时比结合前任一单一机器学习方法都更有效、更准确。  相似文献   

3.
针对电子商务Web网站中HTML页面传输问题,分析了基于HTML文本的信息隐藏方法.根据标记属性赋值符左右两边空格特性,使用C++语言实现了信息隐藏算法和信息提取算法,该方法具有一定的实际意义.  相似文献   

4.
关系数据库模式信息的提取   总被引:1,自引:1,他引:0  
鉴于关系数据库是当前Web的主要信息源,关系数据库模式信息的提取是实现当前Web向语义Web迁移的基础技术之一,介绍关系数据库模式信息提取原型工具RDBSExtractor,分析与总结关系数据库的模式信息,给出基于JDBC API的RDBSExtractor设计思想和实现技术,案例研究表明。基于JDBC API的模式提取方法是可行的,RDBSExtractor是有效的。  相似文献   

5.
为解决当前Web服务网络中存在的一些与信任相关的安全问题、提高Web服务的安全性和可靠性,基于主观逻辑,文中提出了一个改进的自适应Web服务信任模型iWSTrust及相应的信任度和声誉评估算法,该模型利用主观逻辑对Web服务网络中的实体进行信任建模和推理,并增加可信任的第三方机构来保存信任信息,通过综合考虑Web服务环境中的各个相关实体,分析一次典型交易过程中所涉及的信任关系,并对不同类型的服务请求者进行区分,使得实体的信任度和声誉能够随着交易经验的增加而自适应地改变。模拟实验结果表明,iWSTrust能在一定程度上减少访问到恶意实体的次数,并惩罚进行欺骗的实体。  相似文献   

6.
自适应业务提供中的元数据技术   总被引:1,自引:0,他引:1  
首先概要介绍元数据的定义、目的、作用等基本概念,并初步介绍了元数据的描述技术——资源描述框架,在此基础上给出了一个元数据在自适应Web信息提供中的应用示例,并通过示例分析阐述了自适应业务提供中的元数据技术。  相似文献   

7.
垂直搜索在个性化Web搜索中的应用   总被引:1,自引:0,他引:1  
潘望  朱宏明 《科技信息》2008,(36):89-90
本文先介绍了个性化Web搜索,然后根据个性化Web搜索提出的要求引出了垂直搜索技术,并探讨了与通用搜索引擎相比较而言.将垂直搜索应用于个性化Web搜索的优越性。最后介绍了垂直搜索中的关键性技术,即信息提取技术,并着重给出了基于网页布局和关键字段的信息提取技术。  相似文献   

8.
提出了一种Web自适应界面技术的新思路.将获取用户个性信息作为Web使用挖掘的任务,从界面内的功能对象和界面区域入手,设计一个能产生功能对象对的算法来预测用户下一行为;划分界面为多个子区域来放置功能对象,利用自适应公式设计的算法进行动态布局,达到智能化的效果,成为一种新型的用户界面.经过多用户的反复使用实验,该方法初步实现了功能对象与Web界面的自适应.  相似文献   

9.
提出了一种Web自适应界面技术的新思路.将获取用户个性信息作为Web使用挖掘的任务,从界面内的功能对象和界面区域入手,设计一个能产生功能对象对的算法来预测用户下一行为;划分界面为多个子区域来放置功能对象,利用自适应公式设计的算法进行动态布局,达到智能化的效果,成为一种新型的用户界面.经过多用户的反复使用实验,该方法初步实现了功能对象与Web界面的自适应.  相似文献   

10.
基于智能的网页信息提取系统的研究与设计   总被引:1,自引:0,他引:1  
随着Internet的迅速发展,为人们提供了大量的信息,但这些信息都包含在网页中,为了使用这些信息数据,需要将数据从网页中提取出来.该文介绍了一种新的基于智能的网页信息提取系统EIES,通过对RoadRunner的改进和利用,在提取过程中不需人工干预,实现了信息提取的智能化.实验表明,该系统能够更准确、更有效的分类相似网页和提取网页信息.  相似文献   

11.
基于特征相关学习的网页信息提取方法   总被引:1,自引:0,他引:1  
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.  相似文献   

12.
基于对深网(DeepWeb)网页公共框架的定义,提出一种在信息抽取算法中增加公共框架检测阶段,采用序列比对算法提取公共框架的方法.与原始网页数据相比,去除公共框架的数据域信息对模板抽取更有利.基于真实网站的数据密集型网页集合,测试和对比了序列比对算法中参数不同取值以及公共框架检测阶段在数据量和抽取准确率等方面对信息抽取算法的影响.实验结果表明了算法的有效性.  相似文献   

13.
基于 DOM 的 Web 信息抽取规则的构造与实现   总被引:1,自引:0,他引:1  
为了实现对Web信息的查询重、构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于 DOM 的 Web 信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.  相似文献   

14.
针对传统的Web信息抽取方法运算量大、自动化程度低的问题,提出了一种基于SVM的WEB信息自动化抽取方法。利用SVM优秀的分类性能将网页中有用数据和无用数据分类标注,有效地完成Web信息抽取任务,准确地抽取出所需信息,实现数据抽取的自动化。实验结果表明,该方法可以有效地获取网页信息特征,具有较高的召回率和准确率。  相似文献   

15.
为实现简捷的信息抽取和信息利用,提出一种采用树型结构实现Web数据到XML文档的转换算法.使用基于树型结构的类型定义和信息抽取方法,可有效将Web文档中的数据抽取出来并表示为XML格式的文档,形成可用的XML数据源,便于其他应用程序使用结果数据,为实现Web中的信息共享与数据交换提供便利条件.  相似文献   

16.
建立基于链的父亲结构树描述和存储网页信息,采用Htmlparse和基于正则表达式的描述方法,设计、实现了一种高效的基于单元识别的网页信息抽取算法.分析与实验结果表明,文中给出的网页信息抽取方法能提高检索的查准率和查全率.  相似文献   

17.
Web信息查询研究进展   总被引:3,自引:1,他引:2  
Web上大量、分布、动态的信息,造成了用户在查询Web上的信息时产生的"信息过载”和"信息迷向”现象.Web信息检索与查询是目前的研究热点,本文分析和比较现有Web信息检索和查询语言技术的发展现状,介绍了基于人工智能领域中机器学习方法的Web信息检索和查询以及信息抽取技术的研究,以供研究者参考.  相似文献   

18.
彭媛媛  许建潮 《科技信息》2009,(33):85-85,104
随着近年来Internet的飞速发展,Deepweb已成为网络信息资源的重要组成部分,用户通过查询接口在线访问其后端的Web数据库来动态的获取其中蕴含的海量信息。由于DeepWeb资源分布在各个De印web站点,具有异构、动态、数据量大等特点,使用起来较为不便,因此,面向Deep Web的数据集成系统便应运而生。本文对Deepweb数据集成系统中的数据抽取技术进行了研究,提出了基于xml的Deepweb数据自动抽取方法,并作了详细的技术分析与研究,它能够快速有效地抽取出DeepWeb资源,具有抽取准确度高,抽取粒度细等特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号