共查询到18条相似文献,搜索用时 62 毫秒
1.
基于Web过程模拟的动态Web信息获取 总被引:2,自引:0,他引:2
介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面。采用性能优异的Web信息获取组件CURL,对大量科技文献网站的网页进行信息获取,实验表明CURL具有优异的处理速度,并成功应用到甘肃省科技文献共享平台的统一检索系统中。 相似文献
2.
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取. 相似文献
3.
基于信息量的Web表格信息抽取方法 总被引:1,自引:0,他引:1
提出一种基于有效信息量的Web表格信息抽取模型,该模型主要由表格定位和表格信息抽取二个模块组成,根据Web表格的内容特征来识别主题表格,通过检查格式、语法的特征将表格分割成值域与属性域.实验结果表明该模型能够很好地应用于Web表格信息的抽取. 相似文献
4.
探讨了Web挖掘的相关理论,包括Web文本信息的表示及特征提取,关联规则分析和信息分类,综合Web挖掘的关键技术,提出了一个基于Web挖掘技术的信息分类模型系统,使用户能够对已分类的资源进行浏览、检索,从而更方便、快捷地获取所需信息。 相似文献
5.
目前,基于语义的Web挖掘使语义Web和Web挖掘两个领域结合起来,并在一定程度上促进了各自的发展.本文介绍了语义Web的体系结构和Web挖掘以及智能Agent的相关概念,并提出了在多Agent框架下构建基于语义的Web挖掘信息智能获取系统模型,经过分析说明此模型在一定程度上提高了信息获取的智能化水平. 相似文献
6.
基于个性化Web信息推荐模型的研究 总被引:1,自引:0,他引:1
针对目前的推荐系统存在个性化程度不高,提出了一种采用语义Web的个性化Web信息服务模型,并对模型实现的关键问题进行分析研究.实现了个性化需求库和个性化资源库的语义构建,个性化程度更高、更智能.实验证明,该模型是有效的. 相似文献
7.
在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析成文档对象模型,根据用户需求建立抽取规则,采用自动生成模板机制,并依据模板的抽取规则对网页信息进行抽取.实验证明,该抽取方法具有较高的召回率和准确率. 相似文献
8.
基于Web挖掘的用户个性化服务研究 总被引:2,自引:0,他引:2
随着WWW的广泛应用及相应的Web技术的出现.使数据挖掘的研究进入了一个新的阶段。Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,解决网络用户的个性化服务问题。论文主要论述了一个更新的频繁路径集的Web挖掘算法在网络用户个性化服务中的应用。 相似文献
9.
Web3.0环境下个性化信息服务研究 总被引:1,自引:0,他引:1
李超 《科技情报开发与经济》2011,21(7):118-120
在介绍Web3.0的概念、特征的基础上,讨论了Internet上的个性化信息服务,结合Web3.0的几种主要信息服务形式,深入分析了其个性化信息服务的特征,并阐述了Web3.0目前面临的问题,对其未来发展进行了展望。 相似文献
10.
个性化信息过滤系统模型研究 总被引:2,自引:0,他引:2
杜文华 《科技情报开发与经济》2006,16(1):73-75
随着Internet上信息的迅猛增加,搜索信息的难度越来越大,于是迫切需要一种工具来帮助用户更方便高效地搜索其需要的信息。针对这种需要,提出了一种个性化信息过滤系统的模型,介绍了其总体结构,并深入分析了其关键技术。 相似文献
11.
将Web Service技术与个性化技术相结合,提出了基于Web Service的个性化信息检索,并进行了系统设计及关键技术分析. 相似文献
12.
基于样本实例的Web信息抽取 总被引:13,自引:1,他引:13
主要研究了基于HTML文档的信息抽取,提出了一种基于样本实例的Web信息抽取的方法.用户首先选定样本页面和预先定义模式(基于O-R模型),然后对样本页面和其中的样本记录进行标记、学习,形成信息抽取规则,并存入知识库;利用知识库对其他同类页面自动抽取所需的信息,存入数据库中.本方法可用于Web查询,也可用于信息集成的包装器. 相似文献
13.
介绍Web数据挖掘概念、个性化推荐技术,着重设计了一个基于Web挖掘的个性化推荐系统,并给出了个性化推荐核心模块的实现过程。本系统根据Web挖掘过程,结合基于聚类划分的增量式关联规则挖掘算法的实现。 相似文献
14.
研究了面向用户兴趣的Web信息过滤系统的主要技术,包括用户兴趣表示、度量和更新、网页内容识别和网页信息过滤等技术,并在此基础上设计和实现了一个Web信息过滤系统。该系统能够进行一定的信息过滤,能够进行自学习,并随着用户兴趣的变化渐渐更新,基本能够实现用户的个性化信息服务需求。 相似文献
15.
针对农产品移动信息服务的需求,结合分类算法和个性化推荐算法,提出了一种基于分类的推荐算法.利用决策树分类方法对农产品进行分类,获得分类后的数据,采用协同过滤算法分析分类数据,查找兴趣相似的用户,将感兴趣的农产品信息推荐给正在使用系统的用户.实验结果表明:与传统的推荐方法及相比,该系统向用户推荐了兴趣度更高的农产品移动信息. 相似文献
16.
基于Web服务架构的数字图书馆信息检索系统的设计与实现 总被引:1,自引:0,他引:1
本文通过分析图书馆信息检索的现状,利用Web服务强大的信息交换能力,设计了一个基于Web服务架构的信息检索系统.使用该系统可以最终解决图书馆长期以来资源共建共享的困难. 相似文献
17.
介绍了Web信息检索的定义,并对web信息检索的原理、技术进行分析,针对存在的问题,结合智能Agent技术、神经网络、最好优先算法、信息过滤、相关反馈等多种算法,提出了一个基于Agent的个性化智能Web信息检索系统模型。 相似文献
18.
Web2.0环境下高校图书馆个性化信息服务初探 总被引:1,自引:0,他引:1
王春霞 《科技情报开发与经济》2010,20(7):17-18
通过对Web2.0的服务理念、技术等方面及Web2.0对高校图书馆信息服务影响的粗浅研究,提出了高校图书馆在Web2.0环境下开展个性化信息服务的对策。 相似文献