首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 407 毫秒
1.
李洋  栾吉华 《科技资讯》2007,(35):80-81
以往基于DOM的Web信息抽取方法在信息抽取过程中存在如需要较多样本集、适应性较差等问题,为解决Web上的信息在抽取中存在的问题,本文提出了一种在原有基于DOM的Web信息抽取方法的基础上引入竞争分类方法进行信息抽取.  相似文献   

2.
基于web日志挖掘的数据预处理研究   总被引:2,自引:0,他引:2  
曹明  闪四清 《科技资讯》2007,1(4):103-105
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,也是工作量较大的一部分.Web服务器上的数据是半结构化的,而且含有大量和挖掘无关的记录和冗余项.这就需要对其进行处理以得到适合挖掘的数据事务(Transaction)形式.Web日志预处理就是通过一系列的清洗、集成、转换等来得到合适的待挖掘数据.本文重点介绍了数据清理、用户识别、会话识别、路径补充、事务识别等过程.  相似文献   

3.
张万颖  王秀英 《科技资讯》2007,(36):177-178
企业信息系统集成是一项系统工程.从长远来看,电子商务的发展方向是动态电子商务,而为了开展动态电子商务,企业需要的不仅是一个集成产品,更需要一个集成服务平台.为了构建动态电子商务环境下的企业内部信息系统集成模型,必须首先解决三个问题一是选定适当的商业模型,二是选择合适的Web服务应用服务器软件和创建、部署工具,三是将部署好的Web服务发布到企业私有UDDI注册中心上.  相似文献   

4.
随着Internet和Web技术的发展,Web上的信息正以惊人的速度不断增长,用户在众多的信息中获取自己所需要的信息变得越来越困难.针对这个问题,提出了一种基于蚁群算法的网站优化算法,通过统计得到的Web日志相关数据项,计算得到任意页面间的转移概率,并利用转移概率实现网站的优化.实验结果表明,该算法能有效地实现网站优化.  相似文献   

5.
基于DOM的Web信息抽取方法研究   总被引:1,自引:0,他引:1  
以往基于DOM的Web信息抽取方法在信息抽取过程中存在如需要较多样本集、适应性较差等问题,为解决Web上的信息在抽取中存在的问题,本文提出了一种在原有基于DOM的Web信息抽取方法的基础上引入竞争分类方法进行信息抽取。  相似文献   

6.
Web是一种基于超文本的信息查询和信息发布工具,用户可以在不需要安装其他专用软件的情况下,使用一台通用PC机通过访问浏览器就可以访问嵌入式设备.本文研究了嵌入式Web服务器Boa基于最新的ARM 11体系架构的S3C6410处理器和高版本的Linux3.0.1操作系统上的移植,并且以此为基础给出了一个如何通过访问浏览器来控制开发板上的LED灯的实例.  相似文献   

7.
引入QoS本体,提出了一种基于QoS本体的语义Web服务选择算法.该算法通过构造Web服务的QoS本体模型以支持异构QoS参数的语义描述和度量,并将QoS语义匹配和数值匹配相结合,从而更准确地为用户选择满足其个性化需求的Web服务.仿真实验表明,基于QoS本体的语义Web服务选择算法能够充分利用QoS语义和数值信息,为用户选择更合适的服务,实现用户对Web服务的个性化需求.  相似文献   

8.
张柱和 《科技信息》2009,(19):51-52
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面太广,而用户需要的却只是其中很少的一部分。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的、有用模式和隐藏的信息。本文主要研究了Web数据挖掘的内容,包括Web挖掘的特点、Web挖掘的分类和Web挖掘流程等。  相似文献   

9.
Web信息查询研究进展   总被引:3,自引:1,他引:2  
Web上大量、分布、动态的信息,造成了用户在查询Web上的信息时产生的"信息过载”和"信息迷向”现象.Web信息检索与查询是目前的研究热点,本文分析和比较现有Web信息检索和查询语言技术的发展现状,介绍了基于人工智能领域中机器学习方法的Web信息检索和查询以及信息抽取技术的研究,以供研究者参考.  相似文献   

10.
Web已经成为人们获取信息的重要来源,但Web上的信息并不都是真实可信的. 因此,如何帮助用户快速判断Web上大量信息的可信性成为一个亟待解决的问题. 文中提出一种基于内容信任的方法用以验证Web信息的可信程度. 采用条件随机场模型进行Web信息的主题提取,利用提取的主题在Web上搜集候选证据,并利用时效性、主题相关度等特征验证候选证据的可靠性,最后进行可信度计算. 实验结果表明提出的方法对评价Web信息的内容可信度是有效可行的.   相似文献   

11.
A classification method for Web information extraction   总被引:2,自引:0,他引:2  
Web information extraction is viewed as a classification process and a competing classification method is presented to extract Web information directly through classification. Web fragments are represented with three general features and the similarities between fragments are then defined on the bases of these features. Through competitions of fragments for different slots in information templates, the method classifies fragments into slot classes and filters out noise information . Far less annotated samples are needed as compared with rule-based methods and therefore it has a strong portability. Experiments show that the method has good performance and is superior to DOM-based method in information extraction.  相似文献   

12.
基于特征相关学习的网页信息提取方法   总被引:1,自引:0,他引:1  
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.  相似文献   

13.
分析了有关信息搜索的工具及其存在的一些问题,提出了一种基于概念的Web信息析取方法,它能自动地从网站中获取数据信息,并且能让用户通过数据库的查询范例来进入网站.该方法能有效地解决在特定的查询类型中所期望的信息问题.  相似文献   

14.
异构信息源集成技术   总被引:12,自引:0,他引:12  
异构信息源集成技术提供统一接口,使各种基于因特网的应用能迅速、准确地提取所需信息,为用户屏蔽各种信息源的异构性.这种异构信息源的集成技术从传统的结构化的异构数据库扩大到半结构化的大量Web页面信息及无结构的信息.对集成技术的方法,如数据模型、Web信息、描述语言XML、主流软件开发技术及信息智能搜索、查询重写、查询分析等进行了分析,给出了半结构化异构信息源集成的系统架构,并指出该项技术未来发展趋势.  相似文献   

15.
基于知识管理的图书馆2.0个性化信息服务门户   总被引:1,自引:0,他引:1  
探讨了Web2.0时代高校图书馆个性化信息服务门户创新模式,将知识管理理念引入图书馆个性化信息服务,提出基于知识管理的图书馆2.0个性化信息服务门户.  相似文献   

16.
基于填充标记的自适应Web信息提取   总被引:1,自引:0,他引:1  
提出一种自适应Web信息提取算法,基于自底向上规则模块层叠,通过在提取模板中填充一定数量有助于识别信息类别的SGML标记,较好地覆盖Web页中不可见信息,有效控制自适应过程中信息的过少和溢出,实现智能化Web信息提取.  相似文献   

17.
基于智能代理的信息检索机制在"数字城市"中的应用   总被引:1,自引:0,他引:1  
如何在海量的数据中找出我们需要的信息,是"数字城市"中急需解决的一个重要问题.在"数字成都"建设中,通过具有一定智能性的搜索策略建模,实现对元数据库的快速检索、数据的快速下载、数据的交互预览和信息缓存机制,构造由Web访问服务器和Web数据服务器两部分组成的智能代理搜索引擎,具有任务解析、数据踪迹的保留、数据缓存的特点.  相似文献   

18.
基于互信息的Web文档聚类方法   总被引:2,自引:2,他引:0  
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

19.
Web2.0环境下图书情报领域的知识管理   总被引:3,自引:0,他引:3  
阐述了图书情报机构知识管理的概念和内容,介绍了Blog,RSS和Wiki在图书情报机构知识管理中的应用,并在此基础上提出了基于Web2.0环境下图书情报机构知识管理的发展策略。  相似文献   

20.
The fourth international conference on Web information systems and applications (WISA 2007) has received 409 submissions and has accepted 37 papers for publication in this issue. The papers cover broad research areas, including Web mining and data warehouse, Deep Web and Web integration, P2P networks, text processing and information retrieval, as well as Web Services and Web infrastructure. After briefly introducing the WISA conference, the survey outlines the current activities and future trends concerning Web information systems and applications based on the papers accepted for publication.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号