首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
首先介绍了网络爬虫的定义,给出其分类及工作原理,最后在介绍垂直爬虫Web magic框架的基础上,设计并实现了基于Node.JS的轻量级网络爬虫,并应用于交通应急网站新闻抓取模块,效果较好.  相似文献   

2.
对于语义网而言,它的成功有两个条件,一是要以现行的网络平台为基础,二是要充分利用当前的领域数据.关系数据库存储着大部分领域数据,针对关系模式与RDF的映射问题,文章介绍了一种新的方式,称为"属性视图".与Jena等一些系统中所使用的"属性表"不同,它是一种传统的关系模式视图,用这种视图来描述建立在关系数据库上的RDF(S)本体,能够使得在传统的关系数据库系统上实施一般的语义网应用,并且在必要的时候,可以利用这种视图将关系数据库中的表数据方便地转存到相应的RDF Store中,生成本体实例.  相似文献   

3.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法.  相似文献   

4.
子空间预测控制中的椭球优化及其应用   总被引:1,自引:0,他引:1  
为联合系统辨识和控制器设计,在子空间辨识的基础上研究了一种新的子空间预测控制. 该控制方法可自动校正模型预测控制中的系统参数,避免传统的线性二次高斯最优控制中繁琐的设计过程,且不依赖于控制器的任何先验信息. 在带有约束条件时,利用椭球优化来迭代产生一系列体积逐渐减小的椭球序列,该序列最终收敛到一个最优解. 在此基础上推导了椭球优化算法达到收敛时所需迭代次数的一个上界. 以直升机悬停状态为例,利用该文方法设计控制器,验证了子空间预测控制方法的有效性.  相似文献   

5.
Web是一个巨大的知识库,作为知识的载体,Web上的海量网页数据包含了各种各样的内容,在这些内容中,命名实体(named entity)是一类重要的内容.随着Web规模的指数级膨胀,如何在海量Web信息中定位自己所需的信息,成为一个非常紧迫的需要.本文结合大量相关文献,对Web命名实体提取的研究工作进行了介绍、分析与比较,并指出了以后努力的方向.  相似文献   

6.
日新月异的数据库研究领域--数据库技术的回顾与展望   总被引:2,自引:0,他引:2  
回顾十年来数据库技术的进展和主要成就,包括面向对象的和对象关系的数据库系统、多媒体数据的支持、并行数据库、Web数据集成与检索、三级存储器技术、数据仓库、数据挖掘、数据可视化技术.还讨论了影响数据库研究的三个重要趋势,即Internet/Web技术、程序逻辑和数据的统一管理技术、迅速发展的计算机硬件技术.最后,探讨了微型数据库系统、未来的联邦数据库系统、未来数据库系统的体系结构、程序逻辑和数据统一管理技术、结构化和半结构化数据的集成技术等几个主要数据库研究新方向.  相似文献   

7.
中文自动分词一直是中文信息处理、Web文档挖掘等处理文档类研究的基础技术之一,传统的中文分词技术研究,主要集中在算法的改进研究上,对实验的平台,有关软件的实现涉及很少.本文通过探讨中文自动分词的重要性和不可或缺性,给出了基于VC++/MFC自动分词软件的开发技术,最后对软件实现的四种基于词典的机械匹配的算法进行了实验分析,实验证明该系统能够高效的给中文信息处理提供一个平台.  相似文献   

8.
研究一类由任意有限多个不确定子系统组成的切换奇异系统的鲁棒H∞控制问题.通过引入一个变换矩阵,给出了该问题的一个新的充分必要条件,并设计了相应的子控制器和切换规则.最后给出一个数值算例证明结论的有效性.  相似文献   

9.
基于Web模式可移植性训练系统的设计与实现   总被引:2,自引:0,他引:2  
三层结构模式在Web应用系统中广泛应用,但也存在不足之处:系统对网络环境完全依赖,网络资源利用不平衡.因此,从一个基于Web模式的训练教学系统的设计和实现过程,对Web三层结构提出了调整改进措施,在设计中构建了具有一定逻辑功能的Web页面数据单元,从而实现数据的重用性和系统设计的可移植性,并有效地解决了Web三层结构系统的不足之处.  相似文献   

10.
web中海量信息源的组织是异构的、多元的和分布的,这给信息检索系统提出了巨大的挑战.本文结合本体论和个性化搜索引擎技术,以现有搜索引擎为基础,利用Ontolog工具,提出了基于内容的个性化Web检索系统的设计思想.  相似文献   

11.
一个基于Web方式E-Learning教学系统的设计与实现   总被引:2,自引:1,他引:1  
随着教育信息化的不断深入,计算机文化教育已成为信息社会发展的基本要求本.文章讨论构造一个基于Web方式的E-Learning教学系统"计算机文化基础电子教程"的设计与实现.  相似文献   

12.
GenExtractor是一个新的基于Web的生物信息挖掘系统,该系统通过Internet对网上生物学数据库中的生物序列数据和基因表达数据进行挖掘,在指定的人染色体区域内搜寻具有特定功能的基因.该系统可为分子生物学家寻找候选基因、收集相关信息等提供有效帮助.通过对人DNA修复基因的查寻,验证了该系统的实用效果.  相似文献   

13.
基于对象池和数据缓存技术的Web-OLAP系统   总被引:2,自引:0,他引:2  
在分析Web环境下传统联机分析处理(online analytical processing OLAP)系统存在问题的基础上,提出一种基于对象池和数据缓存技术的OLAP系统的体系结构.首先给出了对象池的定义及处理用户请求的算法,然后给出了数据缓存的定义及数据缓存的处理算法.采用对象池及数据缓存技术相结合,可明显提高系统的性能.  相似文献   

14.
简要介绍了Internet产生与发展;叙述Internet与中学化学教育工作者的关系;介绍了搜索引擎和教育信息资源导航系统,并介绍了一些中学化学教育站点。  相似文献   

15.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系.  相似文献   

16.
在描述MatLab Web应用的基础上,提出一种基于MatLab和Web技术的远程仿真方法.以二阶系统的单位阶跃响应为例,详细说明了MatLab远程在线仿真技术的实现过程,并给出了相应的图形结果.  相似文献   

17.
提出一种基于移动代理技术的类应用层组播的搜索引擎模型.通过对模型的仿真,证明这种搜索引擎模型在完成任务所需时间和网络负载方面具有较好的性能改善,非常适合搜索引擎的设计和实现.  相似文献   

18.
基于蚁群算法的Web站点导航   总被引:4,自引:0,他引:4  
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度.  相似文献   

19.
为实现ISG混合动力汽车燃油消耗和排放性能的优化,提出了一种实时转矩分配模型的建立方法.根据发动机的万有特性和ISG电机效率特性进行了混合动力系统性能的数值模拟,采用求解多元函数极值的方法确定混合动力汽车最佳工作点,作为ANFIS系统的先验知识,建立实时转矩分配控制模型,并对整车性能进行仿真.仿真结果表明,车辆经济性和排放性能得到优化,转矩分配模型的有效性得到验证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号