首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
By combining multiple weak learners with concept drift in the classification of big data stream learning, the ensemble learning can achieve better generalization performance than the single learning approach. In this paper,we present an efficient classifier using the online bagging ensemble method for big data stream learning. In this classifier, we introduce an efficient online resampling mechanism on the training instances, and use a robust coding method based on error-correcting output codes. This is done in order to reduce the effects of correlations between the classifiers and increase the diversity of the ensemble. A dynamic updating model based on classification performance is adopted to reduce the unnecessary updating operations and improve the efficiency of learning.We implement a parallel version of EoBag, which runs faster than the serial version, and results indicate that the classification performance is almost the same as the serial one. Finally, we compare the performance of classification and the usage of resources with other state-of-the-art algorithms using the artificial and the actual data sets, respectively. Results show that the proposed algorithm can obtain better accuracy and more feasible usage of resources for the classification of big data stream.  相似文献   

2.
对用方向向量标识示例的学习问题,以预测方向与实际方向之间的方向误差最小化为目标,提出了一种可用于方向预测的集成学习算法,详细分析了构造多个预测函数以及组合各个预测函数以实现方向的最优化预测方法. 提出的算法具有广泛的应用特性:当用不同的轴向来标识类别时,可简化得到多分类连续AdaBoost算法,其能确保训练错误率随分类器个数增加而降低;用错分代价组成的向量来标识示例时,可简化得到一种平均错分代价最小化的集成学习算法. 理论分析和实验结果均表明了算法的合理性和有效性.  相似文献   

3.
一种改进的基于相似度的本体映射方法   总被引:1,自引:0,他引:1  
本体映射是解决本体异构的通用方法.发现来自不同本体的元素间的关系的过程可以转化为它们之间的语义相似度的计算, 本文从名称、结构、实例、属性四个方面改进相似度计算方法,并给出融合的相似度计算公式,通过实验说明新相似度计算方法在实际应用中是有效的.  相似文献   

4.
目前地理信息服务缺少语义描述和发现算法.借鉴本体语言服务(ontology web language for services,OWL-S),构建地理信息服务的语义模型,提出一种基于语义模型的地理信息服务发现算法.在SI/SO匹配中利用本体分类树,将本体相似度求解转换为分类树中节点距离求解的方法.实验证明,该算法不但能区分匹配等级,而且能区分同一匹配等级之间的相似度大小,能较好地满足地理服务发现的需求.  相似文献   

5.
基于本体的临床试验数据语义查询   总被引:2,自引:0,他引:2  
临床试验数据的描述中多自然语言、多专业医学术语的特点使得用户难以通过自定义的关键字快速定位所需的资源。该文采用基于本体的方法实现对于临床试验数据的语义查询。该系统的实现步骤如下:使用OWL(Web on-tology language)构建基于ICD-10和ICMJE标准的本体,包含疾病和临床试验类;从Clinical Trials注册库获取临床试验数据,标注为本体中的临床试验类实例;建立临床试验实例与疾病实例的联系;借助SPARQL实现对于临床试验数据结构化的查询。使用上述方法,用户能够通过疾病实例和相关属性的关键字,表达结构化的语义查询条件,精确定位所需的临床试验。与传统的仅基于关键字匹配的查询方法相比,该方法所表达的查询条件能够更加准确地描述用户的查询需求。  相似文献   

6.
当前许多领域信息都采用表格形式展现,因此,如何从表格中抽取本体逐渐引起了人们的关注.为了提高从Web表格中抽取本体实例的准确性,提出了基于语义相似度的词汇语义类的获取方法.该方法采用了基于SVM的语义相似度计算方法,提高了判断语义相似度的准确性,克服了以前依靠句法相似度分析表格结构存在的局限性.最后,根据实验结果,对该方法的性能进行评估.实验结果显示,该方法可以有效地从Web表格中抽取本体实例.  相似文献   

7.
根据接口匹配和语义本体的思想,提出一种基于语义接口匹配的地理信息Web服务动态组合方法.该方法通过把服务抽象为带有语义信息的输入输出接口的实体,利用接口间的语义匹配实现地理信息服务动态组合.并给出了基于语义接口匹配的地理信息Web服务动态组合框架,以及相应的接口参数匹配和语义匹配的解决方案,提出从参数和语义两个角度对接...  相似文献   

8.
针对一调土地数据由于测量误差或因不同测绘队伍的不同标识习惯,在图幅进行接边时导致接边要素属性不一致,进而造成接边准确率下降的问题。提出在一致性维护过程中将SWRL语义规则同时应用于图幅接边前的空间数据一致性维护的方法;该方法在传统的拓扑关系一致性维护方法的基础上,将本体及本体规则引入到图幅接边前数据的一致性处理中,增强了对数据语义一致性的判别,并对现有的属性相似度进行改进判断要素的一致性。实验显示,将该方法应用到对某镇一调图幅数据接边处理中,使得图幅接边准确率和接边效率都得到了提高。  相似文献   

9.
本文提出了一种新的基于EP的分类算法,即基于基本显现模式的懒惰式贝叶斯分类算法(Lazy Bayesian Classification based on essential Emerging Patterns,LBCeEP),该算法使用懒惰式学习技术进行训练数据集的约简,并使用了一种特殊形式的更能有效地反映类标属性的EP,同时采用贝叶斯方法应用这种EP来进行分类.在UCI机器学习库中的14个数据集上的实验表明,本文所提出的算法具有更好的分类效果。  相似文献   

10.
局部匹配的人脸识别方法   总被引:1,自引:1,他引:0  
从人类认知方式出发,提出了一种基于统计学习的局部匹配人脸识别方法。该方法将人脸图像划分成若干小块,各个子块中包含不同的人脸形状特征,而不同的子块则描述了人脸主要部件之间的相对位置关系,然后根据各个子块鉴别能力的差异,将每个子块看成一弱分类器,利用Adaboost学习算法组成一个强分类器,提高最终的分类效果。实验结果表明该方法可以有效提高人脸的识别准确率并对人脸的表情和光照具有较好的鲁棒性。  相似文献   

11.
提出一种定性地理信息检索方法, 用于地理信息的定性表达、语义匹配、推理和结果排序, 可以避免目前定量地理信息检索中语义信息丢失问题。采用命题逻辑方法综合表达查询和文档中的主题信息和地理语义信息, 将文档与查询的相关性度量分为主题相似度和地理相似度。前者通过命题关键词间加权本体距离获得。后者可进一步分为概念相似度和位置相似度, 分别基于地理本体和空间语义度量。由于信息的表达形式为命题和信息单元, 采用证据理论和模糊逻辑对上述子相关性度量进行统一建模。所提方法可以基于语义检索网页中的定性地理信息, 并对相关文档进行排序。这种检索和排序方法符合人类空间认知, 因此可以有效提高地理信息检索的效率。  相似文献   

12.
为实现地址数据的高效匹配,本文提出了一种基于模糊匹配算法的门址定位方法,并实现了地址数据的完全匹配、模糊匹配以及模糊定位.以快递业务数据为实验数据,实验结果表明,该方法能取得较好的匹配效果,并且定位方法简单实用可行,为快递业务降低退回率提供了一种有效的方法.  相似文献   

13.
模式匹配的一种新方法   总被引:1,自引:0,他引:1  
为找出模式匹配中数据源模式和一个全局模式之间的模式对应关系、实例转换和语义映射等 ,采用框架方法来描述待匹配的两种模式 .应用多Agent系统中的Matchmaking方法 ,对框架中的不同槽的内容采用不同的匹配处理 ,是比较新颖的模式匹配方法 .  相似文献   

14.
本文在介绍了知识的形式化表示的基础上,分析了本体概念、关系、函数、实例、本体基本关系和概念的形式化表示,探讨了基于本体的知识表示的方法;并且将此运用于协作感知模型的知识库构造中的知识表达.  相似文献   

15.
与其他分类器相比较,模糊积分分类器具有可以表示特征属性间交互作用的特性.确定合适的模糊测度是其关键因素之一.模糊测度的确定方法主要有2种:专家给定和从历史数据学习获得.由于模糊测度自身的复杂性,模糊测度主要是从数据中学习得到.为了能够更好地利用特征属性在样例空间体现出的局部特征,提出了一种用人工神经网络实现自适应模糊测度的方法.使得模糊测度可以随着输入样例的不同而变化,及时反映出在对样例进行分类过程中各特征属性的重要性和属性间的交互作用的不同,从而提高分类性能.实验证明该方法有效,可行.  相似文献   

16.
基于语义距离的领域本体概念相似度研究   总被引:2,自引:0,他引:2  
简要介绍了本体的概念及其分类,在提出的基于语义距离的领域本体概念相似度计算方法中,充分考虑了影响语义距离计算的四大因素,还考虑了概念相似度计算的非对称性,能够较真实地反映概念之间的语义关系.  相似文献   

17.
赵春晖  刘凡 《应用科技》2009,36(8):8-12
针对传统的SOFM网络对高光谱图像分类精度低的缺点,提出了采用模糊积分与神经网络相结合的分类方法.即在改变网络的学习速率函数和邻域函数的前提下,同时对分类结果采用基于模糊积分的信息融合,使分类器之间相互补偿,并用高光谱图像的分类实验进行验证.与普通的SOFM网络和K均值聚类方法相比较,分类效果更好.  相似文献   

18.
基于扩展特征向量空间模型的多源数据融合   总被引:2,自引:0,他引:2  
本体资源的扩充是自然语言处理的关键问题之一。传统的从单一数据源获取的信息其覆盖率较低,亟需建立一个整体的数据管理平台,对数据资源分类存储与整理。为此提出了AVP数据平台,构建AVP平台所面临的重要问题是多源数据的融合,即将不同来源的网站数据进行语义角色标注,对歧义词条进行识别判断,并最终归并到以义项为基本单位的数据仓库中;为解决多源数据融合的语义角色标注问题,给出了一种自动语义判歧方法。其基本思想是利用词条中的属性值对作为特征模板,并借助于属性值的共现概率,应用扩展向量空间模型对词条进行歧义识别。通过大量的实验对比可知,该系统在各方面均取得优异的成绩,所提出的算法能够很好地解决多源数据融合中的语义判歧问题。  相似文献   

19.
随着MOOC平台增多以及同一平台下学习资源剧增,如何实现跨平台的高效语义检索成为目前MOOC亟待解决的问题之一.该文通过网络爬虫工具获取多个知名MOOC平台的学习资源数据,进行相关预处理后存储到Mysql数据库,并根据数据库与本体之间的映射关系自动构建MOOC本体,使用Jena将MOOC本体解析成RDF 3元组,并将RDF 3元组存储至HBase数据库,最终构建出一个MOOC统一检索平台,为学习者推荐符合其检索需求的学习资源.实验结果表明:构建的MOOC统一检索平台可有效地提高检索的查准率和查全率.  相似文献   

20.
针对文本情感分类中情感语义特征利用不足、特征降维效果欠佳等影响分类效果的问题,提出了一种通过扩展语义相似的情感词以及引入词语间统计特征的高精度网络评论情感分类方法.该方法利用神经网络Skip-gram模型生成词嵌入,通过词嵌入相似性度量将语义相似的词语扩展为情感特征;再利用词语间的统计特征进行特征降维;通过多个弱分器加权构建Adaboost分类模型实现网络评论情感分类.基于酒店评论和手机评论公开测试集进行实验,结果表明其情感分类的正确率分别达到90.96%和93.67%.方法扩展语义相似情感词有利于丰富文本情感语义特征,引入词语间的统计特征有更好的特征降维效果,可以进一步提升文本情感分类的效果.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号