首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率.  相似文献   

2.
随着大数据时代的到来,数据的类标签数量急剧增加,对现有的分类任务带来了严峻的挑战。为了解决这个问题,人们通常将标签组织成层次结构,使用结构中所包含的信息来对任务进行学习。考虑样本的不断增加,使用模糊粗糙集信息熵设计了一种面向层次分类的增量特征选择算法。考虑兄弟策略,将现有的λ条件熵推广到了层次分类的情形,设计了一种非增量的层次分类特征选择算法,设计了λ增量条件熵,基于此设计了增量版本的特征选择算法。在实验中,采用了包括非增量版本在内的7种不同的特征选择算法在5个层次数据集上与增量算法进行比较,实验结果验证了2种算法的有效性,并且所设计的增量算法能在不影响性能的情况下加快特征选择的进程。  相似文献   

3.
增量学习是处理数据流的有效方式。文中针对已有增量分类算法只是作用于小规模数据集或者在集中式环境下进行的不足,提出了一种基于Hadoop云计算平台的增量分类模型,以解决大规模数据集的增量分类。该增量分类模型主要基于选择性集成学习思想,设计相应Map函数对不同时刻的增量样本块进行学习,以及设计Re-duce函数对不同时刻的分类器进行选择性集成以实现云计算平台上的增量学习。仿真实验表明该方法具有更好的性能,且能较好地解决数据流中的概念漂移问题。  相似文献   

4.
基于学习的超分辨率重建算法通过对图像的整体信息学习进行重建,没有对图像的内部结构信息特征进行分解考虑.基于图像的低秩稀疏分解理论,本文提出一种新的图像超分辨率重建算法.在研究图像矩阵的低秩部分与稀疏部分信息特征的基础上,结合图像自身蕴含的先验信息,本文分两步对图像恢复重建.首先,将图像的非局部自相似性先验信息引入图像的基本重建模型.在该模型下利用相似图像块矩阵的天然低秩性约束得到初始估计高分辨率图像.第二步,提出一种改进的字典学习算法恢复出初始估计高分辨率图像中缺失的高频成份信息,获得最终的高分辨率图像.为了使高频成份得到更好的恢复,在字典学习样本集的构建阶段应用了一种基于低秩稀疏分解理论的样本集构建方法.实验分析表明,本文提出的算法与现有主流算法相比,在主观视觉效果和客观性能分析上都能显示出更好的优越性.  相似文献   

5.
有序回归学习是一种在训练模型过程中保持数据间序关系的机器学习方法,在图像分类等领域有着广泛的应用.现有的有序回归模型通过先验知识获得了更优的性能,但是它们没有考虑数据内的局部结构信息.本文在有序回归学习的同时保持局部结构信息,并嵌入图像空间距离度量信息,提出了一种基于局部结构保持的自适应有序回归方法(SaLSP-LDLOR).通过对局部保持矩阵进行模糊自适应处理,获得了更好的鲁棒性.实验结果表明,SaLSP-LDLOR在有序图像分类的场景下具有更优的性能和良好的鲁棒性.  相似文献   

6.
针对现有车牌定位算法鲁棒性不够、准确度不高以及参数设置困难等问题,提出基于边缘颜色对特征以及笔画穿越双层检测车牌定位算法,不但充分利用车牌边缘颜色搭配信息,而且有效利用了车牌字符结构信息。粗检测阶段:首先进行边缘检测,人工收集所有搭配的彩色边缘特征数据,利用机器学习模型建立车牌边缘颜色对覆盖分类学习模型,然后利用车牌边缘颜色对覆盖分类学习模型,并利用先验信息进行形态学处理形成车牌候选区域。验证阶段:针对粗检测车牌候选区域,扫描车牌边缘穿越信息,最后利用车牌区域整体边缘分布覆盖分类模型进行候选区域验证处理。该方法利用车牌背景与字符具有固定颜色搭配的重要特点,综合利用了车牌的结构特征和纹理特征,提高了车牌定位的可靠性。实验采用100幅含有不同颜色搭配的车牌图像进行实验,定位准确率达到96%以上。  相似文献   

7.
类别不平衡数据的分类问题是数据挖掘及机器学习过程中的一个研究热点,基于代价敏感学习方法通常用于解决类别不平衡数据分类问题,然而,它在实际应用过程中通常因样本的误分类成本未知而受到限制.针对此问题,文中采用群体智能算法优化样本的误分类代价.果蝇优化算法(Fruit fly optimization algorithm,FOA)是一种全局优化群智能算法,该算法具有原理简单、调节参数较少、收敛速度较高等优点.本研究首先提出了一种基于动态调整寻优步长的果蝇优化算法;其次,利用此果蝇优化算法良好的全局和局部搜索性能,对类别不平衡数据中样本的误分类代价进行了优化;最后,将改进果蝇优化算法学习样本误分类代价的策略应用到乳腺组织数据集的分类研究中.实验结果表明,本算法对类别不平衡数据的分类结果较好,能够有效的识别正、负两类样,解决了因误分类成本的先验信息无法直接获取而使基于代价敏感的不平衡数据分类方法使用受限的问题.  相似文献   

8.
本文将先验鉴别信息引入到降维过程中,融合线性近邻传递模型,提出了半监督增强线性近邻传递算法S-ILNP(Semi-supervised Incremental Linear Neighborhoods Propagation).该方法首先利用先验标签信息构建类间和类内图,再依据拉普拉斯映射原理实现维数约减,运用线性近邻传递实现半监督学习,标签信息由全局一致性假设,通过局部最近临,从有标签数据点进行全局传递标注.该算法充分利用先验鉴别信息,显著提高了图像检索的准确度.  相似文献   

9.
针对大规模网络视频数据的学习需要考虑无标签数据和异构信息的问题,提出了一种基于视觉和文本异构信息的网络视频在线半监督学习方法.该方法将文本和视觉看作2个视图,采用图作为基分类器对每个视图进行建模,并利用线性邻域的传播算法来预测样本类别.在不同视图之间采用多图上的协同训练,利用未标记样本增量地更新基分类器,并根据类别相关的融合方法确定最终结果,从而提高了分类准确率.实验结果表明,该方法的结果优于支持向量机方法约8.3%,在线增量更新后,学习器的性能提高了约3%,因此比较适合于大规模视频数据的在线半监督学习.  相似文献   

10.
我国典型地物波谱数据库的构建为地表参数反演提供了先验信息,而时间序列遥感观测数据则能够提供反演目标参数的动态变化信息.文中将描述植被冠层反射的遥感辐射传输模型与描述作物生长变化的过程模型结合,提出了综合利用时间序列遥感观测数据和波谱库所提供的参数先验信息对农作物生长过程中的关键结构参数叶面积指数(LAI)进行反演的方法.时间序列遥感观测数据能为目标参数LAI的反演提供更多信息,而作物生长模型的引入则能够对反演过程中LAI的变化趋势进行约束.实验结果表明,利用地物波谱库中提供的参数先验信息结合时间序列遥感观测数据,采用变分数据同化算法可以明显提高具有时间变化特征的地表目标参数反演精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号