首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对缺失数据下线性泛函估计中存在的非参数高维问题和模型参数化后的稳健性问题,提出了线性泛函估计的半参数降维推断方法,通过非参数函数估计来插补线性泛函,井用参数工作函数来降维.所得半参数降维估计具有双稳健的特点,即只要选择概率函数正确参数化或者降维插补指标可以修复线性函数的条件期望,所得估计就是相合的,而且二者都满足时,估计达到最优.  相似文献   

2.
一种新的彩色图像降维方法   总被引:5,自引:1,他引:5  
徐志节  杨杰  王猛 《上海交通大学学报》2004,38(12):2063-2067,2072
基于内容的图像检索(CBIR)是图像检索的重要分支,而基于颜色的特征提取是CBIR的常用方法之一.如果对图像颜色的特征数提取过多、维数过大,则不利于对图像的快速匹配.本文将图像的色彩直方图作为输入向量,然后采用局部线性映射(LLE)算法对原始数据进行降维,并分别在4种色彩空间下对降维后的彩色图像进行分类.实验证明,在处理非线性数据降维时,LLE较主成分分析(PCA)具有明显的优势.  相似文献   

3.
降维是天体光谱数据预处理常用的手段之一,如何利用标号天体光谱数据,克服降维过程中的过分拟合,是提高降维效果的有效途径之一。采用半监督学习,给出了一种天体光谱数据特征降维方法。该方法首先针对具有标号天体光谱数据,建立Fisher判别分析和PCA可变动选择的不确定关系;其次构建其半监督降维的全局最优化形式,通过特征值分解计算降维结果,从而有效地克服了天体光谱降维过程中的过分拟合问题;最后采用高红移类星体和晚型星SDSS天体光谱特征线数据集,实验验证了该方法的有效性。  相似文献   

4.
一种改进的LLE方法   总被引:1,自引:0,他引:1  
局部线性嵌入(Locally Linear Embedding,简称LLE)是一种较好的非线性降维方法,这种方法对于位于某种非线性流形上的数据的降维有着比较好的效果.但是这种方法对于其中一个重要参数——近邻个数,太过敏感.文章将另一种非线性降维方法Conformal-Isomap中的一种度量数据之间距离的方法引入到LLE方法中.经过实验发现,新引入的距离对于近邻个数的选择有比较好的效果,可以使得实验的结果对近邻个数的选择不那么敏感.  相似文献   

5.
高维数据的降维方法研究及其应用   总被引:3,自引:0,他引:3  
讨论了高维数据的降维方法及应用,采用进制分解的方法将数字图像无损转化为二值图像,从而将原图像的处理转化为对二值图像的处理.从理论上,论证了二值图像的无损性,以此为根据对二值图像进行了相应的分析,包括压缩、图像分析、信息融合等.  相似文献   

6.
测井数据具有多维、多类、多量等显著特征,是测井资料地质解释工作的重要依据.针对测井数据处理过程中的多维度、非线性问题,文章应用流形学习思想进行测井数据降维,提出基于t分布随机近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法的测井数据解释模型:首先对测井数...  相似文献   

7.
针对核主成分分析(kernel principal component analysis,KPCA)和局部切空间排列算法(local tangent space,LTSA)在降维过程中无法兼顾保持数据全局结构特性和局部结构特性的问题,利用核函数的可线性叠加性质,提出一种将KPCA算法与LTSA算法融合的非线性降维算法....  相似文献   

8.
该文提出了一种基于全局-局部结构保持的稀疏投影模型(GLSPP).通过对投影数据进行线性重构来保持数据的全局结构,从而保留投影数据的全局信息.通过约束重构系数矩阵与相似性矩阵的相似性来保持全局保持数据和局部保持投影数据的一致性.同时,对重构系数矩阵和相似性矩阵进行稀疏约束,保留主要信息,以减少冗余信息的干扰.在公开的4个人脸与物体数据集上的实验结果显示:该方法具有较高的分类准确率.  相似文献   

9.
为了获得良好的图像分类效果,需要采集尽可能多的图像数据特征,进而使得图像原始特征空间的维数越来越高,造成维数灾难.特征提取是通过线性或者非线性映射,将高维特征空间映射到低维空间,从而降低数据维数.现有的特征提取算法往往忽视了数据本身特有的复杂结构以及非线性因素,造成映射方向的模糊以及分类精确度的缺失.充分考虑了图像数据本身的二维特性,通过改进的非线性特征提取方法、流形学习方法来提取图像特征.实验表明,该算法在不影响图像分类效果的前提下可以大大降低数据维数,减少计算复杂度.  相似文献   

10.
人类社会至今的飞速发展使得大量体力劳动被机械工程替代,工作者的任务重心也从体力劳动逐渐转变为脑力劳动,对操作者脑力负荷进行实时评估以增强工作效率在当下有着重大意义。目前人类对于脑力负荷评估共有三种方式,有研究表明,采用生物电信号进行脑力负荷分类效果较其余两种方法更客观。但脑电信号经过特征提取后维数极高,所需数据量和运算量巨大,需要对其进行降维。目前降维方面最广泛运用的两种算法为主成分分析(PCA)和线性判别分析(LDA)。针对PCA的非监督性和LDA的特征冗余敏感性,本文提出一种二分类下基于双子空间主成分分析的降维算法,分别对不同类别的训练集数据进行主成分分析,并将所有训练集数据映射到生成的空间中,再次进行PCA-LDA降维,以此提高降维后数据的可分性。实验结果表明,双子空间PCA-LDA降维算法在二分类任务下测试集精度整体高于单子空间PCA-LDA算法,以此为脑力负荷分类领域和高维数据降维领域提供了新思路。  相似文献   

11.
文章提出了一种基于局部敏感直方图的分布场目标表示方法,克服了原始分布场跟踪方法对光照和参数敏感的缺点。利用局部敏感直方图与分布场模型表示目标空间结构上的相似性,提出利用局部敏感直方图作为一种新的分布场构建方式来表示目标。与分布场目标表示方法相比,局部敏感直方图对像素所在层取更大的权值,因此能够更好地保留目标空间结构。在基准视频序列上的实验结果表明,与其他具有代表性的算法相比,基于局部敏感直方图的分布场跟踪算法用固定的一组参数取得了最佳的跟踪结果。  相似文献   

12.
目前在半监督聚类的研究中,尤其是当有类标信息的类的数量少于整个数据集的类的数量时,其聚类效果并不好.本文在现有半监督聚类技术的基础上,通过特征加权来提高同一类文档的相似性,从而得到更好的聚类效果.为了验证这一思想的有效性,实验不仅在单语言数据集上进行,还在中、英双语数据集上进行了只包含中文或英文类标时的聚类实验.实验结...  相似文献   

13.
基于样本的社会关系, 提出一种新的半监督学习方法, 创建一种基于文档?词及社会关系的二部图模型, 并根据标签传播算法将未标注样本加入到分类器的构建中。实验结果表明, 加入社会关系网络的半监督情感分类方法明显优于传统的仅利用评论文本信息的半监督情感分类方法。  相似文献   

14.
针对数据实际分布与假设不匹配时半监督学习算法难以改善分类器性能的问题,该文提出一种最大化样本可分性半监督Boosting算法,通过引入"高密度区域局部散度最小、样本空间全局散度最大"准则来学习未标注的样本。该准则使用两种半监督假设(聚类假设和流形假设),减少了因半监督假设与数据不匹配造成的准确率下降问题。实验结果表明,该文算法有效提高了Boosting算法在符合聚类假设数据集和符合流形假设数据集上的准确性,提高了分类器噪声数据的稳定性。  相似文献   

15.
代价敏感学习是数据挖掘和机器学习领域的重要课题.已有的研究方法多数针对单目标进行优化,并不适用于多目标代价敏感问题的解决.因此通过分析基于粗糙集领域的单目标代价敏感属性约简问题,定义了多目标代价敏感属性约简问题,并设计了一种简单高效的算法.在4个UCI数据集上的实验结果表明,该算法能获得令人满意的帕累托最优解集,以辅助用户进行方案的选择.  相似文献   

16.
针对高光谱影像处理应用中,标记样本往往数量较小且质量不均而未标记样本大量存在的问题,结合半监督学习方法,提出一种面向高光谱影像分类的半监督极限学习机分类算法.首先根据图理论,联合高光谱影像空间光谱信息,对标记和未标记样本共同构建无向加权图;然后,考虑平滑性约束和结构最小化原则,构造分类目标函数;最后,利用核方法求解最优参数,进而实现高光谱影像的半监督分类.采用该方法进行分类对比实验,结果表明:该方法能够有效利用未标记样本信息,提高小样本下的高光谱影像分类精度.  相似文献   

17.
针对非规则循环应用中存在的一次迭代访问多个间接数组的问题,给出了超图数组的形式化描述,提出了三种基于超图的数据重排算法,即基于超图的非重复编码数据重排算法、基于超图的回溯搜索数据重排算法和基于超图的先划分再回溯数据重排算法,以及两种基于超图的迭代重排算法,即基于超图的非重复编码迭代重排算法和基于超图的回溯搜索迭代重排算法.通过对典型的非规则应用实例——流体力学问题进行实验,表明单独的重排算法提高程序执行速度约25.4%.在最好的数据重排与迭代重排的组合算法下,一级和二级高速缓存的平均命中率分别增加到91.7%和96.5%.  相似文献   

18.
在模式识别中,采取支持向量机对有类别标签样本分类是非常有效的,但在实际应用中,对样本进行标记并不是一件容易的工作.通过综合利用有类别标签和无类别标签样本信息构造目标函数和约束条件,借助二次规划模型提出了一种新的半监督支持向量机,从而提高了仅依靠有类别标签样本支持向量机的分类准确率.  相似文献   

19.
刘美春 《科学技术与工程》2013,13(19):5508-5512
针对如何提高有标签样本不足时的分类精度问题。提出脑-机接口系统(BCI)的类协同半监督学习算法(LCTSSL),采用有监督和无监督两种算法提取双特征训练双分类器协同扩充有标签样本集。在训练前后阶段设置不同置信度度量,选择两分类器分类结果一样的高置信度样本进行标记,保持每类每次新标记样本数目一样,提高有标样本集的可信度及识别系统的鲁棒性。迭代更新两分类器、有监督提取系统及相应特征,充分利用新标签信息。最后利用BCI竞赛2005的数据I证明LCTSSL算法的有效性。  相似文献   

20.
为了提高对未知样本的使用率,充分发挥出半监督聚类算法的优势,ISFCA算法将约束项引入到竞争聚类算法(CA算法)的目标函数中。但在ISFCA算法的隶属度函数中,存在迭代的非必要信息,增加了算法的复杂度。改进了ISFCA算法的隶属度函数,提取出迭代的必要项uCA″rs和非必要项uCA′rs,从而简化隶属度迭代计算过程,使样本的聚类更加合理。实验结果表明,优化后的ISFCA算法对阀门的故障诊断是行之有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号