首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
在许多机器学习的任务中,人们常常使用有标签的数据,但是现实中无标签的数据是大量存在的.提出一种基于半监督学习理论的数据降维方法,为能够发现局部的流形结构,算法寻找一个能够最小化类内距离,同时最大化类间距离的投影,同时在最优化过程中借助无标签数据作为调节因子.多个数据库上测试的结果验证了算法的有效性.图2,参13.  相似文献   

2.
在缺失响应变量的不完全数据下,对半参数回归模型进行研究.利用最小二乘和局部线性回归拟合方法建立缺失数据下半参数回归模型参数分量和非参数分量的局部线性估计.在适当的条件下,得到^βn,^nσ的渐近正态性和^gn(t)最优弱收敛速度.  相似文献   

3.
李英华  刘妍  秦永松 《广西科学》2009,16(4):400-402,413
在响应变量随机缺失的线性模型中,利用R统计软件模拟比较完全样本法、固定填补法和分数线性回归填补法得到的回归系数、响应变量均值、响应变量的分布函数、响应变量的分位数估计,并用标准误差(SE)评判其优劣.结果表明,除固定填补法外,无论采用其余哪种方法,随着样本容量的增大,评判值SE减小,样本容量越大,估计也就越精确 缺失概率的大小也影响估计的精度,缺失概率越大,相应的评判值SE越大,估计的精度也就越差 另外,在分数线性回归填补法中,J=5的结果总是比J=1的结果好,这说明随着J的增大,其估计精度也随着提高.  相似文献   

4.
在缺失响应变量的不完全数据下,对半参数回归模型进行研究.利用局部线性回归拟合方法建立缺失数据下半参数回归模型参数分量β和非参数分量g的局部线性估计βn,gn*(t),基于βn建立σ2的估计量2σn.在适当的条件下,证明βn,2σn的渐近正态性,得到gn*(t)的最优弱收敛速度.  相似文献   

5.
将经验似然方法应用于响应变量缺失时纵向数据下变系数部分线性测量模型中兴趣参数置信域,构造了关于参数分量纠衰的分块经验对数似然比函数,进而推导出参数分量纠衰的分块经验似然比统计量及其渐近分布。数据模拟结果表明所提出的经验似然方法在置信区间长度和覆盖率方面要优于正态逼近方法。  相似文献   

6.
对线性约束的一般非线性规划问题进行了研究,在算法中提到的起作用集策略,与常见的起作用集算法相比较;在迭代过程中求解等式约束子问题时采用了降维算法,而对于不等式约束子问题采用了起作用集算法.通过数值试验,说明了算法的有效性.算法对于求解非线性约束非线性规划问题提出了一种新思路,将非线性约束线性化,解决一般此类问题.  相似文献   

7.
降维是天体光谱数据预处理常用的手段之一,如何利用标号天体光谱数据,克服降维过程中的过分拟合,是提高降维效果的有效途径之一。采用半监督学习,给出了一种天体光谱数据特征降维方法。该方法首先针对具有标号天体光谱数据,建立Fisher判别分析和PCA可变动选择的不确定关系;其次构建其半监督降维的全局最优化形式,通过特征值分解计算降维结果,从而有效地克服了天体光谱降维过程中的过分拟合问题;最后采用高红移类星体和晚型星SDSS天体光谱特征线数据集,实验验证了该方法的有效性。  相似文献   

8.
在缺失响应变量的不完全数据下,利用局部线性回归的方法,给出了回归函数m(x)的估计的加权估计,并证明了估计量具有渐近正态性、均方误差(MSE)和相合性.模拟研究解释了估计量的有限样本性质,并得出了此估计量优越于完整数据估计和加权估计.  相似文献   

9.
高维数据的降维方法研究及其应用   总被引:3,自引:0,他引:3  
讨论了高维数据的降维方法及应用,采用进制分解的方法将数字图像无损转化为二值图像,从而将原图像的处理转化为对二值图像的处理.从理论上,论证了二值图像的无损性,以此为根据对二值图像进行了相应的分析,包括压缩、图像分析、信息融合等.  相似文献   

10.
研究了随机赋范空间上线性随机泛函的连续性与有界性的关系,举例说明连续性线随机泛函无界性并给出了有界的充分条件。  相似文献   

11.
在许多实际问题的研究中,例如临床试验、民意测验、社会问卷调查等,经常导致数据的缺失,而通常使用的统计方法都需要在样本数据完整的情况下进行.如何处理样本中的缺失数据,使得统计推断得以顺利进行,近年来越来越引起人们的广泛关注.针对响应变量存在缺失时的非线性半参数回归模型Y=f(X,β)+g(T)+ε,研究了参数β的经验似然推断.在一定条件下,分别基于一般借补数据和修正借补数据的情形,得到了关于参数β的对数经验似然统计量渐近服从χ2分布,并由此可以构造出关于参数β的置信域.  相似文献   

12.
缺失数据插补是数据科学中的基本方法之一.本文针对类别型缺失数据提出了一种基于聚类和半参数logisitic学习模型的插补法.该方法首先采用K-近邻法对缺失数据进行预插补,然后用聚类算法将数据分类,提高数据间的相似性,再为每一类数据集建立半参数logistic学习模型,进而完成最后的插补.基于中国家庭金融调查(CHFS)数据集的实证研究表明,该方法优于常用的K-近邻插补法和随机森林插补法.  相似文献   

13.
针对传统降维方法难以保持数据集的局部与全局几何结构特征问题,选择测地距离作为度量指标,提出改进t-SNE的故障数据集降维方法D-t-SNE.首先提取消噪振动信号的多域高维故障数据集,在对其进行归一化处理之后,利用GD指标改进后的D-t-SNE算法对高维故障数据集进行降维运算,去除冗余信息,然后通过不同的分类器对低维特征子集进行故障模式辨识.以UCI数据集和双跨转子实验台的模拟故障数据集为实验对象对D-t-SNE算法进行验证,并与SNE和t-SNE算法的各项实现结果进行对比.结果表明,D-t-SNE算法具有通过降低高维故障数据集的维数从而达到降低故障分类难度、提高故障辨识准确率的性能,可为降低旋转机械原始故障特征数据集的规模、降低故障分类的难度与提高故障辨识结果的可视化效果提供理论参考依据.  相似文献   

14.
为提高三维模型的识别速度以及检索准确率,提出一种基于语义邻域的数据降维方法.通过基于内容的三维模型检索过程中的相关反馈记录,构造一个三维模型的语义邻接图,采用其中任意两点的最短路径长度来近似代替两点在流形空间上的测地距离,再通过多维尺度分析(MDS)算法来构造数据点在低维欧氏空间中的内在表示.对Princeton ShapeBenchmark的实验表明,该方法在数据的低维嵌入中保留了数据之间的语义关系,在三维模型检索中取得了更好的检索效果.  相似文献   

15.
讨论了部分缺失数据时两个几何总体的参数的估计,证明了估计的强相合性和渐近正态性。  相似文献   

16.
缺失数据下局部线性回归估计的渐近性质   总被引:1,自引:0,他引:1  
在缺失响应变量的不完全数据下,对非参数回归模型进行研究,利用局部线性回归的方法,给出了回归函数m(x)的估计,并证明了缺失数据下局部线性回归光滑具有渐近正态性和相合性.  相似文献   

17.
考虑了响应变量随机缺失情形下的非线性EV模型.通过利用核实数据,构造了响应变量均值θ的调整的经验对数似然比统计量.证明了所构造的经验对数似然比统计量渐近于标准χ2分布,所得结果可以用来构造未知参数的大样本置信区间.  相似文献   

18.
本文在响应变量随机缺失条件下,研究了广义半参数模型的拟似然估计方法,给出了缺失数据下的未知参数与非参数回归函数的拟似然估计,进一步求出了估计的渐近偏差和渐近方差,并证明了所给出的拟似然估计具有渐近正态性。  相似文献   

19.
利用logit模型刻画了缺失指示变量R的分布,由其分布的参数估计来判定数据的缺失机制类型.在四个假定的基础上,用五个步骤具体操作缺失数据的机制检验.并用两个例子说明了检验的具体步骤.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号