首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
充分利用对辅助变量的回答所提供的变量信息,采用最小二乘方法,给出了目标变量不完全情形下对其的一种回归插补,并对回归差补的期望和方差进行了讨论。  相似文献   

2.
利用无回答所提供的信息采用最小二乘估计给出了缺失数据情形下的目标变量的一种回归插补及其方差估计.在仅目标变量缺失数据情形,得A2中单元关于y对应的回归插补公式(y)i=(b)0+(b)1x12i+…+(b)pxp2i,i=1,…,r3.及其回归插补的协方差阵Cov((Y))=σ2X1(XTX)-1XT1.在辅助变量部分缺失且目标变量缺失的情形,得A2中单元关于y对应的回归插补公式(y)i=(b)0+(b)1x12i+…+(b)p1xp12i,i=1,…,r3.及其回归插补的协方差阵Cov((Y))=σ2X1(X*TX*)-1XT1.  相似文献   

3.
数据缺失是在数据收集中普遍存在的现象,因而缺失数据的插补问题就成了数据分析领域的重要命题.常用的插补模型有参数模型、非参数模型和半参数模型,其中关于半参数模型的研究较少,考虑到半参数模型的优越性,文章将半参数回归模型与插补方法相结合,利用最小二乘核估计构建半参数模型,再利用辅助变量对目标变量进行估计来建立缺失数据的插补数据集,进而实现缺失数据的插补,并通过案例探究该方法的实现及其可行性.  相似文献   

4.
考虑响应变量随机缺失下线性模型响应变量均值的估计问题,分别获得了基于完全观测样本数据、线性回归插补后的“完全样本”和逆概率加权插补后的“完全样本”得到的响应变量均值估计,并证明了其渐近正态性.  相似文献   

5.
为处理协变量随机缺失的AFT模型的参数估计问题,首先利用离散辅助协变量对缺失的协变量进行了插补,再结合Buckley-James方法提出了带辅助信息的AFT模型的一种参数估计方法.此方法作为B-J估计在不完全协变量情形下的一个推广,无须指定模型误差项的分布,在应用上有一定的便利性.数据模拟表明:此方法具有较好的估计效果.  相似文献   

6.
煤与瓦斯突出是煤矿事故发生的主要原因.正确预测煤与瓦斯突出,对于煤炭企业安全生产具有重要意义.对和煤与瓦斯突出相关的5个特征进行分析,采用拉依达准则处理数据异常值.针对数据变量缺失的情况,选择具有代表性的均值插补、多重插补、K近邻插补和随机森林插补方法完成数据插补.采用随机森林、支持向量机和K近邻模型进行煤与瓦斯突出预...  相似文献   

7.
利用随机化技术进行敏感问题抽样调查中常会出现缺失数据,借鉴Srivastava SK[Calc Stat Assoc Bull 16(1967)]在直接调查中利用辅助变量的构造估计量的思想,建立了具有数量特征的随机化Eichhorn模型中缺失数据的比插补方法.通过理论比较和数值模拟得出的结果表明提出的插补方法比传统的方法效率更高.  相似文献   

8.
研究了MERRA网格点与输入变量的数量对插补精度的影响.以人工神经网络与遗传算法为工具建立MERRA数据与缺测数据相关关系的数学模型,基于该模型对现场缺测数据进行插补.该方法解决了在缺少合适参考气象站、参考测风塔数据时的缺测数据插补难题.以湖北某山区风场为例进行验证,结果表明:插补精度与选取的MERRA格点数量一定范围内呈正比关系,输入模型变量的较优选择为风速、风向、单位时间气温变化、日夜以及季节,计算得到的插补数据与缺测数据相关系数达到0.814,相对采用参考气象站数据和参考测风塔数据作为数据来源的方法,相关系数分别提高97.6%和10.3%.  相似文献   

9.
电子病历数据经常存在缺失,严重影响分析结果.基于MIMIC数据库中的重症监护单元(intensive care unit,ICU)患者数据研究缺失值插补,数据集由23组临床常用生理变量以及不存在缺失的5260例样本构成.提出了一种基于深度嵌入聚类的K近邻插值方法.该方法以深度嵌入聚类为核心,通过多次聚类构造样本邻近度矩阵,再选择缺失样本的K个近邻样本,以这些近邻样本的平均值填补缺失.与均值插补、中值插补、后验分布估算插补和条件均值插补相比,该方法插补后的结果与原数据相似度更高,且更好地保留了样本间的差异性.  相似文献   

10.
在多元线性回归模型的异方差检验中,当解释变量较多且两两之间相关系数较低时,会导致传统White检验构造的辅助回归函数参数增多、计算量增大、检验效果不明显。针对这一问题,基于异方差检验原理,建立残差平方与解释变量之间的回归模型,筛选出系数显著的解释变量,利用残差平方与筛选出的解释变量构建辅助回归模型进行异方差检验。数值模拟及实证分析表明该方法有良好的检验效果及简单的步骤。  相似文献   

11.
针对高维数据集,提出一种利用预测变量之间的图结构信息来改进稀疏逻辑回归模型的方法。该方法通过利用高维图结构数据或者重叠组结构来进行逻辑回归建模,即使预测变量的图结构未知,该方法仍适用,当图结构为某些特殊形式时,目前流行的方法,如Adaptive Lasso,(Overlapping) Group Lasso和岭回归都可以看作是该模型方法的特例。数值模拟和实例分析应用表明:该方法能有效地利用预测变量图结构信息,提高模型在估计、预测以及变量选择等方面的表现,并且该模型在有限样本情形下是有效的;该模型方法克服了数据集的维数问题,利用高维数据的图结构提高了稀疏逻辑回归模型的性能,可广泛应用于高通量基因数据集的疾病分类研究中。  相似文献   

12.
通过几种典型的变物性导热问题分别考察了算术平均、调和平均、待求变量插值以及积分平均等界面插值格式在内节点法和外节点法等不同区域离散格式中的计算精度和运算量。结果表明,对于不同的变物性问题,各插值格式精度和运算量差别迥异,即使同一格式采用不同的空间离散方法时,其计算特性也不尽相同,应视具体问题和离散方法选择相应的格式。  相似文献   

13.
变量之间的关系不是线性相关关系时,不可以用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析.然而非线性回归方程一般很难求,因此,把非线性回归化为线性回归应该说是解决问题的好方法.利用连分式插值函数方法逼近非线性函数可实现回归函数的拟合,通过实例说明该方法的有效性,比传统的最小二乘法效果更好.  相似文献   

14.
针对一类因变量具有复杂自变量、且不具备相同采样周期的预测问题,综合运用支持向量回归估计(SVR)、多元回归和主成分分析等多种数据分析技术,提出了一种综合预测方法,建立起了飞机故障率与其错综复杂的影响因素间的一种数学关系,并且采用航空装备质量控制的统计数据对所提出的方法进行了实验,预测结果显示了方法的有效性。在影响因素量化过程中,还引入了Pearson相关系数方法。  相似文献   

15.
LR模糊数据是实践中经常使用的由形状函数L及R、左右扩展及中心构成的模糊数.取值LR模糊数的随机变量称为模糊随机变量,其缺乏适宜的概率分布模型,导致模糊数据的线性回归模型缺乏显著性检验.文章基于Nather模糊随机变量线性回归分析工作,进一步给出LR模糊数据多元线性回归在δ2距离下的系数估计,并通过统计软件给出模型中非确定干扰变量的Bootstrap模拟分布.  相似文献   

16.
周世健  鲁铁定 《江西科学》2008,26(1):109-111,115
对于工程实践中较多存在自变量为随机变量的情形,应考虑双变量的线性回归,在总体最小二乘原则下,即n∑i=1(vxi^2+vyi^2)=min,推导了在此准则下的具体解算方法,得到了相应的公式,最后并以算例加以验证与分析讨论,此方法对于工程实践的数据分析具有较大的参考价值。  相似文献   

17.
通过对某地区自然灾害造成的损失数据的预测,针对灰色预测模型GM(1,1)预测精度问题展开了一系列研究.采用直线插值法将非等时距数据进行等时距变换.通过后验差验算线性回归模型、指数回归模型和GM(1,1)模型的预测等级,验算结果表明指数回归模型的预测等级与GM(1,1)的预测等级都处于最优级,线性回归预测等级为不合格.为进一步研究GM(1,1)和指数回归预测模型的预测精度,将两者的预测相对残差绝对值进行对比分析,结果表明GM(1,1)整体预测精度比指数回归模型略高.  相似文献   

18.
稳健的变量选择方法及其应用   总被引:1,自引:1,他引:0  
在已有的变量选择方法和稳健估计方法的基础上,提出了一种针对纵向数据的稳健的变量选择方法,通过模拟衡量其稳健性,并将其应用到一组实际的纵向数据分析中.模拟和实例分析结果表明,提出的稳健的变量选择方法在选择变量、估计变量系数的同时,对数据中可能存在的异常值有明显的抵抗作用.  相似文献   

19.
苏州外资制造业经济增长受众多因素影响,各因素之间存在变量的多重相关现象,一般的多元回归分析自变量之间存在较严重的多重共线性.采用偏最小二乘回归对经济增长影响因素建模分析,这样最大限度地概括了原自变量系统中的数据信息,克服了多重共线性,同时自变量对因变量具有最大的解释能力,可靠性高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号