首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
研究了用经验似然的方法来研究带有缺失数据的半参数非线性模型的统计诊断问题。首先,在响应变量完全随机缺失下,利用修正借补的方法处理缺失数据,从而得到完全样本;然后用核估计方法对未知函数进行估计。其次,基于数据删除模型给出了参数的一步近似估计,提出了经验Cook距离以及标准化残差分析,进而找出异常点和强影响点。最后,通过实例对带有缺失数据的非线性半参数模型进行统计分析来验证以上方法的可行性和有效性。  相似文献   

2.
应用EM算法的思想在双参数逻辑斯蒂克模型下对存在缺失数据的参数估计方法和恢复缺失数据的统计插补方法进行研究.蒙特卡洛模拟和实证研究结果表明,在进行统计插补恢复缺失数据时,该方法使得估计结果比较理想:联合极大似然估计与EM算法相结合,先估计参数,再填补缺失值,再估计,再填补,直到似然函数值稳定.  相似文献   

3.
针对缺失数据下线性泛函估计中存在的非参数高维问题和模型参数化后的稳健性问题,提出了线性泛函估计的半参数降维推断方法,通过非参数函数估计来插补线性泛函,井用参数工作函数来降维.所得半参数降维估计具有双稳健的特点,即只要选择概率函数正确参数化或者降维插补指标可以修复线性函数的条件期望,所得估计就是相合的,而且二者都满足时,估计达到最优.  相似文献   

4.
为处理协变量随机缺失的AFT模型的参数估计问题,首先利用离散辅助协变量对缺失的协变量进行了插补,再结合Buckley-James方法提出了带辅助信息的AFT模型的一种参数估计方法.此方法作为B-J估计在不完全协变量情形下的一个推广,无须指定模型误差项的分布,在应用上有一定的便利性.数据模拟表明:此方法具有较好的估计效果.  相似文献   

5.
缺失数据插补是数据科学中的基本方法之一.本文针对类别型缺失数据提出了一种基于聚类和半参数logisitic学习模型的插补法.该方法首先采用K-近邻法对缺失数据进行预插补,然后用聚类算法将数据分类,提高数据间的相似性,再为每一类数据集建立半参数logistic学习模型,进而完成最后的插补.基于中国家庭金融调查(CHFS)数据集的实证研究表明,该方法优于常用的K-近邻插补法和随机森林插补法.  相似文献   

6.
利用无回答所提供的信息采用最小二乘估计给出了缺失数据情形下的目标变量的一种回归插补及其方差估计.在仅目标变量缺失数据情形,得A2中单元关于y对应的回归插补公式(y)i=(b)0+(b)1x12i+…+(b)pxp2i,i=1,…,r3.及其回归插补的协方差阵Cov((Y))=σ2X1(XTX)-1XT1.在辅助变量部分缺失且目标变量缺失的情形,得A2中单元关于y对应的回归插补公式(y)i=(b)0+(b)1x12i+…+(b)p1xp12i,i=1,…,r3.及其回归插补的协方差阵Cov((Y))=σ2X1(X*TX*)-1XT1.  相似文献   

7.
利用随机化技术进行敏感问题抽样调查中常会出现缺失数据,借鉴Srivastava SK[Calc Stat Assoc Bull 16(1967)]在直接调查中利用辅助变量的构造估计量的思想,建立了具有数量特征的随机化Eichhorn模型中缺失数据的比插补方法.通过理论比较和数值模拟得出的结果表明提出的插补方法比传统的方法效率更高.  相似文献   

8.
在缺失响应变量的不完全数据下,对半参数回归模型进行研究.利用最小二乘和局部线性回归拟合方法建立缺失数据下半参数回归模型参数分量和非参数分量的局部线性估计.在适当的条件下,得到^βn,^nσ的渐近正态性和^gn(t)最优弱收敛速度.  相似文献   

9.
在缺失响应变量的不完全数据下,考虑半参数EV模型,利用二阶段估计的方法求出了EV模型中参数β和非参数g的估计量^βn,^gn.研究了它们的强相合性及渐近正态性.  相似文献   

10.
大多数统计分析方法基于完整的数据集,这些方法不能直接用于包括缺失值的数据集.此外,由于成分数据的特殊属性,传统的缺失值插补方法直接用于这种类型的数据可能得到不良的结果.因此,对成分数据而言,缺失值的填补具有十分重要的意义.为了解决这个问题,根据核函数的性质,提出了一种基于修正Sigmoid核的成分数据缺失值非参数插补方法.该方法使用模拟和真实的数据集与k近邻插补法和最小二乘迭代回归插补法进行比较.实验结果表明,新的插补方法可以得到更准确的估计.  相似文献   

11.
煤与瓦斯突出是煤矿事故发生的主要原因.正确预测煤与瓦斯突出,对于煤炭企业安全生产具有重要意义.对和煤与瓦斯突出相关的5个特征进行分析,采用拉依达准则处理数据异常值.针对数据变量缺失的情况,选择具有代表性的均值插补、多重插补、K近邻插补和随机森林插补方法完成数据插补.采用随机森林、支持向量机和K近邻模型进行煤与瓦斯突出预测.采用精确度,特异度和敏感度作为性能指标.实验表明,采用随机森林数据插补方法并利用随机森林模型完成的预测,取得了精度98.94%、敏感度98.67和特异度100%的性能,在所有数据插补方法和预测模型组合中性能最优.  相似文献   

12.
对于抽样调查中经常出现的无回答数据,在均匀回答机制下,给出了两个辅助变量下目标变量缺失数据的回归插补模型。对于多个辅助变量的情形,可按上述方法进行目标变量的回归插补。  相似文献   

13.
在响应变量有缺失的不完全数据情形下,利用二阶段估计方法得到半参数回归模型Y=X’β+g(T)+e中参数β和非参数g(·)的估计,并给出估计渐近正态性的充分条件.  相似文献   

14.
考虑响应变量随机缺失下线性模型响应变量均值的估计问题,分别获得了基于完全观测样本数据、线性回归插补后的“完全样本”和逆概率加权插补后的“完全样本”得到的响应变量均值估计,并证明了其渐近正态性.  相似文献   

15.
在缺失响应变量的不完全数据下,对半参数回归模型进行研究.利用局部线性回归拟合方法建立缺失数据下半参数回归模型参数分量β和非参数分量g的局部线性估计βn,gn*(t),基于βn建立σ2的估计量2σn.在适当的条件下,证明βn,2σn的渐近正态性,得到gn*(t)的最优弱收敛速度.  相似文献   

16.
研究了响应变量随机缺失下的广义线性模型,利用处理缺失数据的完全数据方法,构造了广义线性模型中未知参数的拟似然估计.结合随机缺失机制和若干极限定理,证明了该拟似然估计的渐近存在性、强相合性和收敛速度.  相似文献   

17.
统计调查表缺失数据插补效果的实证分析   总被引:1,自引:0,他引:1  
针对统计调查表的实际数据,对其缺失数据进行了常用插补方法的实证分析.首先,实证分析了一维模型的局限性及缺点;其次,分别对决策树模型、神经网络模型、关联规则模型算法,在对输入(预测)变量进行系统优化基础上,统计插补的准确率,比较优劣;最后,提出了提高插补准确率的一个值得进一步研究的方向.  相似文献   

18.
本文在响应变量随机缺失条件下,研究了广义半参数模型的拟似然估计方法,给出了缺失数据下的未知参数与非参数回归函数的拟似然估计,进一步求出了估计的渐近偏差和渐近方差,并证明了所给出的拟似然估计具有渐近正态性。  相似文献   

19.
对于缺失数据的处理,通常会采用直接删除缺失数据或者插补数据的方法来得到完整的数据集。多重插补法是对缺失数据集进行多次插补,并且提高数据稳定性的一种较好的缺失数据处理方法。基于多重插补法分析公路安全数据,进而对完整的数据集进行方差估计的比较。经过具体的计算和分析可以得到结论,多重插补法可以得到信息量相对完整的数据集,利用这样的数据集得到的分析结果更加可靠。  相似文献   

20.
由于面板数据经常出现由信息性退出而引起的缺失数据,故其统计分析比较复杂。本文假定响应变量服从部分线性半参变系数混合效应模型,其中非参数系数函数依赖于相应的退出时间。利用二步估计方法的思想求得参数与非参数部分的相合估计,减少了同时估计的参数的个数,避免了估计方程中由较多参数引起的多重共线性问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号