首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
在已有研究的基础上,提出一种新的基于t函数的稳健变量选择方法.该方法通过惩罚估计方程中的惩罚函数达到变量选择的效果,方程中的权重矩阵和有界得分函数对自变量和因变量中的异常值有很好的限制作用,可同时达到稳健的变量选择和稳健估计.通过分析3种不同自由度的t函数性质,选取自由度为2的t函数,并与基于Huber函数的稳健变量选择方法进行比较.数值模拟结果表明,基于t函数的稳健变量选择方法在2种污染力度、3种污染方式的数据污染情况下,其稳健性均明显优于基于Huber函数的稳健变量选择方法.与参数估计效果相比,基于t函数的稳健变量选择方法优势更明显.  相似文献   

2.
针对纵向单调缺失数据下高维部分线性回归模型的变量选择,提出了逆概率加权光滑阈估计方程变量选择方法,其中非参数分量使用样条估计.在适当正则条件下,证明了该变量选择方法具有Oracle性质,并通过模拟研究验证了所提出方法的有限样本性质.  相似文献   

3.
基于广义经验似然估计方法,提出了一种有效且稳健的估计,实现对纵向数据在线性模型下均值和协方差矩阵的联合估计。利用Cholysky分解将模型重参数化,利用拉格朗日乘子法求出估计值,再还原出均值和协方差矩阵的估计。在模拟研究中将所提方法同文献中其他稳健估计进行比较,结果显示所提方法效率更高。最后将所提方法用于分析CD4细胞数据,交叉验证结果显示所提方法更加可靠。  相似文献   

4.
在经验似然方法的基础上提出了一种稳健的经验似然估计方法,在约束条件的估计方程中使用权重函数以及有界得分来限制异常点的影响。通过数值模拟研究该方法的稳健性。模拟结果表明,相比普通的经验似然估计,提出的稳健经验似然方法在数据中存在异常值的情况下所得估计的均方误差更小。同时对于非正态的厚尾分布数据,提出的稳健经验似然估计也在均方误差意义下更优。  相似文献   

5.
大数据背景下,基于罚函数的正则化方法是高维数据变量选择的重要方法.Lasso估计是常用的变量选择方法,而Lasso正则化参数的取值直接影响选择模型的性能,是正则化方法成败的关键.针对Lasso估计,提出一种新的L曲线(LC)准则选择正则化参数.数值模拟和实际应用表明:相比CV,GCV,BIC等准则,LC准则能够以较高的...  相似文献   

6.
针对未知分布数据序列稳健问题,提出改进Huber M稳健化处理方法处理滚动轴承振动数据.基于Huber M估计法,融合了中位数估计的优点,根据时间变量t将实验数据进行离散,构建数学模型,得到一种改进的Huber M方法.应用该方法对圆锥滚子轴承振动数据分析,确定稳健数据的边界值及显著水平.研究结果表明:在0~0.1显著...  相似文献   

7.
针对配对的病例对照数据,利用偏离哈代-温伯格平衡的信息构造了用于估计基因模型的检验,称为配对的哈代-温伯格不平衡检验(mHWD).基于mHWD估计基因模型并应用相应的配对趋势检验进行关联性分析,称为基于模型选择的趋势检验(GMS).GMS是从数据驱动的角度提出的一种稳健有效的检验,模拟结果显示GMS在现有的关联性检验方法中具有最大的稳健有效性.对类肉样瘤病研究数据的分析进一步表明了基于模型选择的趋势检验的良好性质.  相似文献   

8.
中位数回归是一种稳健的估计方法,在实践中有着广泛应用.基于贝叶斯方法研究二值响应数据的中位数估计问题,通过引入合适的潜在变量得到了贝叶斯层次模型,进而得到易于后验抽样的吉布斯抽样程序.为验证新方法估计的稳健性,通过大量数据模拟,并与已有方法进行比较,得到了满意的结果.最后实例数据分析进一步证明了所提方法的有效性.  相似文献   

9.
提出一种基于无截断Bartlett核函数的重构方法,有效避免长期方差函数估计方法面临的核函数与窗宽选择问题,并将其应用到部分相依函数型线性模型中.利用考虑函数型数据相依性的最小二乘支持向量机对模型进行参数估计,数值模拟结果表明:与未考虑函数型数据相依特征的最小二乘估计方法相比,提出的考虑函数型数据相依性的最小二乘支持向量机估计方法能更稳健地估计向量系数,有效提高样本外的预测精度;将部分相依函数型线性模型应用到上证指数开盘价的预测中,得到较好的预测效果.  相似文献   

10.
变系数模型的变量选择及在股票数据中的应用   总被引:1,自引:1,他引:0  
作者研究了纵向数据分析中变系数模型的变量选择及效应估计问题,该模型允许变量的效应随时间改变.本文方法在进行变量选择的同时,也估计变系数函数,避免了传统的变量选择方法极其复杂的计算.将本文方法用于股票价格分析,能够快速地在公司的众多财务变量中挑选出对股票收益率有显著影响的变量,并估计这些变量的时变效应,很好地解释股票收益率的变化.  相似文献   

11.
提出了一种新的基于MM-算法的局部常数核加权计算法,使用该方法得到的分位数回归估计曲线在比较弱的条件下是连续光滑的.讨论了核方法中协调参数的选取问题.最后,数值模拟和实证研究的结果表明,利用所提出的计算方法所得到的非参数曲线估计在重尾误差的情况下具有一定的稳健性.  相似文献   

12.
针对高维数据的建模分析问题,提出一种基于弹性网络法和复合分位数回归相结合的稳健估计方法。 在该 估计方法中,所提出的模型能够有效进行变量选择与系数压缩,并处理数据间的多重共线性与群组效应问题,在大 数据时代下具有较广的适应性。 同时,与已有的惩罚最小二乘估计和惩罚分位数回归估计相比,该估计方法不仅 放宽了对模型误差项的分布要求,而且综合考虑了多个分位点的损失,在面对离群值或呈现尖峰、厚尾分布数据时 能够保持更强的稳健性和抗干扰性。 在一定条件下,对所构建模型估计的相合性与稀疏性进行了理论分析,结果 表明:所提出的模型能够将不相关的变量完全压缩至零,且估计量和真实系数以趋于 1 的概率相同。 此外,在数值 模拟方面,设置了 5 种误差项分布条件,根据设定的 4 项指标,通过与其他惩罚函数模型以及损失函数模型进行比 较,结果表明新提出的方法具备更好的稳健性与有效性。  相似文献   

13.
大数据时代下收集到的数据常含有异常值或呈现尖峰厚尾以及变量之间具有较强的相关性,针对此问题,结合秩回归和自适应弹性网(Adaptive Elastic-net)提出了一种高效稳健的变量选择方法.此方法的最大优点在于不仅能够有效处理协变量之间的强相关性而且还能克服多重共线性问题,同时能抵抗厚尾分布或异常值的影响,实现稳健...  相似文献   

14.
针对高维数据集,提出一种利用预测变量之间的图结构信息来改进稀疏逻辑回归模型的方法。该方法通过利用高维图结构数据或者重叠组结构来进行逻辑回归建模,即使预测变量的图结构未知,该方法仍适用,当图结构为某些特殊形式时,目前流行的方法,如Adaptive Lasso,(Overlapping) Group Lasso和岭回归都可以看作是该模型方法的特例。数值模拟和实例分析应用表明:该方法能有效地利用预测变量图结构信息,提高模型在估计、预测以及变量选择等方面的表现,并且该模型在有限样本情形下是有效的;该模型方法克服了数据集的维数问题,利用高维数据的图结构提高了稀疏逻辑回归模型的性能,可广泛应用于高通量基因数据集的疾病分类研究中。  相似文献   

15.
Near-infrared (NIR) spectroscopy has been widely employed as a process analytical tool (PAT) in various fields; the most important reason for the use of this method is its ability to record spectra in real time to capture process properties. In quantitative online applications, the robustness of the established NIR model is often deteriorated by process condition variations, nonlinear of the properties or the high-dimensional of the NIR data set. To cope with such situation, a novel method based on principal component analysis (PCA) and artificial neural network (ANN) is proposed and a new sample-selection method is mentioned. The advantage of the presented approach is that it can select proper calibration samples and establish robust model effectively. The performance of the method was tested on a spectroscopic data set from a refinery process. Compared with traditional partial leastsquares (PLS) , principal component regression (PCR) and several other modeling methods, the proposed approach was found to achieve good accuracy in the prediction of gasoline properties. An application of the proposed method is also reported.  相似文献   

16.
提出了一种基于扩展线性矩阵不等式的鲁棒模型预测控制器的综合方法。通过引入松弛矩阵变量,实现了Lyapunov矩阵变量与系统矩阵的解耦,提供了额外的设计自由度,同时也降低了Lyapunov变量的保守性;通过将提出的方法应用于某型飞机综合飞行/推进控制系统的纵向控制律设计,并与传统的鲁棒模型预测控制方法进行对比仿真,检验了所提出方法的有效性和优越性。  相似文献   

17.
为了提高城轨塞拉门系统的智能化水平,增强城轨塞拉门运行的安全性、可靠性,提出一种基于ReliefF优化梯度提升决策树的塞拉门早期故障诊断方法,对塞拉门故障隐患进行实时有效监测和排查.在不同早期故障类型下进行城轨塞拉门早期故障试验,利用传感器采集塞拉门电机转速、转矩以及电流,通过特征工程建立数据集;运用ReliefF多分...  相似文献   

18.
自适应搜索的改进遗传算法及其应用   总被引:8,自引:0,他引:8  
提出了一种具有自适应搜索能力的快速收敛遗传算法。在计算过程中,设计变量的搜索范围依据每代自变量的数学期望和方差自动进行调整,并且通过引入进化策略中的自适应高斯变异算子,对变异算子进行改进,加速了算法的收敛性。为了验证算法的可行性和鲁棒性,对一个高维多峰函数的极小值搜索问题进行了求解,并将算法进一步应用于离心叶轮的形状优化问题。计算结果表明,该算法克服了传统遗传算法中设计区间的给定具有一定盲目性的缺陷,在收敛性和鲁棒性方面均优于传统的实数编码遗传算法。  相似文献   

19.
通过研究特征变量与类变量的信息测度和特征子集与类变量之间信息测度计算方法,实现快速的特征选择。将基于扩展熵的信息损失量测度用于度量类变量之间的相关性。为避免计算联合互信息的复杂计算,提出了基于信息损失量的变量相关度增加量计算方法,在保证新增特征可提供更多信息量前提下,同时提高特征选择的速度。最后对UCI的3种分类数据集进行实例分析,利用支持向量机对选择的特征子集进行分类验证,并将分类结果与其它常用特征选择方法进行了比较。结果表明所提出的特征选择方法比现有的特征选择方法更有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号