首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 890 毫秒
1.
交叉验证策略广泛应用于分类问题的模型比较和模型选择中.文章提出一种均衡7×2交叉验证并给出了相应的构造方法.文章以分类回归树(CART)为考察模型,对比了采用均衡7×2交叉验证、组块3×2交叉验证、标准5折和10折交叉验证在模型选择中的性能.模拟结果表明,在小规模数据集上,均衡7×2交叉验证方法选择到真模型的概率明显高于其余三种交叉验证的选择方法.  相似文献   

2.
泛化误差的三种交叉验证估计方法的比较   总被引:1,自引:0,他引:1  
在泛化误差(GeneralizationError)的估计中,交叉验证(Cross—validation)是最常用的方法.基于均方误差准则下,采用生物信息数据比较了泛化误差的5折、10折交叉验证和组块3×2交叉验证估计,实验证明组块3×2交叉验证比5折、10折交叉验证方法更好.  相似文献   

3.
超高维线性回归中的方差估计问题是超高维回归分析中需要解决的关键问题。针对在超高维线性回归中普通最小二乘法得到的方差估计存在有偏性的问题,有学者基于标准二折交叉验证提出了一种新的方差估计方法RCV。但发现方差的RCV估计依赖于数据的切分,稳定性差。为此,文章提出用组块3×2交叉验证的方法进行方差估计,并通过模拟实验将其与RCV方法进行了比较,验证了组块3×2交叉验证估计比RCV估计更为稳定。  相似文献   

4.
在模型选择中,常用5折、10折交叉验证方法.文章给出一种基于3×2交叉验证的模型选择方法,并通过模拟实验证明了在Logistic模型中,3×2交叉验证要比5折和10折交叉验证选到真模型的概率更大.  相似文献   

5.
基于代表的邻域覆盖粗糙集分类算法,在某些数据集上表现良好,数据的类别不平衡问题严重影响算法的分类精度.为尽量消除类别不平衡问题的影响,在k折交叉验证方法的基础上,针对基于代表的邻域覆盖粗糙集分类算法,提出了3种集成策略.策略1依靠k折交叉验证,获得对应的k个基分类器,所有的基分类器组成委员会对未分类样本分类;在策略1的基础上,策略2选择分类精度相对较高的基分类器组成委员会,对未分类的样本进行分类;策略3在前2种策略的基础上,利用主动学习的思想,对训练集进行扩充,得到新的分类器再对未分类样本分类.实验所用数据集为UCI标准数据集,且对k的取值做了对比实验.结果显示,3种策略均有不同程度的提升,且k取5时总能取得较好的提升效果.对于不同数据集,应选择相适应的改进策略.  相似文献   

6.
文章基于UCI数据库中10个常用的数据集对用于算法性能对照时五种交叉验证检验方法的可重复度量进行了比较研究,实验结果表明K折交叉验证(K=2,5,10)t检验随着折数的增大可重复性增大,在相同的计算复杂度下5×2交叉验证F检验和10折交叉验证t检验在大多数情形下有比5×2交叉验证t检验更高的可重复性.  相似文献   

7.
宋建  王宇峰  梁家睿  李东 《科学技术与工程》2022,22(27):12000-12005
针对注塑生产过程中人工质量检测存在的效率低、成本高等问题,提出了一种基于注塑加工过程数据对产品尺寸是否合格进行预测判定的方法,首先对于清洗后的数据集采用5折交叉验证筛选出LR模型、SVM模型等5个分类模型,然后以ROC曲线和AUC值作为性能评估指标,综合比较和分析了5个分类模型在不同特征选取方法下的分类性能。结果表明:基于树模型特征选取与LR算法组合对本文的数据集表现出优良的分类性能,准确率可达96.42%,具有一定的工程应用价值。  相似文献   

8.
在贝叶斯理论框架下探讨单指标回归模型的参数估计问题,通过Gibbs-MH算法对满条件分布进行抽样,以得到指标函数和模型参数的贝叶斯估计.模拟验证了该方法能够很好地识别出指标函数且估计偏差小.最后运用该模型对计算机CPU性能数据进行实证分析,进一步说明了此方法的有效性和实用性.  相似文献   

9.
首先, 用条件最小二乘方法讨论缺失数据下MGINAR(p)模型的参数估计问题, 得到了参数的条件最小二乘估计. 其次, 模拟验证4种处理缺失数据方法的可行性并比较估计效果, 模拟结果表明: 当缺失概率较小时, 可使用个案剔除法或均值插补法; 当缺失概率较大时, 可使用桥插补法, 以降低估计偏差.  相似文献   

10.
通过推导H-SVMs推广能力的模型,得出H-SVMs的推广能力与样本类别数、空间分布、容量、树结构等有关,且保证高优先级结点的推广性能是提高H-SVMs性能的有效途径。根据分析结果,提出了一种基于SVM最大间隔分类、最小间隔聚类构造H-SVMs的新方法。利用SVM的分类间隔作为分类、聚类指标,通过Top-down和Bottom-up两种途径混合构造H-SVMs,其中,最大间隔分类采用Top-down策略,在各结点依次选择最大间隔的SVM,将输入样本按类别分为2类;最小间隔聚类采用Bottom-up策略,在各结点依次选择最小间隔的SVM,将输入样本按类别两两聚类。从UCI数据库中选取多类数据进行测试,实验结果验证了该方法的有效性,说明所构造的H-SVMs具有较好的、稳定的推广性能。  相似文献   

11.
针对传统人脸属性估计算法算力大、推理速度慢、精度低,难以完成算法在移动或嵌入式设备上集成应用等问题,提出一种基于嵌入式系统的多任务人脸属性估计算法。首先,采用MobileFaceNet网络中的瓶颈结构融合跨阶段融合网络 (cross stage partial network,CSPNet)和空间金字塔网络 (spatial pyramid pooling network,SPPNet) 设计CSPSPP_bk结构作为人脸属性估计算法共享网络特征提取模块;然后,在局部属性中增加通道注意力机制,在较困难的全局属性中使用更深、性能更优的网络模型作为Teacher模型指导所设计的轻量级多任务属性网络进行知识蒸馏,采用逐层剪枝的方法对网络模型进行优化,优化后的模型量仅1.8 MB;最后,通过动态类别抑制损失函数进行损失度量,均衡样本数据分布。在公共数据集CelebA和Adience数据集上进行测试比较,性别和眼镜的平均准确率分别为98.89%、99.72%,标准差为3.01%时,年龄估计精度为60.21%,在RK3288开发板上的前传推理速度为138 fps。结果表明:所提方法可广泛应用于嵌入式设备和移动边缘设备。  相似文献   

12.
张阳  张涛  陈锦  王禹  邹琪 《北京理工大学学报》2019,39(12):1258-1262
网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE (synthetic minority oversampling technique)数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%~20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.   相似文献   

13.
使用MULULOG7.03软件的边际极大似然估计法,选取双参数kgistic模型对某大学2011级新生的EPQ测试数据进行分析,针对项目区分度、项目难度、信息量等指标对各项目及各分量表进行深入探讨.结果显示:数据符合项目反应理论的基本假设;多数项目的区分度、难度达到理论要求.但E、P、N三个分测验在划界分数点上得到的信息量有限,难以对被试做出良好的区分;三个分测验各自的总信息量未达到理论要求.  相似文献   

14.
虞烽  王志明 《科技信息》2012,(7):228-229
基于UDP协议的速度快、兼容性强、易扩展等特点,在当前测控领域中得到了广泛的应用。文中描述了UDP协议在多根电梯钢丝绳同步测量时,对大容量数据流的实时传输的应用,很好地满足了实时检测的要求,提高检测系统的性能,有效地保证系统的可靠性。  相似文献   

15.
宏观固定资本存量估计既是对一个国家或地区经济生产能力评估的重要指标,也是数量经济学方法在许多经济分析应用中的基础数据.本文分析了被广泛应用的估计资本存量的永续盘存法,揭示了其应用中存在的问题,并以我国最新公开统计数据为基础,估计了我国1990年~2011年间的宏观固定资本存量.  相似文献   

16.
针对数控机床可靠性研究过程中,由于可靠性数据较难收集导致可靠性分布模型不唯一的问题,采用ANN模型对收集到的少量可靠性数据进行扩充,扩充后的数据采用K-S检验法进行分析以确定可靠性数据模型,同时在求解确定可靠性分布模型参数过程中,将混合粒子群优化(hybrid particle swarm optimization,HPSO)算法引入极大似然估计中,解决其在小样本数据下求解某些复杂分布模型时易陷于局部最优解和求解效率低的问题.实例分析结果表明:采用混合粒子群算法求解可以在求解效率和收敛性性能上达到较好的平衡,比较所有的求解模型结果,经过ANN模型扩充后的2重3参数威布尔分布的相对均方差最小,其值为0.0425,说明利用该方法求解数控机床的可靠性分布模型是可行的,而且能够获得较精确的结果.  相似文献   

17.
丁盛  Yah  Kai  Qiu  Ytmzhou  Zhu  Minghua  Liu  Haitao 《高技术通讯(英文版)》2008,14(4):359-363
Differential modulation was widely used for wireless networks in which channel estimation was difficult. Based on orthogonal design, a novel distributed differential space-time coding/decoding scheme for M-PSK modulations was proposed, which had a high code rate of 2/3 and second-order diversity for the two-user cooperative networks. The performance of decode-and-forward (DF) protocols was evaluated. Simulations show that the differential space-time modulation scheme in this paper has better bit error rate (BER) performance or higher code rate than the schemes proposed by Tarasak and Wang when interuser channel states are good enough. The impacts of transmission error between two users for the whole system BER performance were also investigated.  相似文献   

18.
为了在未知物体三维模型的情况下使用深度学习进行平面位姿估计,采用编码器-解码器网络,从单个RGB图像中检测平面实例分割及法线信息,并利用这些信息进行位姿解算,获得每个平面的实时位姿。实验结果显示,平面召回率为0.625,平面法线召回率为0.414,实时性为18.5 f/s,验证了算法的可行性。  相似文献   

19.
该文在不同条件的组合下考查了EM算法和MCMC算法对3种常用的认知诊断模型(DINA模型、DINO模型和G-DINA模型)的参数估计返真性问题.借助项目参数或作答概率分布的偏差、均方根误差、平均绝对离差以及被试的平均属性判准率等指标,评价这2类算法的表现.模拟研究结果表明:MCMC算法更适用于低质量题目、小样本、测验短的条件,而在其他条件下EM算法的表现与MCMC算法的表现相当.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号