首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
交叉验证策略广泛应用于分类问题的模型比较和模型选择中.文章提出一种均衡7×2交叉验证并给出了相应的构造方法.文章以分类回归树(CART)为考察模型,对比了采用均衡7×2交叉验证、组块3×2交叉验证、标准5折和10折交叉验证在模型选择中的性能.模拟结果表明,在小规模数据集上,均衡7×2交叉验证方法选择到真模型的概率明显高于其余三种交叉验证的选择方法.  相似文献   

2.
将组块3×2交叉验证方法用于高维回归中的调节参数选择.首先通过ISIS方法把模型的维数降低到样本个数以内,然后使用AENET方法对降维后的模型进行进一步的降维和参数估计,使用组块3×2交叉验证方法选择最佳的调节参数.综合考虑模拟实验中各种调节参数选择方法(AIC、BIC、EBIC、HBIC、5折交叉验证、组块3×2交叉验证)的EMSE值、方差以及计算复杂度,结果表明基于组块3×2交叉验证的方法是有其优势的.  相似文献   

3.
泛化误差的三种交叉验证估计方法的比较   总被引:1,自引:0,他引:1  
在泛化误差(GeneralizationError)的估计中,交叉验证(Cross—validation)是最常用的方法.基于均方误差准则下,采用生物信息数据比较了泛化误差的5折、10折交叉验证和组块3×2交叉验证估计,实验证明组块3×2交叉验证比5折、10折交叉验证方法更好.  相似文献   

4.
文章基于UCI数据库中10个常用的数据集对用于算法性能对照时五种交叉验证检验方法的可重复度量进行了比较研究,实验结果表明K折交叉验证(K=2,5,10)t检验随着折数的增大可重复性增大,在相同的计算复杂度下5×2交叉验证F检验和10折交叉验证t检验在大多数情形下有比5×2交叉验证t检验更高的可重复性.  相似文献   

5.
交叉验证被广泛应用于模型的泛化误差估计,特别是2折交叉验证在分类模型比较中得到广泛的应用.主要针对Logistic分类回归模型采用2折交叉验证的不同切分方法且特征(自变量)取值均为0,1时对模型性能的影响进行了模拟.结果表明,当2折交叉验证的两份数据中的类别分布相同或相近时,准确率、召回率、F值及精确率的2折交叉验证估计的偏差最小,且估计的偏差随着2折交叉验证中类别的差异增加而增加.当2折交叉验证中数据的类别分布相差较大时,模型性能的估计明显地变差.因此,采用交叉验证切分数据时,应尽量保持每份数据的类别分布与总体一致.  相似文献   

6.
超高维线性回归中的方差估计问题是超高维回归分析中需要解决的关键问题。针对在超高维线性回归中普通最小二乘法得到的方差估计存在有偏性的问题,有学者基于标准二折交叉验证提出了一种新的方差估计方法RCV。但发现方差的RCV估计依赖于数据的切分,稳定性差。为此,文章提出用组块3×2交叉验证的方法进行方差估计,并通过模拟实验将其与RCV方法进行了比较,验证了组块3×2交叉验证估计比RCV估计更为稳定。  相似文献   

7.
针对信息增益和信息增益率对属性取值数的偏好,提出了一种调和平均优化选择划分属性的决策树改进算法.首先计算候选划分属性的信息增益,找出信息增益高于平均水平的属性,然后分别计算这些属性的信息增益率和信息增益的调和平均值,从中筛选调和平均值最大的属性,建立分支决策,并用递归方法建立决策树.通过4份不同规模数据实验,利用信息增益、信息增益率、GINI指数以及该文提出的方法作为属性划分的标准,分别考察其准确性在训练集、测试集、10次10折交叉验证(或5次5折交叉验证),以及其平均值.实验结果表明:该方法准确性较好、运行时间较短,具有一定程度的优越性.  相似文献   

8.
基于代表的邻域覆盖粗糙集分类算法,在某些数据集上表现良好,数据的类别不平衡问题严重影响算法的分类精度.为尽量消除类别不平衡问题的影响,在k折交叉验证方法的基础上,针对基于代表的邻域覆盖粗糙集分类算法,提出了3种集成策略.策略1依靠k折交叉验证,获得对应的k个基分类器,所有的基分类器组成委员会对未分类样本分类;在策略1的基础上,策略2选择分类精度相对较高的基分类器组成委员会,对未分类的样本进行分类;策略3在前2种策略的基础上,利用主动学习的思想,对训练集进行扩充,得到新的分类器再对未分类样本分类.实验所用数据集为UCI标准数据集,且对k的取值做了对比实验.结果显示,3种策略均有不同程度的提升,且k取5时总能取得较好的提升效果.对于不同数据集,应选择相适应的改进策略.  相似文献   

9.
基于比较分子力场分析(CoMFA)方法建立24种培氟沙星均三唑硫醚衍生物对人白血病细胞(HL60)抗增殖活性(p M)的三维定量构效关系(3D-QSAR).训练集中20个化合物用于建立预测模型,测试集10个化合物(含模板分子22及新设计的5个分子)作为模型验证.已建立的3D-QSAR模型的交叉验证系数(Rcv2)、非交叉验证系数(R2)分别为0.436、0.903,说明所建模型具有较强的稳定性和良好的预测能力.该模型中立体场、静电场贡献率依次为71.8%、28.2%,表明影响抗增殖活性(p M)的主要因素是在苯环的3,4-位上引入小体积的负电性基团.基于三维等势图,设计了5个具有较高抗增殖活性的分子,有待医学实验验证.  相似文献   

10.
特征选择是高维小样本癌症基因数据分析的首要和关键步骤,但是现有特征选择算法存在特征子集依赖于训练样本且随训练样本不同而变化的问题。为了解决特征选择过程的特征子集不稳定问题,提出一种基于核极限学习机的集成特征选择方法,利用5-折交叉验证划分原始数据,对各训练集继续采用5-折交叉验证进行划分并进行特征选择,以所得5个特征子集之并集作为该训练集的特征子集,构造核极限学习机评价该特征子集的分类性能,以原始数据集5-折交叉验证所得特征子集的平均Jaccard系数评价特征选择算法所选特征子集的稳定性。5个基因数据集的实验测试以及与经典特征选择算法SVM-RFE、LLE Score、ARCO、DRJMIM、Random Forest和mRMR的实验比较表明,本文算法不仅能选择到稳定的特征子集,且所选特征子集具有很好的泛化能力。  相似文献   

11.
站点密度对复杂地形PRISM月降雨空间插值精度的影响   总被引:2,自引:0,他引:2  
【目的】利用降雨和高程与坡向等地形因子之间关系,分析站点密度对于坡面回归方程模型(PRISM)插值精度的影响,探究该模型的适用范围。【方法】以北京西北山区为例,基于研究区数字高程模型(DEM)、山地自动气象站点数据和降雨数据计算插值结果,采用反距离加权法(IDW)、克里金法(Kriging)和样条函数法(Spline)等插值方法,以及交叉验证和实测数据验证等方法进行数据对比,分析站点密度对插值结果的影响。【结果】当站点密度从0.55×10-2个/km2降低到0.18×10-2个/km2时,各种插值方法的插值精度均随站点密度的减少而降低,PRISM模型的变化程度最大,Spline的变化程度最小; 同时当站点密度逐渐降低至0.18×10-2个/km2时,PRISM模型的插值误差超越Kriging和IDW,但仍在Spline之上。【结论】当站点密度较低时,PRISM模型优势不明显,建议使用IDW和Kriging。  相似文献   

12.
 为了准确计算新疆某地区砂岩储层的束缚水饱和度,从6口井中分别选取142块砂岩样品进行了核磁共振实验和压汞实验测量。根据核磁共振实验结果,采用T2谱面积比值法、称重法、谱系数束缚水截止值(SBVI)法和统一T2截止值法分别求取束缚水饱和度,认为称重法和T2谱面积比值法更佳,适用于建立研究区储层的束缚水饱和度模型。在核磁共振实验基础上,考察了压汞实验所得到的束缚水饱和度的适用条件,结果表明:对于孔隙度小于15%、渗透率小于1×10-3μm2的样品,6.897×10-3MPa的驱替压力可以将可动水驱替干净,在压汞实验得出的毛管压力曲线上所对应的此驱替压力下的含水饱和度为实际的束缚水饱和度;对于孔隙度大于15%、渗透率大于1×10-3μm2的岩样,6.897×10-3MPa的驱替压力可将部分束缚水驱出,此驱替压力下的含水饱和度不是实际的束缚水饱和度。对于中、高、孔渗储层,利用储层油水密度差所产生的浮力等于毛细管压力这一条件,在纯油层段转化成合适的储层驱替压力,在毛管压力曲线上读取此驱替压力下的含水饱和度即实际的束缚水饱和度。  相似文献   

13.
合成了一种新的席夫碱配体2,4-二羟基苯乙酮缩三羟基甲基氨基甲烷.该配体与铽(Ⅲ)的配合物的荧光强度在磷酸钠或六次甲基四胺的存在下可增强18或26倍.有机溶剂CH3CN,DMF,丙酮,THF,DMSO,CH3OH,C2H5OH的添加可使其荧光强度进一步增加3~19倍.其中,用CH3CN作溶剂时荧光增加倍数最大,Tb-HL-HMTM体系荧光最强.pH=6.0时,激发和发射波长分别是355和545 nm.在理想情况下,荧光强度与Tb3+离子浓度成正比.对于HL-Na3PO4-CH3CN体系,线性范围2.3×10-10~5.8×10-5 mol/L,检测限2.0×10-10 mol/L,对于HL-HMTM-CH3CN体系,线性范围9.8×10-11~7.2×10-5 mol/L,检测限9.0×10-11 mol/L.基于此对Tb3+进行定量测定,该分析方法简单、快速、灵敏、干扰小.同时对荧光增强的机理进行了分析和讨论.  相似文献   

14.
 车辆识别技术本身存在着识别难度大、识别结果精度低等问题,本文提出一种基于统计模式识别理论的车辆识别方法,利用非线性支持向量机(SVM)对目标车辆进行识别.首先,该算法通过车载CCD摄像头采集自车前后方车辆的图像信息,对所采集到的图像进行小波去噪以及图像二值化处理,剔除噪声干扰.通过坐标变换使图像中车辆跟实车建立一一对应关系,进而对目标车辆进行准确定位;其次,对处理后的图像进行8×8网格划分,将各网格内满足要求的像素点数跟网格内总像素点数的比值作为每个网格输出值(0,1)的唯一判定条件,将每一行网格输出值的总和作为特征向量的元素.以遗传算法为搜索模式,采用交叉验证技术确定SVM的最佳参数组合,最后将自车前后方10—20m内车辆作为训练样本对模型进行训练和测试;并用ROC曲线(受试者工作特征曲线)对模型进行评价.  相似文献   

15.
基于RBF神经网络的混合气体智能检测系统研究   总被引:1,自引:1,他引:0  
基于传感器阵列和神经网络构造智能系统用于检测混合气体的低质量分数.传感器阵列获取质量分数为1×10-6~5×10-6范围的H2,C2H4,C2H2混合气体响应和质量分数为5×10-5~3×10-4范围的CO响应.通过RBF神经网络学习改善低质量分数混合气体检测的灵敏度.把传感器响应作为神经网络输入,神经网络输出为H2,C2H4,C2H2和CO的质量分数.实例分析表明,系统能较好地克服低质量分数混合气体检测过程中普遍存在的交叉灵敏度,得到满意的检测结果.  相似文献   

16.
制备了一个新型的三维超分子化合物:镉-二茂铁亚甲基苯并咪唑配合物[Cd(FBIM)2I2](FBIM=二茂铁亚甲基苯并咪唑),并通过X-射线衍射仪对其晶体结构进行了表征。循环伏安测试结果表明其氧化还原过程是受扩散控制的,计时电流法和计时电量法测得其扩散系数分别为1.02×10^-5和I.36×10^-5cm^2/s。  相似文献   

17.
Ubiquitous computing systems typically have lots of security problems in the area of identification supply by means of classical Public Key Infrastructure (PKI) methods. The limited computing resources, the disconnection network, the classification requirements of identification, the requirement of trust transfer and cross identification, the bidirectional identification, the security delegation and the privacy protection etc are all these unsolved problems. In this paper, UCIMssp, a new novel ubiquitous computing identification mechanism based on SPKI/SDSI and Peer-to-Peer (P2P) is presented. SPKI- based authorization is exploited in UCIMssp to solve the above problems in the smalbscale ubiquitous computing environment. The DHT and flooding technology of P2P overlay network over the Intemet is expanded to solve the routing search in the large-scale ubiquitous computing environment. The architecture of ubiquitous computing environment, the validation of identification requisition, the identification authorization processes and the identification supply processes etc of UCIMssp are described in the paper. The performance analysis shows that UCIMssp is a suitable security solution used in the large-scale ubiquitous computing environment.  相似文献   

18.
在伴有右手中中微子的SU(3)C×SU(3)L×U(1)X(331)模型框架内讨论了Higgs粒子产生过彻e^+e^-→ZH.结果表明,当新粒子Z'的质量接近质心能量时能对该过程产生明显的修正.在该模型合理的参数空间内,过程e^+e^-→ZH的总产生截面σ与标准模型(SM)相应值的偏差大于5%,应该能在未来的高能直线对撞机实验中观测到。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号