首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统模型对心肺复苏结果预测准确率较低、模型可解释性较差,提出了一种基于多模型加权递归消除法(MW-REF)的心肺复苏结果预测模型,并在Shapley加法解释(Shapley additive explanation, SHAP)框架下分析影响心肺复苏结果的关键因素。采用了随机森林、GBDT、XGBOOST作为基模型,将其特征重要性得分加权后使用递归消除法过滤特征并对3种及模型采用Voting进行模型融合,利用五折交叉验证下的准确率作为最终特征选择标准。最后对最终特征数据集下的融合模型进行可解释性分析。实验结果表明,与传统的递归特征消除算法对比,该模型提升了心肺复苏结果预测的准确率,模型预测结果具有可解释性,可为临床诊断提供辅助,提高诊断效率与心肺复苏成功率。  相似文献   

2.
该文以沪深300为投资标的池,选取波动指标、收益指标、经典技术指标和交易指标等4大类指标共24个二级指标作为评价因子,用递归特征消除法结合Stacking集成学习以及传统的随机森林、支持向量机和逻辑回归等4个机器学习算法分别构建分类模型,预测投资标的池中周频收益率排名前20%的股票标的,为投资者提供量化投资策略.实证研究对这4个模型的分类预测效果进行了比较.结果表明,基于递归特征消除法和Stacking集成学习的模型的预测性能最高,其AUC值达到0.644 7,准确率为60.21%,精确率为59.87%,召回率为62.65%,F1值为61.23%.因此,基于递归特征消除法和Stacking集成学习的模型能够有效地为投资者选取高收益率的投资标的,是一个可行的基于机器学习的量化投资策略.  相似文献   

3.
针对传统医疗图像误差预测算法无法很好的选择图像特征,存在图像误差预测值与实际值拟合度低、预测耗时长等问题,提出基于卷积神经网络与特征选择的医疗图像误差预测算法.首先,选取5种集成规则构建自适应多分类器,对医疗图像区域进行分类;其次,训练卷积神经网络,利用训练完成的神经网络提取不同类别医疗图像区域特征,以此为基础计算区域距离,寻找出相似度最小的区域,完成图像可疑区域定位;再次,融合多评价标准生成特征子集,从中搜索得到最优特征子集,完成可疑区域图像特征选择;最后,以选择得到的特征区域像素点作为训练样本,建立预测样本与训练样本之间的多元线性回归矩阵,实现误差预测.实验结果表明,所提算法的集成规则适应度较高,分类性能好,区域距离计算准确率高达95%左右,特征选择的AUC值(Area Under Curve)高,且预测结果拟合度和预测耗时均优于传统算法.  相似文献   

4.
为破除XGBoost模型的黑盒特性,增强模型的说服性,提出一种基于SHAP的可解释性航班到港延误时长预测模型。首先,对航班历史数据、天气数据进行融合,在融合数据的基础上进行异常值处理,并利用递归特征消除方法进行特征选择;其次,构建航班延误时长预测模型,利用遗传算法进行参数调优,并与目前常用的模型进行对比;最后,在航班延误时长预测的基础上结合SHAP模型,从总体特征和特征间的相互关系2个角度分析特征的重要程度。实验结果表明,经过遗传算法调优的XGBoost模型预测精度更高,其中MAE降低了8.94%,RMSE降低了19.85%,MAPE降低了6.15%,且其模型精度更高。因此,SHAP模型破除了XGBoost模型的黑盒特性,增强了模型的可解释性,可为降低航班延误时长提供技术支持。  相似文献   

5.
特征选择是机器学习领域中的基本问题之一,在大规模数据处理中至关重要.目前大多数特征选择方法以单一值作为特征的分类能力评价标准,本文提出基于子类问题分类能力的特征选择方法,该方法用特征对各子类问题的分类能力及其加权平均值来度量特征的分类能力,既能保证总分类能力强的特征被选择,也能保证对子类问题分类能力强但总分类能力不强的特征被选择.将该方法与已有的3个特征选择方法在4个公开的基因表达数据集上进行比较,结果表明该方法是有效的,且可以提高分类预测准确率.  相似文献   

6.
随着清洁能源替代和电力系统电力电子化的趋势增强,传统的基于理论模型的电力系统数值仿真方法将面临新的挑战,不依赖于元件模型的数据驱动型电网稳定评估方法逐渐受到重视.基于极限学习机(ELM)理论,提出适于在线应用的电力系统暂态稳定评估方法.首先,通过调节稳定和失稳仿真样本的比例进行样本筛选,减轻样本集中失稳样本较少而引起的样本不均衡现象,并引入递归特征消除法进一步处理样本集;然后利用交叉验证法优化ELM的网络结构,并用处理后的样本集进行ELM的训练;最后,根据神经网络的输出结果预测系统的稳定性,并改进泛化能力评价标准对结果的可靠性进行评估.算例分析表明,递归特征消除法可明显降低特征冗余度,改善模型性能,所提出算法的训练时间短且具有较高的预测准确度.  相似文献   

7.
为了提高视频中行人检测的准确度,提出了一种基于递归卷积神经网络的行人检测方法.该方法利用递归卷积神经网络融合视频中连续图像的上下文信息,以实现准确的行人检测.首先,利用卷积神经网络提取连续图像的多个特征图组;然后,根据先后次序,将多个特征图输入到递归卷积神经网络中,形成一张关于行人位置的掩码图;最后,通过在掩码图上预测行人的检测框,获得视频中当前图像的行人检测结果.实验结果表明:相比于其他行人检测方法,该方法在ETH、CUHK和PETS 2007三个数据集上都取得较准确的行人检测结果.  相似文献   

8.
为了改善视频数据在差错信道上传输的鲁棒性,结合H.264/AVC标准的多模式划分特点,提出了一种基于像素递归失真估计的率失真优化模式选择算法。该算法针对H.264/AVC中的多种帧内和帧间预测模式,对像素的递归失真估计方法进行改进,准确估计了差错环境下的视频失真,并采用二次率失真模型预测运动补偿编码的总码率以进行运动估计,最后运用率失真优化模型进行编码模式判决。实验结果显示,相对于H.264参考软件的模式选择算法,该算法提高了视频的差错恢复性能,能有效改善视频传输的鲁棒性。  相似文献   

9.
为了改善传统标准dropout无法根据特定数据集确定合适尺度的不足,提出了多尺度融合dropout(MSF dropout)方法.利用验证数据集对多个不同尺度的网络模型进行训练,通过学习得到符合该数据集特征的最佳尺度组合,让MSFdropout具备自适应数据集的能力,从而使网络能够使用最佳尺度来进行高精确度的预测.首先训练若干组不同尺度的网络模型,使用遗传算法求出各网络模型的最优尺度;然后通过最优尺度对对应的网络参数进行缩小得到预测子模型;最后以一定的权重将这些子模型融合成为最终的预测模型.使用MSFdropout在标准数据集MNIST和CIFAR-10中进行实验,实验表明:当选择了合适的尺度数量和尺度梯度后,预测精度获得了明显的提升,同时很好地控制了计算时间,验证了多尺度融合方法的有效性.  相似文献   

10.
针对作战方案评价指标权值确定过程存在不确定和主观性的问题,本文提出了基于支持向量回归机的线性和非线性递归特征消除法(SVR-RFE)。该方法利用权值向量和函数值作为SVR-RFE的特征选择标准,采用支持向量回归机(SVR)对特征选择前后的回归能力进行了分析比较。在某作战方案样本集上的仿真实验表明,线性和非线性SVR-RFE在作战方案数据集上的特征选择效果是一致的,在特征维度为50%左右时,SVR算法达到最优泛化性能。  相似文献   

11.
与传统的机器译文评价方法不同,译文质量估计技术旨在无参考译文的情况下对机器译文质量进行评价.针对目前流行的基于深度学习的译文质量估计方法因数据匮乏和模型限制导致所提取的深度学习特征不充分的现状,提出一种多特征融合的方法.该方法将词预测特征、语境化词嵌入特征、依存句法特征和基线特征等从不同模型中提取到的特征分别输入到基于循环神经网络的下游模型中,进一步学习后采用不同的特征融合方式进行融合,以此来提高译文质量估计的准确性.通过对比实验表明,本文所提出的多特征融合策略相比于单个特征能更好地对双语信息进行表达,且进一步提高了译文质量估计的皮尔逊相关系数等评价指标.  相似文献   

12.
在决策学习过程中,由于缺乏详细的知识而进行的逻辑欠缺的随机猜测可能会与实际情况形成随机一致性,其广泛存在于分类等学习任务中,对学习模型的泛化能力和决策结果造成影响。在分类过程中,信息熵作为特征评价的重要指标之一,在特征评价中会存在多值偏向(偏向于选择取值较多的特征)的问题。文章从消除决策过程中的随机一致性出发,选择使用一种消除随机一致性的互信息作为特征选择的指标,首先将消除一致性的互信息与信息增益、信息增益比等指标进行比较,说明了该指标可以有效消除随机一致性,解决多值偏向问题,从而更好地进行特征选择。然后基于该指标,提出消除随机一致性的决策树方法,并在9个真实数据集上验证其有效性。实验结果表明,消除随机一致性的互信息相较于传统的信息熵能够有效地解决信息增益的多值偏向问题,且消除随机一致性的决策树算法相较于传统的ID3算法、C4.5算法以及CART算法具有更高的平均分类准确率。  相似文献   

13.
近年来,对蛋白质组学质谱数据进行模式识别成为癌症诊断的一种新方法,由此发现的新生物标记物已经成功用于多种重大疾病的早期预测.这种方法的两个难点是:如何提取能够明显区分不同类别的特征,如何有效处理谱数据中大量的特征.本文提出基于多元图形特征融合的方法对蛋白质组学质谱高维数据进行可视化降维处理.在对质谱数据进行必要的预处理后,选择部分原始特征并将其映射到多元图表示域.通过多层递阶图形特征选择与提取得到最终的多元图癌症诊断模板.采用国际公开卵巢癌高通量数据集进行验证,得到了较好的分类效果.  相似文献   

14.
综合利用彩色和深度信息,采用多数据模式的特征提取策略,提出一种基于卷积-递归神经网络和费舍尔向量的RGB-D 物体识别方法. 对于彩色图像和深度图像,分别利用卷积-递归神经网络和卷积-费舍尔向量-递归神经网络提取物体的纹理及形状特征. 为了更加全面的获取物体信息的特征表述,引入了灰度图像和表面法向量作为原始数据的补充,并利用卷积-递归神经网络提取特征. 最后,将4 种数据模式下提取到的特征融合起来,输入到softmax 分类器中实现RGB-D 物体识别. 在标准的RGB-D 数据库中对算法进行验证,所提算法可以有效提高物体识别率.  相似文献   

15.
在大数据时代,如何根据已有的贷款金融客户信息精准预测客户行为,探索大数据时代公司客户贷款行为规律,对公司贷款业务的开展进行指导,从而有效提高公司贷款投放金额规模,为金融机构选择优质的贷款客户提供决策依据.目前单一的预测模型研究方法虽然相对成熟,但容易受到其他一些随机因素的影响,导致预测的准确率和召回率不高,且模型仅适用于某些特定环境,泛化能力不强.因此,基于已获取的数据,本文使用数据挖掘技术,融合多种机器学习算法,针对特征选择前后的数据建立Stacking融合模型来预测客户的贷款行为.结果表明,通过数据建模分析,相较于预测性能较好的单模型Adaboost,融合模型各评价指标都有一定的提高.而且融合预测模型较为稳定,可以为公司挖掘潜在客户提供有效的业务开拓依据和实现资金精细化管理奠定坚实基础,具有较大的参考价值和现实意义.  相似文献   

16.
本文基于深度卷积神经网络和融合图像提出了一种引入投影权值归一化的立体图像质量评价方法.首先基于人眼双目竞争现象,提出对经过Gabor滤波后的左右视点图像进行彩色融合,从而得到单幅融合图像.卷积神经网络的输入即为预处理后的融合图像,通过卷积层自主对图像特征进行提取,采用池化层对特征信息降维,保留显著特征且减小网络计算复杂度;采用Re LU非线性激活函数缓解梯度消失,有效缓解了网络过拟合问题;网络引入数据批量归一化来规范各层输入数据的分布,引入投影权值归一化来保证权值参数的量级相同,有效地提升了算法的性能.本文在公开的立体图像库LIVE-Ⅰ和LIVE-Ⅱ上进行了实验.实验结果表明,本文方法在对称失真与非对称失真的立体图像质量评价上均具有较好的性能.  相似文献   

17.
针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势.  相似文献   

18.
针对当前不平衡数据分类算法中存在的分类精度低和容易陷入局部最优状态的问题,提出一种基于鲸鱼优化和深度学习的不平衡大数据分类算法.该算法由特征选择、预处理和分类3个阶段组成:(1)为了提高分类精度,使用鲸鱼优化算法(whale optimization algorithm, WOA)在不平衡数据中寻找最优特征子集,消除不相关和多余的特征;(2)采用局部敏感哈希的合成少数类过采样技术(locality sensitive hashing synthetic minority oversampling technique, LSH-SMOT)对数据集进行预处理,解决类不平衡问题;(3)使用基于WOA算法优化的双向递归神经网络(bidirectional recurrent neural networks, BRNN)对预处理后的数据集进行分类.实验结果表明:本文算法能够有效解决不平衡数据集的分类问题,相比于其他算法,本文算法在分类精度和局部最优避免率方面具有明显优势.  相似文献   

19.
提出了一种新的基于方向梯度直方图(HOG)的图像特征融合方法. 该方法采用视觉激活度(VAM)来选择具有显著方向性的局部梯度统计值,构成融合的方向梯度直方图(FHOG),有效地解决了多分辨率(MR)图像融合存在的不足. 文中把这些融合特征输入线性支持向量机(SVM),训练得到人体/背景二元分类器用于人体检测. 实验表明,与传统多分辨率图像融合方法相比,在参考点处本文提出方法漏检率下降3~10%,虚警率平均下降20%以上.   相似文献   

20.
油藏预测中的贝叶斯网络融合方法   总被引:5,自引:1,他引:4  
针对油藏分布预测的问题,提出了一个贝叶斯网络融合模型并设计了相应的算法.数据预处理时,为消除对地质、测井、钻井等多个专业和领域的数据分类所产生的误差,采用了数据聚类分析中k-平均算法,并针对专业领域数据的特点对算法进行了扩充与优化.最后,融合中心将贝叶斯网络输出的客观概率知识与领域专家知识进行主观融合,得出结论.实验表明,这一方法解决了油藏问题研究中传统方法(单一神经元网络模型方法)设计困难,训练周期长、速度慢,分类结果不精确等缺点,可以满足油藏分布预测的要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号