首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对传统MMPI量表中题目数量过多,许多应用场景下受试者依从性差的问题,提出使用机器学习算法对MMPI量表中的临床量表进行简化的方法,对6种经典机器学习算法的简化效果进行了比较,并在受试者测评数据上对原始和简化后测评结果的敏感度与特异度进行了对比分析。实验结果表明,使用最小绝对收缩和选择算子(LASSO)的算法在保持相近准确率的同时简化效果最好,平均减少了37.3%的男性和39.1%的女性受试者题目数量,并且简化后测评结果的敏感度与特异度仍能保持在原始测评结果的85%,缩短了测评时间,适用于更多的应用场景。  相似文献   

2.
由于丙型病毒性肝炎病毒感染后约有3~10%丙肝病例发展为肝细胞癌,因此准确预测丙肝感染情况,提高丙型肝炎病毒检测技术非常重要,为此,采用机器学习中的集成算法进行丙肝预测。为挑选出最优检测丙肝模型,将不同机器学习模型在UCI(University of California Irvine)丙肝数据进行比较分析。实验结果表明,梯度提升树,随机森林以及轻量级梯度提升机表现较好,其中梯度提升树在预测丙肝准确率高达0.935 1。使用梯度提升树对丙肝感染情况进行预测最为准确。  相似文献   

3.
钠离子电池容量退化具有非线性和复杂性,准确预测剩余使用寿命(RUL)十分困难,因此构建SSA优化算法结合梯度提升回归树(GBRT)的RUL预测模型。对实验数据进行滤波平滑处理,绘制容量增量(IC)曲线,从IC曲线中提取与容量衰减相关性高的健康指标(HI),即IC峰值、峰值对应的电压值、峰值面积以及峰值斜率。利用PCA算法对数据进行降维处理以减少数据间的冗余性,将处理后的数据输入GBRT模型,并采用SSA算法寻找最优超参数提高预测精度。利用多组老化实验数据进行验证,RMSE、MAPE和MAE分别在15.2、7%、11.2以下,结果表明该模型有较高的预测精度及稳健性且优于其他主流算法。  相似文献   

4.
利用ECWMF集合数值天气预报结果,针对风电场风速预报、风功率预测,对比分析分位回归、K值近邻及其集成预测方法,根据风速波动特征对集合数值预报成员进行动态检验筛选,筛选出的预报成员再进行分位回归概率区间预测。结果表明与单一分位回归方法相比,基于K值近邻的分位数回归效果显著提升,相关性从原有0.59~0.68提升至0.63~0.82,提升了0.04~0.2,均方根误差从2.44~2.59m/s减少至1.95~2.39m/s。利用"风速-功率"实测数据分段统计得到风功率曲线,与传统算法相比,风功率准确率从81%提升至81.3%,合格率从84.3%提升至84.8%,风速变换到功率的相关性略降,为0.75。基于K值近邻的分位数集成方法,其风速预测基本包罗功率的波动区间,该方法对改善基于单一数值天气预报的风功率预测,指导意义明确、效果明显,在其他风电场的数值天气预报中验证取得一定的效果。  相似文献   

5.
针对电商销量数据的复杂性和现有预测模型的稳定性及泛化能力不足问题,本研究基于大样本多变量数据,应用随机森林和渐进梯度回归树等机器学习模型进行分析。研究结果表明,相比于广义线性回归、弹性网络、支持向量回归、KNN回归树、决策树、多层感知机、AdaBoost,随机森林和渐进梯度回归树对电商销售数据预测拟合更加精确。相比于广义线性回归、弹性网络等7种传统机器学习算法,随机森林和渐进梯度回归树这两种集成学习的方法对电商销量预测更加精确,且渐进梯度回归树算法拟合效果更好、均方根误差更小,是一种更加有效的电商销量预测方法。  相似文献   

6.
建立地质灾害易发性评价模型并开展易发性评价,对提高区域地质灾害预报预警效率和精度有重要意义.然而,如何建立既切合区域实际、又具有推广适用价值的地质灾害易发性评价模型是制约地质灾害预报预警的关键科学问题.以云南省南华县2015年地质灾害详查数据为基础,选择地形、地貌等11个因子,基于均值法,采取梯度提升树算法(XGBoost、LightGBM、CatBoost)、信息量模型与地理加权回归模型开展了地质灾害易发性评价研究.结果表明:(1)地理加权回归模型预测结果存在过拟合现象,信息量模型则存在欠拟合现象;(2)均值法效果最好,AUC(Area Under Curve)值为0.933 7,精度较地理加权回归模型、XGBoost、LightGBM、CatBoost、信息量模型分别提高了1.7%、1.8%、2.0%、3.8%、4.0%;(3)Catboost对正样本的预测效果最差,但是对负样本的预测效果最好,而XGBoost对正样本的预测效果最好,对负样本的预测效果很差,基于3种梯度算法的均值法则对正负样本的预测精度有了明显提高;(4)南华县地质灾害主要诱因有道路修建、断层活动、降雨冲刷、河流侵...  相似文献   

7.
为解决在刑侦领域需要通过脚印信息预测身高的问题,文中提出一种基于深度学习的回归预测算法。该算法首先对原始数据进行预处理来得到适用于深度学习回归模型的数据集,然后根据足迹数据的特性提出了一种由边缘提取和回归预测两个部分组成的新型网络架构FtH-Net(Foot to Height-Net),最后基于预处理得到的数据集和FtH-Net训练得到一个性能良好的预测模型。实验结果表明,相比于传统方法,该方法在保证模型泛化能力的同时大幅度提升了预测的准确率,预测身高2 cm以内的准确率达到了67%。  相似文献   

8.
提出了一种基于梯度的帧内候选模式裁剪算法,通过自适应深度划分并利用空间信息来简化帧内预测过程,大大减少了计算复杂度.实验结果显示,所提出的算法对比HM16.7,可以减少35.25%的计算复杂度,且只有极小的编码效率损失.  相似文献   

9.
以碳钢土壤腐蚀数据为对象,建立腐蚀率模型,对该材料的自然环境腐蚀规律进行研究。提出一种基于提升回归树(boosted regression trees)算法的新方法,针对实验数据小样本情况下的参数选取问题,采用ε不敏感损失函数、动态收缩系数对原算法进行改进。与神经网络、支撑向量回归(SVR)等多个典型算法进行对比研究。仿真数据和实验数据验证表明:改进的提升回归树算法对于数据的高维度、缺失值、高噪声等问题具有较好的鲁棒性,适合小样本数据的处理。利用该算法建立的模型能够准确的描述和预测碳钢在土壤中的腐蚀率,还可用于对腐蚀影响因素及因素间交互作用进行探索性分析。  相似文献   

10.
刘涌泉  李巍  牛伟  罗旭东 《科学技术与工程》2022,22(28):12476-12483
液压系统是飞机重要机载系统之一,它为飞机输出能源驱动,其性能、稳定性和可靠性直接影响飞机的安全性。流量是衡量液压系统稳定性的重要判据,实时监测液压系统管路流量可对系统特性分析、故障诊断提供有力的支持。但由于流量传感器造成的流阻对系统特性有显著影响,因此在航空液压系统中未广泛使用。针对传感器带来的流阻问题,深入分析了与流量相关的参数,提出基于梯度提升回归树的航空液压系统流量预测模型,通过关键参数预测液压系统的流量。试验结果表明:梯度提升回归树(gradient boosting regression tree, GBRT)模型相比最小二乘线性回归模型、决策树回归模型、极端梯度提升树XGBoost模型,在预测准确度、训练时间、测试时间等指标中取得了较好的表现,验证了所提方法的有效性。  相似文献   

11.
提出了一种新型的适用于大规模室内人流密度预测算法.在现有基于无线信号强度的人流密度估算算法基础上,引入加权运算来提升估算质量.进一步,根据连续若干个时间段内估算所得的人流密度,通过BP神经网络模型,对未来某一时刻该区域的人流密度进行预测.根据仿真模型和3个月的数据采集与分析,所得到预测模型的准确率达到了94.70%.   相似文献   

12.
随着网络的发展,平面路由难于适用不断扩展的大规模网络。文章针对这一缺陷,提出一种分层路由结构。文章具体分析了层次网络结构和树构造过程,并结合层次网络结构特点提出了动态层次组播路由算法(DHMR),该算法具有扩展性,适用于大规模网络。实验结果表明,动态层次组播路由算法从运行速度比动态平面路由算法(DFMR)快,同时减少了算法的时间复杂度和存储空间,但组播树的性能有所降低。  相似文献   

13.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法。采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测。研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度。  相似文献   

14.
基于提升树的自然场景中文文本定位算法研究   总被引:1,自引:0,他引:1  
提出了一种新的基于提升树算法的自然场景中文文本定位技术.首先利用边缘特征进行文本区域的检测,即对下采样后彩色图像首先进行边缘提取、二值化处理,然后通过形态学运算以及连通区域分析去除大量的非字符连通域,获得候选的文本区域,最后,提取候选文本区域的PHOG-Gabor特征,通过提升树算法进一步确认是否为字符连通域.通过实验验证,该算法具有很高的召回率和准确率,综合性能较高.  相似文献   

15.
针对室内环境中指纹定位接收信号强度信息的高维时变特性以及动态目标定位误差的累积问题,提出了一种基于梯度提升决策树与粒子滤波相结合的融合算法。该算法首先利用梯度提升决策树算法建立的位置坐标与接收信号强度之间的非线性映射模型,对在线接收的信号强度数据进行特征分类判别,实现位置的初步估计;随着目标的运动,进一步结合粒子滤波方法,迭代地实现动态目标位置的精确预测;另外,将定位轨迹与实际轨迹进行对比,以验证该算法的稳定性。实验仿真结果表明:累积分布函数在80%的百分位处,提出算法的定位精度控制在1.19 m以内,明显优于基于支持向量机、随机森林等定位算法;同时较基于梯度提升决策树算法的定位精度提升了34.9%;所获得的定位轨迹与实际轨迹的趋势一致且趋于收敛。  相似文献   

16.
提出了一种消除抽象语法树文本中冗余的方法,借助Knuth-Morris-Pratt(KMP)算法,设计核心算法,对抽象语法树进行简化,并选出几个经典的代码片段进行实验,对算法的性能做了相应验证.实验结果表明,算法在消除冗余方面的简化率达到90%以上.  相似文献   

17.
为了提高宫颈细胞识别速度,以最少的特征数量获得最高的识别准确率,运用分类与回归树算法(Classification and Regression Trees,CART)进行特征的选择,并采用粒子群算法(Particle Swarm Optimization,PSO)对分类器支持向量机(Support Vector Machine,SVM)进行优化,形成了PSO-SVM分类算法对细胞进行分类.使用Herlev数据集对文中提出的算法进行验证.通过CART特征选择方法,成功地从20个特征中提取出9个更具代表性的特征,并且二分类和七分类的准确率均达到99%以上.并引入其他几种宫颈癌细胞的分类识别算法进行仿真比较,结果表明,本文算法在特征数目较少的情况下识别准确率依然具有明显优势,从而验证了该算法的有效性.所述方法有效降低了人工特征选择的难度,在减少了识别用时的情况下,依然保证了细胞的识别准确率与之前几乎无异,为宫颈癌疾病诊断提供了一套有效的方法框架.  相似文献   

18.
为了更好地解决路段行驶时间的短时预测问题,提出并改善了一种基于树的集成算法。针对小时间尺度下交通时变性强这一特性,构建更加鲁棒的梯度提升树(GBDT)以减少突变点的干扰。为了克服偏差 方差窘境,将随机树(RF)与GBDT进行融合,提出RF-GBDT的集成算法,并考虑各种历史旅行时间数据的相关变量以提高模型的可解释性。预测结果表明,与单独的RF或GBDT相比,RF-GBDT具有更好的预测准确度与算法稳定性。  相似文献   

19.
针对犯罪分布预测准确率低,历史犯罪数据缺失严重的问题,提出了基于历史犯罪数据,融合所研究地区的社会环境因素的转移概率矩阵自学习的犯罪分布预测算法——TWcS.将包括距离信息、面积信息、人口信息在内的社会环境因素作为权重值引入到梯度下降策略中,利用梯度下降实现TWcS算法的转移概率矩阵自学习.实验结果证明,TWcS算法的性能明显优于包括当前最优基线算法(TPML-WMA)在内的其他预测算法(如LR、AR、Lasso回归算法、贝叶斯算法、决策树算法等),TWcS算法的MAE值是其他算法MAE平均值的33%.  相似文献   

20.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号