首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
构建了用于预测蛋白质序列中RNA-结合残基的分类模型.在模型的特征提取方面,除了与功能相关的结构特征和序列正交编码信息以外,还提出了一个新颖的特征PSSM-PP.该特征不仅包含蛋白质序列的进化保守特征,还包含与蛋白质和RNA结合有关的氨基酸理化特征.在设计模型时,考虑到样本数据量大的问题,选用了快速的随机森林算法.该预测模型总体预测准确率达到87.02%,特异性达到95.62%,敏感性达51.16%,Matthew相关系数为0.533 6.此外,还构建了RNA结合残基的预测平台.  相似文献   

2.
对居民低碳意识的形成机理进行研究,可以为交通管理者引导城市居民选择低碳出行方式提供重要依据.运用数据挖掘技术对低碳出行问卷数据进行分析;将计划行为理论框架下的15维问题视为表征居民低碳出行意愿的内在原因变量,应用K均值聚类算法对居民低碳出行意愿强度进行归类,并将所得结果作为被解释变量应用于随机森林模型中,探讨居民的社会属性特征、出行特征等对其低碳出行意愿的作用机理.结果表明:基于Silhouette指标检验及t-SNE降维,居民低碳出行意愿可划分为3类:强烈、中立、不强烈;基于重要性指标显示影响最为显著的4项因素分别是居民的职业、居住地、家庭构成、通勤时间.研究结果从多个角度为城市交通低碳化发展及管理提供政策建议.  相似文献   

3.
组合预测就是将随机变量或向量的点预测进行组合,这些预测是根据几个模型所给出的,一般的方法是求这些点预测的算法平均值。本文给出的是根据模型的预测精度确定权的贝叶斯动态线性模型的组合预测,它的预测精度比取算术平均值的预测精度高。  相似文献   

4.
针对短时交通流量预测的难题,在传统贝叶斯组合模型进行改善的基础上,提出一种改进型贝叶斯组合模型.该模型只根据各基本预测模型当前时刻之前几个交通流量的预测表现,通过提出的分配算法实时更新组合模型中各个基本预测模型的权重,从而改善了传统贝叶斯组合模型权重计算迭代步长过长的缺陷,提高了贝叶斯组合模型对各个基本预测模型预测精度的灵敏性.通过对实地的交通流量的预测发现,基于改进型贝叶斯组合模型的预测精度不仅优于单一的预测方法,而且也优于传统的贝叶斯组合模型,从而证明了改进型贝叶斯组合模型有效提高预测的可靠性和具有一定的实用性.  相似文献   

5.
为准确预测东部某油田机械钻速,在针对该油田某井机械钻速影响因素分析的基础上,根据现场经验对不同直径PDC钻头的机械钻速进行分级,运用随机森林算法、K近邻算法、支持向量机算法建立机械钻速分类预测模型,并运用遗传算法优化模型参数,得到了满足施工设计及现场作业需要的机械钻速分类预测方法。结果表明,运用遗传算法优化后的随机森林模型预测机械钻速分类准确率为82.1%,明显高于K近邻算法和支持向量机算法,该方法可指导该区块钻井施工参数优化,以提高钻井施工效益。  相似文献   

6.
运用营口市人均综合用水量的历史数据,分别采用多元线性回归模型和BP神经网络模型对该市人均综合用水量进行预测,最后建立贝叶斯超出表现模型对所得到的单项预测值进行组合,实证分析结果表明,该组合预测模型获得了更为精确的预测效果,可以作为城市人均综合用水量预测的有效工具.  相似文献   

7.
基于随机森林与时空聚类的共享单车站点需求量预测   总被引:1,自引:1,他引:0  
为方便准确地预测出城市共享单车站点的需求量,根据站点需求量的随机性和时变性,提出了一种基于随机森林和时空聚类的共享单车站点需求量预测模型;该模型研究了时间因子、气象因子以及关联站点对需求量的影响;应用分层聚类对站点进行了时空分析;结合对数优化后的随机森林作为预测器。面向湾区共享单车出行数据进行需求量预测。结果表明:该模型相比极限学习机、支持向量机与随机森林等经典机器学习算法在需求量预测方面有较好的预测结果,可为实际车辆调度提供参考依据。  相似文献   

8.
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。  相似文献   

9.
基于贝叶斯算法的森林成熟预测研究   总被引:1,自引:0,他引:1  
我国的森林资源调查和监测工作起步较早,具有丰富的森林资源监测基础数据资料,激增的数据背后隐藏着许多重要的信息,简单的查询和统计已经无法满足林业的需求,需要出现一种挖掘数据背后隐藏的知识手段.该文将数据挖掘的方法引入林业应用,从而为林业的经营决策提供一条新的思路.通过挖掘林龄与其它调查因子间的关系来建立贝叶斯算法预测模型,利用其它调查因子较准确、有效率地预测林龄;确定了与林龄相关性最高的因子:胸径、树高、公顷畜积和郁闭度,解决了传统测量林龄的困难,并可进一步确定森林是否成熟,为合理采伐提供依据.  相似文献   

10.
对于专利价值的不确定性和影响因素的复杂性,以及评估工作中缺乏可操作性强并且科学高效的评估方法等问题,对价值评估指标体系进行分析,并使用随机森林算法选择最有效的指标集,同时基于DBSCAN(density-based spatial clustering of applications with noise)聚类选择高精度且一致性低的决策树子森林改进传统随机森林算法,使用改进前后的两种随机森林模型在专利数据样本上进行实验并比较。结果表明,改进的随机森林模型提升了传统模型的精度,在专利价值评估中具有一定的作用,总体上比较有效地反映了专利的价值度。  相似文献   

11.
为有效防治大气污染,依据大气污染的各项指标值来预测城市空气质量级别并给出起主导作用的因素,提出基于随机森林的空气质量等级分类预测方法;随机森林模型直接给出影响空气质量指标的重要性评分以便于找出最重要的影响因素,比较不同的数据挖掘方法,结果显示:随机森林分类预测的准确率最高,因此该模型可广泛应用于空气质量预测中;测试集结果显示随机森林方法不易受噪声影响且泛化误差较低,重要性评分给出细颗粒物和可吸入颗粒影响为最重要的两个因素,并以保定市为例有针对性地给出提高空气质量的建议。  相似文献   

12.
由于用单一地震属性描述浊积岩储层厚度有很大不确定性,基于多种地震属性,将随机森林算法引入对浊积岩储层厚度的预测中。通过试验,优选出弧长、能量半时、均方根振幅、最大振幅、平均能量和道积分等六种地震属性,构建井旁道地震属性与浊积岩厚度之间的关系模型,对浊积岩储层厚度进行预测。研究结果表明,随机森林方法对异常值和噪声具有很好的容忍度,训练速度快,泛化误差小,不易出现过拟合现象,预测精度高于神经网络方法,有较好的推广价值。  相似文献   

13.
 边坡工程是露天煤矿中的重点工程,边坡的稳定性关系着煤矿的安全生产。边坡稳定性预测是边坡防治工作的前提,针对煤矿边坡工程稳定性预测的复杂性,为了快速、有效地判别煤矿边坡稳定性,利用随机森林算法建立煤矿边坡稳定性预测模型。通过选取与煤矿边坡工程密切相关的岩石重度、黏聚力、内摩擦角、边坡角、边坡高度、孔隙水压力6 个指标作为边坡稳定性的影响因素,即为随机森林预测模型的输入,边坡稳定性状态作为随机森林预测模型的输出,通过随机森林算法建立边坡稳定性影响因素与边坡稳定状态之间的非线性关系。利用煤矿实测30 组边坡稳定性数据作为随机森林预测模型的训练数据集,进行模型的学习训练;另用12 组边坡稳定性数据作为预测模型的测试数据,通过训练好的边坡稳定性预测模型进行测试;为了验证随机森林预测模型的准确率,同时与SVM 和BP 神经网络的测试数据进行比较。结果说明,选取煤矿边坡稳定性的6 个指标建立的随机森林预测模型,人工控制参数较少、结构简单、容易实现,且具有较高的准确度,边坡稳定状态预测结果与煤矿边坡工程实际状态相吻合,能有效预测边坡稳定性状态,指导煤矿边坡防治工作的开展。  相似文献   

14.
汽车尾气的主要成分是CO气体,是公路隧道通风设计的一项重要参数。准确、快速地预测隧道内CO气体浓度,能够为隧道通风控制提供有力参考,有助于CO气体浓度的及时控制,对保障隧道内人员的健康、安全和隧道绿色节能十分必要。采用公路隧道实地监测CO气体浓度数据,建立了以监测点位置、交通量、车速、风速为输入特征的公路隧道CO气体浓度预测随机森林模型。通过整理3 300 m长隧道CO气体浓度数据,对比了CO气体浓度实测数据与模型预测值,验证了模型的预测精度。结果表明,基于随机森林建立的CO气体浓度预测模型具有良好的预测精度,能够准确地预测隧道内CO气体浓度,测试集的均方根误差(root mean square error, RMSE)和决定系数R2分别为0.497 4和0.943 7;该预测模型性能显著优于线性回归模型和支持向量机模型;预测模型能够推广应用于其他隧道的CO气体浓度预测,对应的RMSE和R2分别为0.909 5和0.729 5,可以在已知测点位置、交通量、车速、风速的情况下预判隧道内CO气体浓度,为隧道通风控制或安全预警提供数据参考;特征重要...  相似文献   

15.
以某钢铁企业的热轧带钢生产实际数据作为分析对象,基于改进的随机森林算法分析工艺参数与产品质量间的隐含关系,进行影响产品质量关键工艺参数的特征提取,建立热轧带钢产品缺陷预测模型.实验结果表明,对非平衡数据集进行平衡处理可以提高样本预测精度;采用CART与C4.5相结合的方法比单一方法可以进一步提升预测精度;同时根据特征的高相关与低相关特性,将互信息作为评价指标应用于特征选择,可以提升随机森林算法的分类效果.在以上三种改进策略下,热轧带钢缺陷的识别率得到明显提高.  相似文献   

16.
针对客户信用数据款项维度多、数量大、复杂性等问题,提出了一种基于相似性度量的多视角决策融合个人信用评估方法。该方法创新点在于能够细致地考虑不同信用数据的几何形状,多角度划分数据,并进行相似性匹配,此外充分运用随机森林能够进行特征提取的自洽性使得模型的准确性与稳健性同步得到了提高。在UCI数据集上的实验结果表明: 3种距离测度在进行特征提取与异常值去除后,性能均得到了大幅提升,且识别率的波动区间相对于数据预处理前显著缩小,展现了优化后的模型具有更强的稳健性;融合3种测度的决策可以多角度地综合信用信息,使得识别性能较单一测度显著优化,且与其他经典组合方法 比较性能更佳;将随机森林与距离测度相组合应用于个人信用评估领域为个人信用评估方法的多样性增添了新的经验。  相似文献   

17.
针对井口压力控制作业中传统方法过度依赖专家经验和数学模型运算精度的问题,提出一种基于随机森林(Random Forest,RF)的多模型融合算法对压井方式进行分类判断。首先,将专家经验结构化、数据化,转化成可被机器学习模型使用的数据形式,同时,结合油气井的基础数据和工况参数,作为智能模型的重要参数来描述压井作业的特征空间;然后,将特征数据通过特征工程进行特征筛选、特征编码和特征选择等处理;最后,构建出基于随机森林的Stacking双层融合模型,实现压井方法的分类预测。通过实验验证,与单模型的机器学习算法相比,本方法具有更高的预测精度。  相似文献   

18.
企业破产数据中存在高维不平衡的特性,会导致模型预测性能降低且预测结果偏向于多数类.为了提高具有破产风险企业的预测准确率,将从特征、数据、模型3个方面综合考虑.首先提出一种Pearson相关系数特征提取规则进行特征选择,再使用已有的平衡化技术进行数据平衡化处理,最后提出了一种基于改变分类阈值的随机森林算法构建企业破产预测模型.在包含10173个公司数据集上的实验结果表明,本文的研究方法具有一定的优越性,对后续进行企业破产预测研究也具有较高的参考价值.  相似文献   

19.
 为预测煤矸石代黏土煅烧水泥的28 d 抗压强度性能,根据生产水泥的物检分析数据,将GM(1,N)预测技术和径向基函数(RBF)神经网络技术相结合,提出了基于GM-RBF 神经网络组合模型水泥强度预测的新方法。该组合模型首先利用试验产品的典型物检数据建立GM(1,N)网络,对数据进行预处理。然后将输入样本数据进行一次累加生成操作,并进行归一化,设置GMRBF神经网络组合模型预测精度和散步常数。经处理后的输入样本作为RBF 神经网络输入向量,相应的实测28 d 抗压强度作为模型的输出期望值开展训练,比较预测数据与实测数据,并进行调整,最终得到符合精度要求的GM-RBF 神经网络组合模型。该组合模型一方面避免GM(1,N)模型的理论误差,利用累加生成运算和样本数据的预处理,减少了由于训练样本随机性对建模精度产生的影响;另一方面由于具有自适应、自组织和速度快等特点,能快速预测水泥远期强度情况。仿真试验表明,该模型预测精度优于单个GM(1,N)模型或RBF 神经网络模型,具有较好的拟合性,适用于对水泥强度的预测,可以为煤矸石代黏土煅烧水泥的质量分析提供有效参考。  相似文献   

20.
泄水建筑物出口无法正对河道,地形条件难以满足传统底流消能的池长要求时,增加池深与池宽形成矩形消力井是一种可行的选择。基于水工模型试验数据,通过随机森林算法底板动水压强预测模型,研究入射水流动能变化条件下的矩形消力井体型。成果表明:(1)预测模型可以得到矩形消力井几何边界重要程度,从大到小依次为井深、井长、井宽;(2)进而给出了不同傅汝德数入射水流适宜井宽条件下,底板动水压强能够满足消能要求的井深、井长组合关系。(3)在分析入射水流动能(傅汝德数)所对应的多组消能水体容积基础上,得出了满足消能效果的最小消能水体容积和边界取值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号