共查询到20条相似文献,搜索用时 0 毫秒
1.
焦炭是高炉炼铁的重要原料,其质量是影响铁水质量和高炉顺行的重要因素,针对焦炭质量存在检验难、滞后性、预测误差大等问题,提出一种基于梯度提升决策树算法的焦炭预测模型;结合专家经验与相关性分析方法,深入研究配合煤质量对焦炭质量的影响;最后利用配合煤质量指标对焦炭质量指标灰分、硫分、耐磨强度、抗碎强度进行建模预测;根据某焦化厂历史生产数据对模型进行评估,实验结果表明:基于梯度提升决策树的焦炭质量预测模型相较于线性回归模型、随机森林模型,决策树模型误差小、准确率高,可以为焦化厂配煤炼焦提供一定的理论依据。 相似文献
2.
设计了基于决策树和GA-BPNN(遗传算法-BP神经网络)组合预测模型,通过决策树分类贡献优先特征选择方法解决了BP神经网络的输入参数难选取的问题;利用改进遗传算法的全局择优能力,解决了BP神经网络由于随机选取初始权值导致易陷入局部极小值的缺陷。实验证明,组合预测模型能自学习专家经验,准确地对职业能力进行智能预测。 相似文献
3.
《长安大学学报(自然科学版)》2014,(5)
根据中国现行交通事故严重程度分类与事故信息数据分布特征,基于C5.0决策树方法,选取某省会城市城区及周边重点公路16 009起交通事故现场数据,分别将事故严重程度输出变量按照2分类和3分类,输入变量按照空间属性、涉事驾驶人及车辆属性和全属性,建立事故严重程度预测模型,生成相应规则集并利用测试样本进行检验和模型对比。研究结果表明:2分类和3分类事故严重程度预测模型精度分别为70%和61%,多模型综合优度有所提升;实证规则集揭示了影响事故严重程度分类的因素主要有,碰撞类型、道路属性、事故致因和驾驶人类型等。 相似文献
4.
5.
6.
决策树是数据挖掘中的一种重要分类方法。在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法。该算法具有较大的灵活性,能从测试属性空间逐次删除已使用过的属性。避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率。最后,实例验证了算法的可行性与有效性。 相似文献
7.
8.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。 相似文献
9.
张小奇 《青岛大学学报(自然科学版)》2019,(2)
随着高校招生规模的不断扩大,高校教学管理工作越来越繁重,积累的相关数据也越来越多,如何有效的利用这些数据,分析影响学生培养的因素,完善学生培养方式,是高校发展的关键。结合高校的教学数据,采用数据挖掘技术,将当前的教学管理数据转化成可供使用的信息,通过对数据的分析,挖掘影响学生成绩的内在因素,为高校学生培养方式的完善提供理论指导,为教学改革提供决策依据。研究结果表明,要提高高校教育教学水平,在课程安排上要结合培养专业的需求情况进行分析指导,对考试题目进行优化,改进教学方法、教学评价,依据学生成绩数据分析,指导学生培养中的理论和实践课安排,确定合适、合理的学生培养方案。 相似文献
10.
基于决策树的排序学习算法 总被引:1,自引:0,他引:1
基于一个修改了的决策树的分裂规则,得到了具有直观解释的排序算法,并给出了相关理论证明.实验结果表明,该算法优于感知机类和序回归类算法. 相似文献
11.
12.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。 相似文献
13.
为了快速进行空间数据的分类,引入决策树方法,提出空间决策树思想.将空间数据中的空间属性作为测试属性,计算相关信息熵,从而构建所需要的决策树.以奥运会临时超市网点设计为例,用空间决策树法构建不同商区的人流树状图,得到了较清晰的人流趋向树状图. 相似文献
14.
针对决策树(DT)模型缺乏概率背景这一问题,将贝叶斯推理引入DT模型,提出了一种基于贝叶斯推理的决策树(BDT)模型.在假定所含待定参量的先验与似然的前提下,借助贝叶斯推理获得参量的后验,然后运用逆跳马尔科夫链蒙特卡洛算法对后验抽样,最终求出样本属于某一类别的置信度,从而避免了武断判决.BDT模型以抽样代替拆分与剪枝操作,既直观又灵活,同时在抽样时考虑了不同的树结构与递归分割方案,使得分类准确率得以提高.仿真实验结果表明,BDT模型的平均分类准确率与DT模型相比提高了1.7%~3.5%. 相似文献
15.
针对传统流量分类方法(基于端口和有效载荷)分类不可靠的问题,提出基于C4.5决策树算法,根据训练集中属性的信息增益比率构建分类模型,按属性对测试数据集进行预测,通过查找分类模型实现对网络流量的分类。在公开数据集和自己采集的数据集上进行实验,结果表明,采用C4.5决策树算法对网络流量分类,平均分类精度为93%,单类别分类精度均在90%以上,能有效地实现对网络流量应用类型的识别。 相似文献
16.
基于决策树的关键短语抽取 总被引:1,自引:0,他引:1
针对关键短语抽取工作可以转化为某种分类问题,利用决策树构造分类器解决关键短语的抽取。统计分析表明,将文档中词的词频因子、首位置和词性作为决策树分类特征,并考虑词在文档中出现的位置信息,对词的特征值进行一定的调整,采用Bagging重采样技术进一步提高了决策树的抽取性能,使其完全匹配和部分匹配的F_检测率分别达到21.50%和54.49%。 相似文献
17.
基于Rough集的决策树算法 总被引:1,自引:0,他引:1
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。 相似文献
18.
ID3算法是决策树学习归纳和数据挖掘中的核心方法。针对ID3算法存在的多值偏向问题,该文提出了一种新的方法对ID3算法加以改进。首先建立属性的关联矩阵,然后通过计算属性的类方差选择分裂属性,结合实例说明了改进算法的基本思想。实验结果表明,改进后的算法能够构造更合理的决策树并能在一定程度上克服多值偏向。 相似文献
19.
利用移动机器人的传感器提取的特征参数,通过属性约简方法构造的决策树形成的分类规则实现室内环境的识别.该方法在环境参数发生变化时,会导致机器人环境识别错误的问题.为此提出了一种利用多个约简构成的分类规则并通过取极值的方法,可避免环境识别错误的问题. 相似文献
20.
本文针对传统的基于简单模式匹配的入侵检测技术性能低,误报率和漏报率高的问题,提出了基于决策树算法的连接记录的分析方法,描述了该算法的定义和实现,并采用KDD99的数据进行了仿真实验。实验结果表明,基于决策树算法的分析方法能有效的提高入侵检测系统的性能。 相似文献