排序方式: 共有14条查询结果,搜索用时 15 毫秒
11.
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效. 相似文献
12.
复合氨基酸螯合铜的制备工艺研究 总被引:7,自引:0,他引:7
以动物蛋白粉为复合氨基酸来源,对复合氨基酸螯合铜的合成工艺条件地初步的探讨,研究了反应液pH值、反应温度、反应时间对螯合反应的影响。确定了合适的反应条件为:反应液pH=11.0,反应温度为常温,反应时间为30min,并用红外光谱法鉴定了产品。 相似文献
13.
针对信息增益和信息增益率对属性取值数的偏好,提出了一种调和平均优化选择划分属性的决策树改进算法.首先计算候选划分属性的信息增益,找出信息增益高于平均水平的属性,然后分别计算这些属性的信息增益率和信息增益的调和平均值,从中筛选调和平均值最大的属性,建立分支决策,并用递归方法建立决策树.通过4份不同规模数据实验,利用信息增益、信息增益率、GINI指数以及该文提出的方法作为属性划分的标准,分别考察其准确性在训练集、测试集、10次10折交叉验证(或5次5折交叉验证),以及其平均值.实验结果表明:该方法准确性较好、运行时间较短,具有一定程度的优越性. 相似文献
14.
偏最小二乘法(partial least square, PLS)在内部采用Pearson系数度量自变量和因变量之间的相关性时提取出的成分不能确保解释性最强,并且PLS在将提取的成分进行线性回归时也无法真实反映变量间的函数关系.针对这些问题,该文提出了融入距离方差和距离相关系数的偏最小二乘回归方法(DVDCCPLS).DVDCCPLS基于距离方差和距离相关系数提取距离成分,再将距离成分进行拟线性回归得到距离回归方程,通过模型求解方法将距离回归方程转换为原始数据的表达,最终得到结构简洁、精度较高的回归模型.该文分别采用麻杏石甘汤数据和UCI数据集测试DVDCCPLS的性能,并与其他5种经典的回归算法对比,结果表明:DVDCCPLS具有较好的回归效果和回归性能. 相似文献