首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 437 毫秒
1.
针对网络个人信用有效评分缺失的问题,分析了互联网信贷个人信用评估数据的特点,选用支持向量机、随机森林和XGBoost分别建立了信用预测模型,并对3种单一模型进行了投票加权融合. 基于互联网信贷数据的特点,在特征工程中对样本集特征进行了离散化、归一化和特征组合等处理. 为增加对比,对实验数据集进行了FICO评估核心Logistic回归分析. 实验结果表明:3种单一算法性能均优于Logistic回归,XGBoost表现优于支持向量机和随机森林模型,预测相对准确;投票融合模型的表现比单一模型更好,模型分辨能力更优秀,预测精度更高,更适用于互联网信贷个人信用评估.  相似文献   

2.
针对支持向量机模型在分类问题中的广泛应用,提出了一种新的基于支持向量机的个人信用评估模型,通过对支持向量机直方图交叉核、热核特征核、杰卡德距离核和余弦广义距离核4种核函数的组合处理,构造了投票矩阵;通过实际数据实验,获得了良好的分类结果,同时证明了支持向量机自适应组合核加权模型在信用评分系统中具有良好的性能;因此,这种基于支持向量机的个人信用评估模型可以帮助银行或贷款人做出正确的决策。  相似文献   

3.
基于随机森林和转导推理的特征提取方法   总被引:1,自引:0,他引:1  
提出一种基于随机森林和转导推理的特征提取方法,步骤如下:1)利用带标签的训练样本建立随机森林模型;2)将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵;3)对该相似性矩阵进行多维尺度变换得到全体数据的低维数据表示,即低维特征,使得原高维数据在低维空间中具有更好的可分性.UCI数据库的实验结果表明:与主成分分析方法相比,该方法将无标签测试集的数据分布信息转移到相似性矩阵中,更好地刻画整个样本空间上的数据分布特性,从而提高分类器的性能,是一种行之有效的特征提取方法.最后还讨论了特征提取维数对模型准确率的影响,为实际应用提供参考.  相似文献   

4.
提出了一种将距离和方向因素集成在一起的相似性测度方法。这种集成方法将传统的基于距离的相似性测度法和基于方向的相似性测度法的优点融为一体,使其能够弥补单独采用某一种传统方法可能造成的缺陷。分析比较了新的集成方法与传统的方法的特点和同位相似曲线,以及各种参数、变量对集成相似性测度的影响。最后给出了该领域未来的研究课题。  相似文献   

5.
针对电信行业客户流失预测问题的复杂性,本文将能够处理大规模数据、容噪性能较好的组合分类器算法——随机森林方法应用于电信行业的客户流失预测中.针对影响组合分类器性能的关键指标——差异度,提出了一种新的基于随机森林相似度矩阵的差异度测度,并在此基础上提出了一种改进的组合剪枝技术,对随机森林的基分类器进行剪枝,得到规模较小但泛化性能更优的基于剪枝随机森林的客户流失预测模型.实验结果表明,与其他方法相比,新的差异度测度方法更好地描述单个分类器之间的差异度,本文提出的基于剪枝随机森林的客户流失预测模型具有更高的预测准确率、更小的组合分类器规模和更好的效率,有望成为该领域一种可行且有效的方案.  相似文献   

6.
季少石 《甘肃科技》2011,27(9):18-19,116
针对模式识别中采用的相似性测度方法进行了研究,分析了两种相似性测度的优缺点。得出了基于最佳逼近距离的相似性测度优越性,比传统相似性测度具有更高的准确率,特别适合用于临界区域内样本的聚类决策。  相似文献   

7.
对于高光谱向量非线性空间,提出了基于Hausdorff距离的地物光谱相似性测度模型,并对模型的适用性进行讨论.此外通过对试验区域由高分辨率光谱仪实地测得的地物光谱数据进行实验分析,得到各种相似性测度模型的匹配聚类结果,并对其有效性和精度进行评估.  相似文献   

8.
滚珠丝杠副的正常运行对于保持数控机床稳定性和加工性能具有重要意义。因此,滚珠丝杠副的性能衰退过程评估在健康管理工作中显得尤为必要。考虑到滚珠丝杠副运动的往复性,振动信号的非平稳性和非线性,常规特征提取方法难以直接提取其准确特征。研究了利用数据分段,模糊熵、典型时域特征流形距离进行滚珠丝杠副健康评估的方法。首先,针对原始振动信号进行数据分段处理,区分出滚珠丝杠副滑块正反向运行数据。其次,对分段后同一方向数据提取原始信号的模糊熵和典型时域特征进行多特征融合,构建特征空间。然后,将提取特征归一化计算正常数据与样本数据的流形距离。最后,将流形距离转换成置信值,从而得到滚珠丝杠副的健康程度。试验结果表明,所采用评估方法能够有效评估滚珠丝杠副的性能,为其视情维修提供依据。  相似文献   

9.
距离测度主要用于度量不同数据之间的距离,结合三角函数的距离测度也被成功地应 用于犹豫模糊集上。本文提出了基于正弦、余弦和正切函数的犹豫模糊距离测度以及含偏好的距 离测度并验证了其优良性质;最后,提出了2种犹豫模糊多属性决策方法,并通过能源政策选择的 案例验证了所提方法的有效性和实用性。  相似文献   

10.
一种基于流形距离的迭代优化聚类算法   总被引:4,自引:1,他引:3  
针对传统欧氏距离测度描述复杂结构的数据分布会失效的问题,引入能有效反映样本集固有的全局一致性信息的流形距离作为样本间相似度度量测度,并设计了反映类内相似度大、类间相似度小的聚类目标的准则函数,把数据聚类转化成准则函数优化问题,提出了一种迭代优化的聚类算法.通过4个人工数据集的仿真试验结果表明,新方法的参数很少且实现简单,由于实现过程中没有引入随机操作,因此结果比较确定.与标准k均值算法相比,新方法能够自动确定聚类数目,对于样本空间分布复杂的聚类问题具有良好的分类效果.  相似文献   

11.
利用时空兴趣点间的位置及局部特征相似度信息,提出一种局部邻域特征以描述局部数据结构,然后引入核主角度及Grassmann流形距离以度量2个邻域特征距离,通过构造随机流形森林学习数据样本在Grassman流形上的类条件概率密度函数,最后使用多核学习算法实现对随机流形树的剪辑及动作分类.在KTH及UCF-CIL动作数据库的实验证明:所提动作表示方法能有效描述人体运动信息,且该动作识别算法的识别率优于近年提出的典型动作识别系统.  相似文献   

12.
]在SIFT局部特征的基础上,扩大了SIFT局部特征描述子,构造了半全局信息的背景环,并将背景环的互信息引入到相似性计算.实验结果表明,该方法与SIFT影像匹配算法相比,有效地提高了匹配的正确率,且对旋转图像的特等匹配具有一定鲁棒性;与全局配准算法相比较,提高了一倍以上的计算效率  相似文献   

13.
针对不同故障特征属性交互重叠导致的故障类别辨识困难问题,提出一种基于Manhattan距离作为特征之间相似度信息测度的权值判别拉普拉斯分值特征选择方法.该方法采用Manhattan距离衡量高维特征矢量之间的相似度,并将数据样本标记信息融入权值计算中以增强权值的判别性,提升了LS算法的敏感特征筛选性能.将M-WDLS和主成分分析相结合,提出基于M-WDLS和PCA的转子故障诊断方法.首先提取原始振动信号的时域、频域、时频域特征构造混合域特征集;然后利用M-WDLS选择敏感特征组成敏感特征矩阵;最后对敏感特征矩阵进行PCA降维处理,并将结果输入到K-近邻分类器中进行模式识别.对比实验的结果表明,该方法能有效提取转子系统振动信号的状态特征,有助于提高故障辨识的准确率.  相似文献   

14.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO  相似文献   

15.
乔瀚  容芷君  许莹  但斌斌  赵慧 《科学技术与工程》2021,21(36):15497-15502
考虑样本数据集的差异性和相关性对疾病预测结果有着直接影响,提出一种基于多特征属性患者相似的糖尿病早期预测方法,根据患者之间特征具有相似性这一特点,对患者特征进行混合属性相似预分组,再把分组结果导入随机森林分类器进行疾病预测。首先以临床概念作为患者的特征项,通过聚类定量化分析不同特征属性类型间的距离来度量患者之间的混合相似度,根据患者混合相似度将患者集预分组为多个患者相似组。最后以随机森林分类器对相似组进行细分类,得到最终的疾病预测结果,该结果与基于全样本数据的随机森林分类结果相比,分类准确率提高了8.3%;与基于单一属性相似组的随机森林分类结果相比,分类准确率提高了5.1%。结果表明该方法具有较高的预测准确率,可为糖尿病诊断预测提供支持。  相似文献   

16.
基于Hausdroff距离的扩展模糊数相似性测度   总被引:1,自引:0,他引:1  
提出了一种新的度量扩展模糊数相似性的新方法.在分析了现有几种相似性测度原理的基础上,指出了它们的不足之处,通过将每个扩展模糊数当作图像样本,并引入了模式识别领域中Hausdroff距离,构造了新的相似性测度公式.多组数值算例表明,该方法可以有效地度量扩展模糊数之间的相似性.  相似文献   

17.
一种新的多特征融合图像检索方法   总被引:1,自引:1,他引:0  
为解决图像检索中单一特征检索性能不佳、多特征融合耗时的问题,提出了一种新的融合颜色特征和形状特征的图像检索方法。检索过程分为两个阶段:首先对图像进行圆环分块,提取图像整体和各圆环子块颜色特征向量,以特征向量间距离大小为准则对图像库分类;然后在类内提取图像的ART形状描述符作为形状特征进行相似性度量以实现检索。形状特征提取只在某一类内进行,减小了运算量,同时弥补了颜色特征对图像空间信息丢失的不足,提高了检索准确率。仿真实验取得了较好的检索效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号