期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

井浩杰彭江艳《厦门理工学院学报》2019,27(6)

为提高P2P网贷平台对借款人信用风险评估的准确性,利用主成分分析模型,用8个主成分反映18个指标,依据熵权法和方差百分比赋予权重,得到借款人是否违约还款的临界值,依据该值对借款人是否违约还款进行评估;再利用Logistic回归模型,得到影响借款人违约发生率的4个指标,其按影响程度从大到小的排序为借贷子等级、借贷目的、过去两年里超过30 d以上未及时还款的次数、贷款收入比。对11 383条交易数据的识别结果表明,在阈值为50%时,评估模型对正常还款的拟合率为99.6%,对违约还款的拟合率为71.3%,整体的拟合准确率为96.04%。相似文献

2.

基于Logistic回归和神经网络比较的咽喉反流疾病的精准预测

王纯杰马元嘉王迪张乐于丹《吉林师范大学学报(自然科学版)》2020,41(3)

数据来自吉林大学第二医院193位病人的反流症状指数评分量表(RSI)数据,应用Logistic回归模型与神经网络模型对咽喉反流疾病进行预测.首先对数据进行预处理和相关性检验,再将数据按7:3拆分成训练集和验证集,最后通过Logistic回归模型和神经网络模型两种方法对咽喉反流疾病进行预测.结果表明,Logistic回归模型的预测准确率为99.39%,神经网络早停止法训练出的模型预测准确率最高为98.61%.因此,Logistic回归模型对咽喉反流性疾病的预测更加准确,为咽喉反流疾病的高效识别奠定了基础. 相似文献

3.

基于Stacking特征增强多粒度联级Logistic的个人信用评估

侯天宝王爱银《河南师范大学学报(自然科学版)》2023,(3):111-122

主要针对广受关注的P2P网贷信用评估问题，利用机器学习方法提高申请人网贷违约预测准确率，研究出基于Stacking特征增强多粒度联级Logistic方法及其应用.所提分类器是一种混合模型，结合了Stacking集成学习和联级Logistic学习的思想.首先，通过网格搜索技术分别建立XGBoost, Catboost, LightGBM,AdaBoost以及Gradient Boosting模型，并筛选出适合的基评估器作为Stacking集成的初级学习器，logistic模型作为次级学习器，构建基于Stacking的多粒度扫描器，生成预测结果作为元特征，拼接成新特征数据.其次，通过新特征数据以及元特征在每级Logistic上的特征增强建立联级Logistic Regression模型，并且与现有的单一集成学习器和各基评估器在3个不同的P2P网贷信用评估数据集上进行对比.实验结果表明，通过AUC、准确率等指标对其进行评价，相比于各基评估器以及其他单一集成分类器，基于Stacking增强多粒度联级Logistic模型有较高的准确率，预测效果更优. 相似文献

4.

基于布谷鸟搜索的XGBoost算法优化及应用研究

李欣玲李莉莉周楷贺《青岛大学学报(自然科学版)》2023,(4):35-40

为提高XGBoost算法预测精度，采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量，构建CS-XGBoost模型训练数据集。实验结果表明，基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法；基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。相似文献

5.

基于因子分析与K-means聚类算法的P2P网贷平台风险评估模型

冯骥伍思雨王琛越《重庆师范大学学报(自然科学版)》2020,(5):96

【目的】将人工智能领域的技术应用于网贷平台风险识别，提出了一种用于P2P网贷平台的风险评估模型，为网贷平台的风险划分提供决策支持。【方法】通过因子分析提取因子指标，进而利用K-means聚类算法对基于因子指标变化后的网贷平台运营数据进行聚类簇的划分，最终通过聚类结果对P2P网贷平台的风险进行划分。【结果】在获取真实网贷数据之后，采用皮尔森相关系数对平台指标进行影响指标的划分，随后使用因子分析将影响指标转化为因子指标，并在因子指标的基础上采用K-means算法对数据进行聚类分析。【结论】实验结果表明，因子分析聚类方法所得到的分析结果更为符合网贷数据所对应公司产品的实际情况，所得结论符合金融领域的实际情况，其聚类结果对网贷平台的风险评估和风险预测具有指导性的意义。相似文献

6.

基于集成学习的P2P流量识别模型

赵丹王汝传徐鹤《南京邮电大学学报(自然科学版)》2011,31(4):101-105,111

将DTNB、OneR和BP神经网络算法集成用于P2P流量识别,构建了基于该集成学习算法的P2P流量识别模型。利用网络流量特征和机器学习中生成规则的集成分类算法将网络流量分为P2P流量和非P2P流量。所建立的P2P流量识别模型分为网络流量特征的获取、P2P流量特征选取以及建立流量分类模型三个步骤。采用十折交叉验证与测试集相结合的方法CTFCVWTS(combining T-fold cross validation with testing set)评估模型的合理性和提出方法的有效性。实验得出流量分类准确率平均为97.27%。结果表明,该模型具有较高的P2P流量识别准确率。相似文献

7.

面向微博用户的消费意图识别算法

贾云龙韩东红林海原王国仁夏利《北京大学学报(自然科学版)》2020,56(1):68-74

利用迁移学习的方法, 融合京东问答平台数据与少量已标注的微博数据构建训练集, 提出一种基于注意力机制的双向长短期记忆神经网络(Attentional-Bi-LSTM)模型, 用于识别用户的隐性消费意图。针对显性意图识别问题, 提出一种结合TF-IDF (term frequency-inverse document frequency)与句法分析中动宾关系(VOB)的消费意图对象提取算法。实验结果表明, 通过将迁移京东问答平台的数据与微博数据相融合, 可以有效地扩充训练集, 在此基础上训练的神经网络分类模型具有较高的准确率和召回率; 融合VOB和TF-IDF的显性消费意图对象提取方法的准确率达到78.8%。相似文献

8.

融合预训练的港口吞吐量LSTM预测模型

张聪许浩然詹炜黄岚《科学技术与工程》2023,23(32):13910-13916

港口吞吐量时序变化数据量较小且变化快,传统LSTM神经网络在此类数据上易出现过拟合,导致模型预测性能不佳。针对此问题,本文提出融合预训练与LSTM时序模型,通过预训练捕获任务领域的全局信息,再用LSTM模型精确描述各个港口的吞吐量变化规律,以提升模型对全部港口吞吐量预测的准确性。以天津港等15个中大型港口过去二十一年的月吞吐量为实验数据,以BP、ARIMA、传统LSTM等预测模型和目前流行的GNN-LSTM模型为比较基准进行仿真实验,结果显示本文所提出的融合预训练的LSTM模型能有效解决LSTM神经网络的过拟合问题,整体预测准确率高于所有基准模型。与传统LSTM模型相比,基于预训练的LSTM的MAE指标平均降低45.2%%,最多降低80.0%。相似文献

9.

融合深度学习与规则的民族工艺品领域命名实体识别

《云南师范大学学报(自然科学版)》2020,(2)

提出了一种融合深度学习与规则的民族工艺品领域实体识别方法.首先通过BERT预训练语言模型获得语义向量;然后将其输入到BiLSTM-CRF序列标注模型中训练并预测初步结果;最后根据领域特点提出相应的规则对错误预测结果校正.实验结果表明,在自建的民族工艺品数据集上获得的准确率、召回率和F1值分别为95.43%、90.88%和93.10%,可以有效地提取民族文本中命名实体信息. 相似文献

10.

我国P2P网贷平台金融犯罪:特征、成因及防治

《攀枝花学院学报》2017,(1):21-24

P2P网络借贷对于盘活民间资金资源具有重要的意义,是我国金融体系的重要补充。然而P2P网络借贷在我国发生了严重的"异化"现象,成为金融犯罪的高发地带。我国P2P网贷平台金融犯罪的类型主要包括非法集资及平台跑路,具有隐蔽性、危害范围广、投资者维权困难、存在三个辨识点的特征。监管漏洞是我国P2P网贷平台金融犯罪泛滥的重要成因,应从P2P网贷行业立法、明确P2P网贷行业监管部门并增强各个部门监管的协同性、构建P2P网贷企业运营大数据监管系统、严厉打击P2P网贷企业金融犯罪的行为四个方面来治理P2P网贷行业的金融犯罪问题,促进行业的健康发展。相似文献

11.

基于特征提取的网贷平台生存关键因素研究

于卓熙温馨李梦丽《吉林大学学报(信息科学版)》2019,37(4):426-436

针对P2P( Peer to Peer) 网贷平台出现“生命较短”的现象,分析了影响P2P 平台生存的关键因素,收集相关变量数据,应用装袋法、随机森林等数据挖掘技术对P2P 平台数据集进行分类,提取影响分类结果的重要变量; 应用生存分析中的Cox 比例风险模型和加速死亡模型进行实证研究,深度挖掘影响P2P 网贷平台“生存”或“死亡”的关键因素。结果表明,最重要的影响因素是用户资金是否进行银行存管。该结果可为投资者和监管者提供参考,为加快建立P2P 网贷平台资金的管理约束制度提供依据。相似文献

12.

一种基于SMOTE的不均衡样本KNN分类方法

下载免费PDF全文

林泳昌朱晓姝《广西科学》2020,27(3):276-283

针对在数据样本不均衡时,K近邻(K-nearest Neighbor,KNN)方法的预测结果会偏向样本数占优类的问题,本文提出了一种基于合成少数类过采样方法(SMOTE)的KNN不均衡样本分类优化方法(KSID)。该方法过程为:首先使用SMOTE方法将不均衡的训练集均衡化,并训练逻辑回归模型;然后使用逻辑回归模型对训练集进行预测,获取预测为正样本的数据,通过使用SMOTE方法均衡化该正样本,并训练KNN模型;最后把测试集放入该结合逻辑回归方法的KNN模型进行预测,得到最终的预测结果。围绕6个不均衡数据集,将KSID与逻辑回归、KNN和支持向量机(SVM)决策树等方法进行对比实验,结果表明,KSID方法在准确率、查全率、查准率、F1值这4个性能指标上均优于其他3种方法。通过引入SMOTE,KSID方法克服了KNN模型遇到样本不均衡数据集时,产生分类偏向的问题,为进一步研究KNN方法的优化和应用提供参考。相似文献

13.

基于支持向量机的助学贷款信用风险预警研究

李运蒙桂绕根石安安《五邑大学学报(自然科学版)》2014,(1):50-53

针对助学贷款额度小、管理过程繁琐、违约率高的问题,提出了用基于支持向量机的助学贷款信用风险预警系统来有效降低关注范围、提高贷后管理效率的方法.在分析助学贷款违约影响因素和相关预警模型特点的基础上,建立了支持向量机预警模型;通过实际数据测试,模型在违约和守约分类预测方面有较高的准确率,为银行调整贷后管理策略提供了依据. 相似文献

14.

基于Logistic算法的考研成绩变量预测方法

李楠郝文佳《吉林大学学报(信息科学版)》2021,39(1):114-120

针对传统考研成绩变量预测方法的变量关联性低,导致预测结果存在较大误差的问题,提出基于Logistic算法的考研成绩变量预测方法.收集并处理历年考研成绩数据和学生成绩数据,作为成绩变量预测的初始数据.设置考研成绩的预测变量,建立Logistic回归分类算法模型,通过该模型的运算提高考研成绩变量之间的关联性.综合历年考研成绩数据的发展规律以及变量的影响因素分析结果,得出考研成绩变量的预测结果.通过对比实验分析得出结论:基于Logistic算法的考研成绩变量预测方法的预测误差率较低,预测准确性较高. 相似文献

15.

P2P网贷平台风险监管研究

钟诚《科技促进发展》2017,13(5):381-387

随着近年来全球范围内与互联网有关的借贷业务和模式的迅速发展,互联网金融市场也随之不断扩张。为解决网络交易平台因金融和互联网创新产生的一系列潜在的风险问题和技术问题,本文通过P2P网贷平台运行体系运行的全过程分析,研究其运行体系中不同主体、不同环节中产生的风险机制,并分析风险产生的制度基础。在此基础上,进一步分析发达国家特定信贷平台的风险生成机制以及监管制度,并与我国的现实情况进行对比和分析。最后,在P2P网贷平台风险生成有关机制、原理和理论研究的基础之上,针对我国有关P2P网络信贷监管中存在的一系列相关问题,为我国监管制度和监管政策提供相关意见建议。相似文献

16.

基于主成分分析线性回归的光伏发电功率预测研究

杨婷陈黎来李世纪吕高宇吴巧鑫曾艾东《南京工程学院学报(自然科学版)》2022,(1):77-83

针对经典光伏发电功率物理模型预测精度不高、可能遗漏关键气象因子的问题,基于数据驱动思想提出一种主成分分析、逐步线性回归以及多种检验相结合的光伏发电功率预测模型混合建模方法.采用相关性分析提取关键气象因子自变量,通过逐步线性回归对历史样本数据进行训练得到初始模型;对初始模型进行拟合程度、有效性以及多重共线性等多种检验,根据检验结果,采用主成分分析对初始模型自变量进行降维重构,得到修正模型;通过残差分析实现修正模型正确性的自校验;基于多种时间尺度对经典模型、未修正模型以及修正模型的预测结果进行详细对比分析.仿真结果表明修正模型提高了预测精度及所提混合建模方法的有效性与优越性. 相似文献

17.

基于多模型融合的互联网信贷个人信用评估方法

白鹏飞安琪 Nicolaas Frans de Rooij 李楠周国富《华南师范大学学报(自然科学版)》2017,49(6):119-123

针对网络个人信用有效评分缺失的问题,分析了互联网信贷个人信用评估数据的特点,选用支持向量机、随机森林和XGBoost分别建立了信用预测模型,并对3种单一模型进行了投票加权融合. 基于互联网信贷数据的特点,在特征工程中对样本集特征进行了离散化、归一化和特征组合等处理. 为增加对比,对实验数据集进行了FICO评估核心Logistic回归分析. 实验结果表明:3种单一算法性能均优于Logistic回归,XGBoost表现优于支持向量机和随机森林模型,预测相对准确;投票融合模型的表现比单一模型更好,模型分辨能力更优秀,预测精度更高,更适用于互联网信贷个人信用评估. 相似文献

18.

基于PCA-OS-ELM的大气PM_2.5浓度预测

李济瀚李晓理王康崔桂梅《北京理工大学学报》2021,41(12):1262-1268

为了提高细颗粒物PM_2.5浓度预测精度,提出一种主元成分分析与在线序列极限学习机相结合（PCA-OS-ELM）的PM_2.5浓度预测方法. 首先,通过主成分分析方法（PCA）提取高维大气数据中影响空气质量的关键变量,并去除不必要的冗余变量;其次,利用提取的关键变量建立在线序列极限学习机（OS-ELM）网络预测模型,将批处理和逐次迭代相结合,不断更新训练数据和网络参数实现大气PM_2.5浓度快速预测.研究结果表明,PCA-OS-ELM预测方法采用不同批次训练数据更新模型的方式,能够快速实现大气PM_2.5浓度预测,证明了该方法的有效性.与其他方法相比,该方法预测误差小,预测精度高,具有更好的实用价值. 相似文献

19.

基于随机森林优化的自组织神经网络算法

李永丽王浩金喜子《吉林大学学报(理学版)》2021,59(2):351-358

针对基于降维的神经网络分类器预测模型在分析过程中存在特征丢失, 并导致精度下降的问题，提出一种基于随机森林算法优化的多层感知器(MLP)回归预测模型. 该优化模型通过在MLP回归模型网络的全连接层和逻辑回归层之间增加一个优化机制, 利用随机森林算法对隐藏层状态的优化实现改进, 从而解决了降维过程中神经网络丢失数据特征的问题. 在借贷客户信息数据集上的实验结果表明, 该模型在保证主要特征的同时大幅度提升了预测准确率, 证实该模型在特征工程中具有较高的实用性. 相似文献

20.

基于无迹卡尔曼滤波的LSSVR在线多步时间序列预测

刘小雍方华京熊中刚许宁《信阳师范学院学报(自然科学版)》2019,(2):320-326

准确宽范围多步预测在时间序列预测应用中带来了巨大挑战.提出了一种基于最小二乘支持向量回归(LSSVR)和无迹卡尔曼滤波(UKF)的在线多步预测方法,利用时间滑动窗口减小算法的计算负荷,UKF方法实现LSSVR模型参数更新以提高预测精度.当预测范围达到预定步长p时,由核宽度σ、支持值参数{α_k}_k~L_(=1)以及偏移项b所构成的模型参数通过新的测量值和UKF进行在线更新.提出的方法不仅以较少的训练数据建立在线预测模型(所需训练数据集大小为相空间维数与滑动窗口长度之和),且多步预测值的精度相比于传统方法得到进一步提高.最后,通过几个实验研究论证了提出方法的有效性和优越性. 相似文献