首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
可解释性矩阵分解解决了概率矩阵分解缺乏可解释性的问题,然而概率矩阵分解假设评分数据是服从正态分布的,这与实际场景有一定的偏差.针对该问题,提出一种可解释性泛化矩阵分解推荐算法.首先采用一种新型的变换函数使原始评分近似服从正态分布,然后通过可解释性矩阵分解获得预测评分,最后利用对应的逆变换函数将预测评分映射回原始评分区间...  相似文献   

2.
为高效准确预测旅客选择空铁联运各中转城市的概率并揭示相关因素影响机制,基于互联网客票脱敏数据,应用随机森林算法、特征重要度和部分依赖图方法探究解释变量与中转城市备选集间的复杂作用关系.结果 表明,随机森林模型可有效处理不均衡分布样本,具有更高的预测精度,总体分类准确率可达88.54%,并具备描述自变量非线性作用的能力....  相似文献   

3.
被广泛使用的线性模型具有良好的解释性和外延性,但自适应性弱,有时拟合和预测效果欠佳;变系数模型则反之.为解决这一类矛盾,提出分段解决方法:先建立显著的线性模型,再基于线性模型残差建立其余相关影响因素的变系数模型,该方法在保持模型良好解释性和外延性的同时,提高了模型拟合和预测精度.基于哈尔滨市(包含九区三县两市)2000~2017年的住宅商品房相关数据,对哈尔滨市平均房价及其影响因素进行分析,建立基于线性残差的变系数模型,数据结果表明,这种方法在研究这类问题时优于单一的线性模型和变系数模型.  相似文献   

4.
近年来随着"IP"热潮兴起,网络文学市场发展迅速,逐渐成为文化娱乐行业投资热点.本文将机器学习方法引入到小说排行预测方面,通过网络爬虫获取网络小说信息并提取了影响排行的特征,提出了基于BP神经网络模型进行小说排行预测.针对训练数据的不均衡,本文采用ROC和AUC作为预测评价指标;实验结果表明,基于BP神经网络的网络小说排行预测的准确率较高,相比传统的文学定性分析方法,机器学习预测方法可解释性和应用性更高.  相似文献   

5.
随着城市地下空间发展,地下工程沉降问题应引起重视。传统沉降预测模型常存在模型预测精度 不高、模型可解释性差和难以模拟沉降规律的动态变化等局限性和不足,对此提出一种基于数字孪生自演化 的地下工程沉降预测方法。建立的地下工程孪生体为沉降预测模型的高精度建模提供了有效的支撑,开发 的“多项式回归+总体卡尔曼滤波”自演化算法每一步都具有可解释性,同时模型参数自主校正功能使预测 模型能够动态追踪沉降规律的改变。实验结果表明所提方法能够有效解决传统沉降预测模型的缺陷。  相似文献   

6.
基于地统计学和氨基酸理化性质对氨基酸序列进行特征提取,发展了一种改进的最小冗余最大相关特征选择方法,并引入了私有化预测结合支持向量机进行建模预测,得到了一种新的抗菌肽活性的预测方法。结果表明,地统计学关联特征能更好地表征氨基酸序列,特征选择对于高维回归数据的处理作用明显,同时能有效地增强模型的解释性,私有化预测能进一步提升模型的预测能力。所得新方法具有较好的预测能力及可解释性,在高维回归数据领域具有较为广泛的应用前景。  相似文献   

7.
应用事件树方法确定了汽车缺陷风险传递路径,将缺陷风险转化为失效风险进行等效研究. 根据汽车缺陷风险特点,建立了风险评估SPN模型,并以三维矩阵图描述汽车缺陷风险;针对汽车的不合理风险及汽车缺陷数据离散和波动的状态,提出了基于灰色理论的风险预测方法;以失效预测数据作为风险评估的风险概率预测基础,建立汽车缺陷的失效预测模型,采用残差辨识法检验模型精度. 研究结果表明:在掌握实际的汽车售后零部件故障数据情况下,模型对汽车缺陷风险概率预测具有较好的适用性.  相似文献   

8.
针对核管道腐蚀的环境复杂性和过程随机性问题以及极值分布模型选择不当所引起的拟合误差问题,采用广义极值分布模型预测核管道腐蚀深度的发展规律,并提出基于免疫遗传算法参数优化的核管道最大腐蚀深度预测及评估方法:对核管道取样管段上腐蚀深度进行统计分析,计算相应的累计概率;利用免疫遗传算法优化广义极值分布函数的统计参数,得到核管道最大腐蚀深度的概率分布函数;由小样本腐蚀深度预测整条管道的最大腐蚀深度ydi,并评估超过最大腐蚀深度ydi的概率.利用不同核管道腐蚀深度进行计算机预测仿真.研究结果表明:改进后的广义极值分布模型不会受限于样本极值数据的具体分布,具有较好的通用性,且模型参数寻优过程收敛速度快,拟合效果较理想.  相似文献   

9.
分析了城市用水量预测的重要性和一些基本方法,发现灰色预测方法比传统的基于概率统计的随机过程分析具有建模所需信息少、不必知道原始数据分布的先验特征等优点,故将其尝试性的应用于城市时用水量的预测.通过对灰色预测方法建模机理的研究建立了城市用水量预测GM(1,1)模型,并以北方某大型城市时用水量为原始数据进行了实际预测,模型精度检验的结果表明该模型的预测等级为高精度预测.  相似文献   

10.
Web流量预测一直是数据中心网络的热点问题,对于提高网络服务质量具有重要意义。由于Web流量具有非线性、自相关性和周期性等复杂特点,对其准确预测有很大的挑战性。为充分挖掘出Web流量的可预测信息,同时使预测模型具有充分的可解释性和可配置性,本文提出一种基于Prophet和深度自回归(DeepAR)的组合预测模型。其中,Prophet是基于时序分解的加性模型,对Web流量的趋势、季节性周期、节假日信息进行建模。同时,使用基于概率预测的DeepAR模型对Prophet残差隐含的自回归信息建模,捕获长短期依赖关系,以减低Prophet残差的方差,并充分捕获Web流量的自回归信息。在真实的Web流量数据集上进行验证实验,结果表明在RMSE和MAE两项评价指标上均优于对比模型,验证了该组合模型的有效性。  相似文献   

11.
针对传统模型对心肺复苏结果预测准确率较低、模型可解释性较差,提出了一种基于多模型加权递归消除法(MW-REF)的心肺复苏结果预测模型,并在Shapley加法解释(Shapley additive explanation, SHAP)框架下分析影响心肺复苏结果的关键因素。采用了随机森林、GBDT、XGBOOST作为基模型,将其特征重要性得分加权后使用递归消除法过滤特征并对3种及模型采用Voting进行模型融合,利用五折交叉验证下的准确率作为最终特征选择标准。最后对最终特征数据集下的融合模型进行可解释性分析。实验结果表明,与传统的递归特征消除算法对比,该模型提升了心肺复苏结果预测的准确率,模型预测结果具有可解释性,可为临床诊断提供辅助,提高诊断效率与心肺复苏成功率。  相似文献   

12.
随着大数据、人工智能以及高性能计算的快速发展, 数据驱动的新材料研发成为研究热点. 在对材料数据进行数据挖掘的过程中, 需要对特征集合进行预处理, 通过减少无关冗余特征, 不仅可以避免模型过拟合, 还能提高模型的可解释性. 基于此, 提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning, FSRL) 算法, 将封装式特征选择抽象成机器学习模型和"环境"互动的过程, 并根据利益最大化准则将对应特征加入特征子集中. 同时, 为了提高模型的预测精度, 还提出一种基于符号变换的特征构造方法来生成新的特征. 最后, 将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中. 实验结果表明, FSRL 算法的分类准确率最高提升了 2.8%, 而在回归任务中, 基于特征构造的 FSRL 算法使得预测精度最高提升了 22.9%.  相似文献   

13.
针对方案属性值为Vague值且考虑专家评分可信度的多属性群决策问题,提出了一种基于Vague集模糊熵和D-S证据理论的多属性群决策分析方法。该方法充分考虑各专家给出的Vague值评价信息中所蕴含的模糊性与不确定性,借助模糊熵来获取与专家自身意见相匹配的评分可信度序列,其完全由数据驱动,弥补了传统方法对可信度主观统一设定的不足。首先,基于各专家原始决策矩阵获得各属性下的Vague集模糊熵,以构建与专家集相对应的评分可信度矩阵;其次,对经可信度调整后的各专家决策矩阵使用证据合成进行信息集结,利用Vague集记分函数并经可信度调整得到属性权重;最后,将专家群体集结信息经属性权重加权修正后算出各方案最终的Vague评价值,进而使用记分函数获得各方案综合得分,筛选出最优方案。利用证据理论在不确定信息融合方面的优势和Vague集记分函数的信息转化功能,通过证据合成和记分函数集结专家群体的评价信息,所得出的决策结果更加客观、合理,并通过一个具体算例验证了所提方法的可行性和有效性。  相似文献   

14.
深度学习模型通过学习数据的深层特征能够有效提高电力负荷预测的准确率,但同时也带来了超参数较多、模型可解释性差等问题。针对这些问题,文中将深度森林模型引入短期电力负荷预测领域。在多粒度级联森林模型的基础上改进了多粒度窗口扫描方法,调整窗口大小与滑动步长,使模型能够在不同时间尺度下提取电力负荷数据的周期性特征。此外,改进深度森林输出层的计算方法,将输出结果由离散的类向量改进为连续的预测值,进而提高模型的精确度。最后在中国东北电网的实测数据中验证了文中所提出方法的可行性与有效性。从实验结果可知,改进深度森林算法在较高预测精度的情况下能取得更高的准确率,并且相较于深度神经网络具有更快的学习速度。  相似文献   

15.
区域滑坡易发性评价是国内外地质灾害研究的重点和热点。目前,国内外学者已提出了支持向量机(support vector machine,SVM)、BP神经网络和随机森林等多种模型并成功用于滑坡易发性评价。但在利用这些机器学习模型评价滑坡易发性时,存在着参数选取困难、建模效率低、模型训练时间长和对评价指标解释能力弱等问题。为简化建模过程、提高预测精度及增强模型的可解释性,提出了基于频率比分析和偏最小二乘回归法(partial least squares regression,PLSR)的滑坡易发性评价模型。PLSR模型很好地发挥了主成分分析和回归分析的优势,考虑了评价指标间的内在联系,具有建模过程简洁、可解释性强的优点。将结合频率比法的PLSR模型应用于江西省龙南县滑坡易发性评价,并与BP神经网络、SVM模型的易发性评价结果进行对比。研究表明:PLSR模型的预测精度优于BP神经网络,且与SVM模型预测精度接近;另外,在综合考虑建模效率、预测精度和模型解释能力的情况下,PLSR模型具有更高的实用性。  相似文献   

16.
结合P2P网贷平台的特点,融合Logistic回归和Tabnet模型,提出一种P2P网贷违约预测方法。采集人人贷平台借贷数据,并对数据进行清洗与加工预处理;通过信息价值法和相关性分析,对众多解释变量进行筛选,以借款状态作为因变量,采用Tabnet神经网络进行训练,根据训练得到的特征重要性选择关键的解释变量;将Tabnet神经网络预测结果作为新的训练数据集,构建Logistic回归模型;将人人贷数据集输入Logistic回归学习与训练,以训练好的Logistic回归用于网贷违约预测。实验结果表明,Tabnet模型的网贷违约平均预测准确率和精确率分别为9958%、9547%,Logistic回归的平均准确率和精确率分别为9872%、9221%,而融合模型的平均准确率和精确率分别为9960%、9672%;在3个测试集上的准确率标准差分别为0001 4、0000 6、0000 5,精确率标准差分别为0034 4、0013 3、0013 2。表明融合Logistic回归与Tabnet的网贷违约预测方法具有Logistic回归模型的可解释性与稳定性,可提高单一模型的预测精确度。  相似文献   

17.
为了更好地解决路段行驶时间的短时预测问题,提出并改善了一种基于树的集成算法。针对小时间尺度下交通时变性强这一特性,构建更加鲁棒的梯度提升树(GBDT)以减少突变点的干扰。为了克服偏差 方差窘境,将随机树(RF)与GBDT进行融合,提出RF-GBDT的集成算法,并考虑各种历史旅行时间数据的相关变量以提高模型的可解释性。预测结果表明,与单独的RF或GBDT相比,RF-GBDT具有更好的预测准确度与算法稳定性。  相似文献   

18.
司法判决预测任务指的是根据真实的案情描述文本来预测案件的判决结果,有助于司法专业人士高效的工作,在智能司法方面具有广阔的应用前景。在实践中,易混淆罪名和少样本罪名的判别问题是目前的两大难点,普通模型很容易在上述问题上出现误判。为使易混淆罪名得到更好的区分,结合BERT(Bidirectional Encoder Representations from Transformer)和双向门控循环单元(Bidirectional Gated Recurrent Unit, BiGRU)深度学习网络,提出BGAAT(BERT BiGRU Attribute Self-Attention)网络模型。该模型引入具有区分性的罪名属性标签,通过注意力机制分别抽取属性特征与上下文特征,使用注意力分布对可解释性进行描述。为使少样本罪名更好的被识别,引入罪名分类权重,使模型在少样本罪名分类取得了更高的F1值。最后在真实的司法判决数据集上进行了实验,证明了所提出模型在该任务上有良好表现。  相似文献   

19.
The data-driven conditional multinomial logit choice model with customer features performs well in the assortment personalization problem when the low-rank structure of the parameter matrix is considered. However, despite recent theoretical and algorithmic advances, parameter estimation in the choice model still poses a challenging task, especially when there are more predictors than observations. For this reason, we suggest a penalized likelihood approach based on a feature matrix to recover the sparse structure from populations and products toward the assortment. Our proposed method considers simultaneously low-rank and sparsity structures, which can further reduce model complexity and improve its estimation and prediction accuracy. A new algorithm, sparse factorial gradient descent (SFGD), was proposed to estimate the parameter matrix, which has high interpretability and efficient computing performance. As a first-order method, the SFGD works well in high-dimensional scenarios because of the absence of the Hessian matrix. Simulation studies show that the SFGD algorithm outperforms state-of-the-art methods in terms of estimation, sparsity recovery, and average regret. We also demonstrate the effectiveness of our proposed method using advertising behavior data analysis.  相似文献   

20.
研究和总结了基于web service的空间信息集成技术,提出了基于web service的NDVI计算模型服务架构,该方法町以实现空间计算模型的跨平台性和互操作性,大大提高空间计算模型的共享.利用该方法对NDVI进行web service的封装和网络发布,很好地解决了传统植被指数计算模型的共享和互操作问题,也为其他窄间计算模型的web service集成与应用提供了参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号