首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
基于SMOTEBoost的非均衡数据集SVM分类器   总被引:1,自引:0,他引:1  
在对实际问题进行数据挖掘时面临的多数是非均衡数据集,即各种类型的数据分布并不均匀,且关注的类型常是少数类.运用含有少量少数类型事例的数据集训练后的模型进行预测时,通常对多数类的预测精度很高,而少数类的预测精确性却很差.提出了一种集成方法SMOTEBoostSVM,通过SMOTE技术人工生成增加少数类样本量,以具有较强分类性能和泛化性能的SVM作为弱分类器,并以AdaBoost算法构建集成分类器.实验结果表明,SMOTEBoostSVM集成分类器比单纯运用SMOTE技术、AdaBoost算法以及SVM等的分类器,在非均衡数据集的分类预测中具有更好的效果.  相似文献   

2.
信息技术的快速发展导致了数据规模的爆炸式增长,传统的机器学习、数据挖掘算法面临新的 挑战. 流形学习克服了传统线性降维算法的不足,成为十年来降维研究的热点领域. 然而流形学习 算法复杂度高,对于大规模的数据集并不适用. 针对大规模数据集下的流形学习降维问题,提出了 基于MapReduce 的分布式流形学习算法. 该算法采用局部敏感哈希函数将相似点映射到同一个桶中,利用流形具有局部欧氏同胚的性质,在每个桶内采用欧氏距离度量点之间的测地距离,桶之间采用 中心点及边缘点来计算修正的测地距离. 在大规模的人工合成数据集和真实数据集上的实验表明,该算法能有效地估计数据点间的测地距离,适用于处理大规模数据集的降维问题.  相似文献   

3.
针对疑似区域内的乳腺微钙化簇和正常乳腺组织特征的多源性这个一直被忽略的问题,提出基于分组特征多核支持向量机(GF-SVM)的乳腺微钙化簇检测。特征被分组后针对不同源特征分别使用不同的核函数映射,组合成多核SVM。将多核SVM转化为半定规划问题,求解多核SVM的核函数权值系数。在训练样本的选择方面采用主动反馈学习方法最终得到稳定的样本模型。实验结果表明,与传统的基于单核SVM相比,该方法具有更好的检测性能。  相似文献   

4.
财务指标与违约距离相融合的上市公司财务预警模型   总被引:9,自引:0,他引:9  
谭久均 《系统工程》2005,23(9):111-117
违约距离是基于股票交易数据的信用风险度量指标,运用中国A股上市公司数据研究其在财务预警模型中的作用。研究结果表明,违约距离可提升财务预警模型的拟和优度和预测能力,但提升效果较为有限。  相似文献   

5.
基于最小二乘支持向量机的交通安全预测模型   总被引:2,自引:0,他引:2  
分析了最小二乘支持向量机(LS-SVM)在交通安全预测中的优势,确定输入向量集合和输出向量集合,利用LS-SVM建立交通安全预测模型.将1953~2006年全国交通安全相关数据分为训练集和测试集,利用Matlab 7.0进行仿真测试.通过训练LS-SVM得到模型具体参数值,然后对测试集数据进行预测,计算预测误差,并与神经网络模型、SVM模型预测结果进行对比.仿真结果表明,基于LS-SVM建立的交通安全预测模型比神经网络预测模型、SVM模型具有更高的运算速度和预测精确度.  相似文献   

6.
基于粗糙集融合支持向量机的水质预警模型   总被引:3,自引:1,他引:2  
为解决因水质预警耦合因素多,预警模式复杂以及信息不完整所引起的水质预警精度低问题,提出了粗糙集融合支持向量机(RS-SVM)的水质预警模型.首先采用粗糙集对14个初始预警指标进行属性约简,去除冗余或干扰特征,得到基于5个核心预警指标的数据集,以此数据集对支持向量机进行训练优化,构建RS-SVM水质预警模型.运用该模型对江苏宜兴市集约化河蟹养殖池塘水质进行预警,实证对比分析,对于不同的警度级别,预警精度都在91%以上,与标准支持向量机和BP神经网络模型相比,该模型不仅具有计算效率高、预警性能好,且预警结果与实际情况比较吻合,为集约化水产养殖水质预警提供了一种新思路.  相似文献   

7.
基于多元判别分析和神经网络技术的公司财务困境预警   总被引:19,自引:1,他引:19  
张玲  陈收  张昕 《系统工程》2005,23(11):49-56
应用我国上市公司的财务报表数据,采用多元判别分析(MDA)技术和神经网络(ANN)技术对我国上市公司进行财务困境预警研究。实证结果显示这两种方法都具有较好的预测效果,其中ANN模型的短期预测效果优于MDA模型的预测效果,但无明显的优势。研究同时证明在现有会计制度和会计准则下。财务报表能提供预测财务困境的大量有用信息。财务危机有踪可寻。  相似文献   

8.
随着市场竞争的日益激烈,上市公司生存压力不断增大,如何从繁多的财务指标中选择重要指标,建立有效的财务危机预警模型显得尤为重要。COX模型具有对因变量分布无假设并可以对公司生存时间进行动态预测等优点,因此本文引入COX模型,并加入惩罚组变量选择CMCP方法,对具有分组结构的财务指标进行筛选。本文根据实际的财务危机数据特征设置模拟实验,并将CMCP-COX模型与Lasso-COX模型、逐步COX模型、COX模型和逐步Logistic相比,结果表明在不同的自变量相关性下CMCP-COX模型的指标筛选和预测效果均更优。实证分析中,CMCP-COX模型在测试集上的预测准确率高于80%,尤其在"危机"类别中预测准确率高于90%,其预测准确性和AUC值均优于传统的逐步Logistic回归和其他COX模型,并呈现出了理想的时点预测效果。综合对比认为CMCP-COX模型对于财务危机预测的综合表现较好,更具有现实意义。  相似文献   

9.
侯臣平  易东云  吴翊 《系统仿真学报》2008,20(20):5553-5557
针对虚拟计算环境下Web资源特性的描述问题,提出资源空间模型,采用流形学习的方法提取Web资源特征.首先根据资源空间模型,有效地将Web资源抽象为高维空间中的数据集;然后,采用流形学习中的最大差异延展算法.此方法不仅能有效地提取Web资源的特征,而且能够挖掘隐含在Web资源内部的本征信息;此时,描述Web资源特征的数据位于低维空间,有利于资源的进一步处理.基于最大差异延展算法的Web资源描述方法有效地解决了Web资源的描述问题.通过仿真实验证明了此方法的有效性.  相似文献   

10.
SOFC的支持向量机(SVM)辨识建模   总被引:1,自引:0,他引:1  
为了便于固体氧化物燃料电池(SOFC)的性能预测和控制方案设计,提出一种基于支持向量机(SVM)的建模方法,用具有RBF核函数的SVM建立了SOFC电池堆的非线性模型.应用仿真对所建SVM模型的有效性和精度进行了检验,并与BPNN模型的辨识效果进行了比较.仿真结果证明与BPNN模型相比,SVM模型具有较高的建模精度.该SVM辨识模型的建立,对SOFC系统的控制策略研究具有一定的实用价值.  相似文献   

11.
现有的财务困境预测研究大多忽略了公司在年度财务报告中以文本形式披露的风险信息,而相比于公司披露的其他类型的文本,这些风险信息能够更加直接和前瞻地反映公司经营中的潜在重要风险。创新性地引入财务报告中的文本风险信息进行财务困境预测,并构建了能够反映所披露的风险对公司产生影响的可能性的文本特征指标——风险可能性,而后采用机器学习方法构建预测模型。基于2006~2020年美国35706个上市公司年度样本的实证研究发现:在常用的财务及市场各类定量指标的基础上,融合财务报告中的文本风险信息能够显著提升公司财务困境的预测效果;相比于其他常用文本特征指标,本研究提出的风险可能性指标在财务困境预测中表现的重要度最高;定量指标的财务困境预测能力随着预测时间窗口的提前而明显下降,而文本风险信息的预测能力不仅没有下降,还呈现出了更为显著的提升效果。本研究可以帮助市场投资者、监管机构理解如何解读公司在财务报告中披露的文本风险信息,并为实现财务困境预测中融合文本信息提供了理论指导。  相似文献   

12.
A new incremental support vector machine (SVM) algorithm is proposed which is based on multiple kernel learning.Through introducing multiple kernel learning into the SVM incremental learning,large scale data set learning problem can be solved effectively.Furthermore,different punishments are adopted in allusion to the training subset and the acquired support vectors,which may help to improve the performance of SVM.Simulation results indicate that the proposed algorithm can not only solve the model selection problem in SVM incremental learning,but also improve the classification or prediction precision.  相似文献   

13.
In order to control uncertainty and instability of single classifiers in financial distress prediction, this research proposed a multiple classifiers hybrid combination model for financial distress prediction. This model improves predictive performance by the combination of multiple classifiers and taking advantages of serial combination and parallel combination. Diversity principle and individual optimization principle were taken as criteria for classifier selection. On the foundation of defining selection operator for class's best classifier, algorithm for constructing basic modules in hybrid combination, dynamic weighting mechanism for parallel modules inside hybrid combination, and mechanism of majority voting were designed. Empirical research with data from Chinese listed companies indicates that the model improves average predictive accuracy and simultaneously reduces variation degree. Statistical analysis demonstrates that the hybrid combination model outperforms existing single classifiers in financial distress prediction significantly.  相似文献   

14.
戚湧  徐永红 《系统仿真学报》2007,19(17):4004-4006
在金融企业中,时间序列是一种重要的数据类型。高效、准确地预测金融时间序列对于企业的运作具有重要意义。提出使用一种具有增量学习能力的模糊神经网络(FNN-IL)应用于金融时间序列的预测。FNN-IL能学习蕴涵在时间序列中的知识,并能跟踪时间序列的运行从而动态调整模糊规则库。对比试验表明FNN-IL的性能优于传统的FNN。  相似文献   

15.
企业财务困境修正Z模型的实证研究   总被引:5,自引:0,他引:5  
陈文俊 《系统工程》2005,23(6):80-84
针对奥特曼Z模型的不足之处进行了修正,寻找尽可能准确预测财务困境的模型,并选取我国上市公司中41家财务陷入困境的公司和41家财务正常的公司为样本,应用逐步回归分析法,研究了财务困境出现前2年这两类公司的20个财务指标,从中选定7个指标作为预测变量,主要采用Fisher判别分析和Logistic回归分析两种方法分别建立了财务困境预测模型。实证研究结果表明这2个模型与奥特曼的Z模型相比均有较好的预测效果,针对我国上市公司财务困境的预测准确度有显著提高。  相似文献   

16.
深度学习模型严重依赖于大量人工标注的数据,使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏等现实挑战,很多学者针对数据依赖小的弱监督学习方法开展研究,出现了小样本学习、零样本学习等典型研究方向。对此,本文主要介绍了弱监督学习方法条件下的小样本学习和零样本学习,包括问题定义、当前主流方法以及实验设计方案,并对典型模型的分类性能进行对比。然后,给出零-小样本学习的问题描述,总结研究现状和实验设计,并对比典型方法的性能。最后,基于当前研究中出现的问题对未来研究方向进行展望,包括多种弱监督学习方法的融合与理论基础的探究,以及在其他领域的应用。  相似文献   

17.
深度学习模型严重依赖于大量人工标注的数据,使得其在数据缺乏的特殊领域内应用严重受限。面对数据缺乏等现实挑战,很多学者针对数据依赖小的弱监督学习方法开展研究,出现了小样本学习、零样本学习等典型研究方向。对此,本文主要介绍了弱监督学习方法条件下的小样本学习和零样本学习,包括问题定义、当前主流方法以及实验设计方案,并对典型模型的分类性能进行对比。然后,给出零-小样本学习的问题描述,总结研究现状和实验设计,并对比典型方法的性能。最后,基于当前研究中出现的问题对未来研究方向进行展望,包括多种弱监督学习方法的融合与理论基础的探究,以及在其他领域的应用。  相似文献   

18.
上市公司财务困境预测模型比较研究   总被引:5,自引:0,他引:5  
以中国上市公司为研究对象,以因财务状况异常而被特别处理作为上市公司陷入财务困境的标志,采用交叉验证技术建立各种统计和神经网络模型,并在独立的预测样本集上进行比较.实验结果表明统计和神经网络模型都能有效地进行财务困境预测,对于提前两年预测,统计模型优于神经网络模型,而对于提前三年预测,神经网络模型优于统计模型.实验结果也表明了在与训练集同一财务年度区间内的测试集上不能正确估计模型的性能.  相似文献   

19.
针对传统BP神经网络在旱情预测的实际应用中随机初始权值和阈值导致网络学习速度慢、易陷入局部解以及计算精度低等缺陷,提出一种基于数论佳点集萤火虫(good point set glowworm swarm optimization,GPSGSO)算法与BP神经网络(back propagation neural network,BPNN)并行集成学习算法(GPSGSO-BPNN)的旱情预测模型.首先,借鉴数论中佳点集理论构造初始均匀分布的萤火虫种群,并引入惯性权重函数动态修正移动步长,生成基于数论佳点集理论萤火虫算法,并从理论上分析算法的有效性;其次,将GPSGSO算法与BPNN相结合构建并行集成学习算法,实现两种算法的并行交互集成.最后,将并行集成学习算法应用于农业干旱灾害预测中,构建基于GPSGSO-BPNN并行集成学习算法的旱情预测模型.通过8个Benchmark函数验证了GPSGSO算法在收敛速度、计算精度及稳定性等方面的有效性.同时,以皖北农业干旱气象数据作为仿真数据,实验结果表明GPSGSO-BPNN算法在计算速度、精度及稳定性方面较传统BPNN、GSO-BPNN及GA-BPNN等算法有较明显的优势,提高了旱情等级预测的准确性.  相似文献   

20.
警兆是警情爆发之前的先兆性指标,对其进行定量分析是财务困境分析中最为关键的一环。通过设定财务困境分析中警兆指标的上、下限,确定警兆指标变动的趋势,运用马尔可夫链进行随机游动估计,可以推导出分析时点警兆指标的恶化概率,并对其警情与警度作出分析,从而不但可以避免仅仅用警素指标建立模型进行财务困境预测的不足,而且使公司决策者能够有针对性地及早发现并排除分析指标所蕴涵的经营管理和财务风险,有效地防止风险恶化为财务困境的重要意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号