共查询到19条相似文献,搜索用时 80 毫秒
1.
2.
针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics, BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach, ADASYN)和合成少数类过采样算法(synthetic minority over-sampling technique, SMOTE)对航班延误类别进行平衡处理,并用随机森林(random forest, RF)模型进行训练和贝叶斯调参。结果表明:与不经过平衡采样的方法比较,该方法在权重平均下的精确率、召回率和F1评分分别提高了19%、8%和16%;分类预测准确率提升8.03%,模型拟合指数AUC(area under curve)提升5.4%。同时,采用多特征相融合的图神经网络模型Graph WaveNet对航班平均延误时间进行预测。实验结果表明:与单特征模型比较,该模型平均绝对误差和均方根误差分别降低了16%和12.45%。这些方法和结果对研究航班延误分类和预测算法研究具有参考价值。 相似文献
3.
在不平衡数据分类问题中,为了更注重学习原始样本的概率密度分布,提出基于梯度惩罚生成对抗网络的过采样算法(OGPG)。该算法首先引入生成对抗网络(GAN),有效地学习原始数据的概率分布;其次,采用梯度惩罚对判别器输入项的梯度二范数进行约束,降低了GAN易出现的过拟合和梯度消失,合理地生成新样本。实验部分,在14个公开数据集上运用k近邻和决策树分类器对比其他过采样算法,在评价指标上均有显著提升,并利用Wilcoxon符号秩检验验证了该算法与对比算法在统计学上的差异。结果表明该算法具有良好的有效性和通用性。 相似文献
4.
现有的绝大多数过采样方法着重于寻找少数类样本的边界从而增强样本的可分性,忽略了样本的重叠分布与小析取问题,这导致在过采样阶段产生过多的噪声,最终无法实现对少数类样本的正确分类.针对这些问题,提出一种基于密度峰值聚类和局部稀疏度的过采样算法.首先利用改进的密度峰值聚类算法对全部样本自适应地划分出多个簇,根据簇内样本的不平衡比过滤掉不平衡比过高的簇,然后在筛选出的簇中根据少数类样本的分布情况对各簇的过采样个数进行分配,最后通过样本密度计算出各簇少数类样本的局部稀疏度,从中选择出稀疏度较高的少数类样本参与到最终的合成少数过采样.将提出的过采样算法与八种常用的过采样算法分别与三种基分类器相结合,在18个不平衡数据集上进行对比实验.实验结果表明,提出的算法总体上表现更优,能得到更好的分类性能. 相似文献
5.
在金融工程的分类任务中,由于金融数据噪音大、信息比率低的特点,传统深度算法的有监督训练模式往往过于依赖数据本身的绝对标签从而进一步放大了噪音对最终结果的影响.生成对抗网络(generative adversarial network, GAN)能够利用深度网络挖取数据特征,增强数据,减少噪音影响,应用于金融序列分析时效果优异.这里将GAN模型用于高频交易,具体做法为:将数据按波动性分为有标签数据与无标签数据两类,利用生成网络G与判别网络D互相对抗训练来深度学习这些数据的内在特性,训练好后的D网络根据有标签数据信息亦可对真实数据进行类别判别,得到涨跌分类模型,进而给出量化交易策略.基于期货主力合约数据进行了实证分析,结果表明,基于GAN训练下的LSTM模型显著优于有监督训练下的LSTM等深度模型和Logistics回归模型. 相似文献
6.
针对假币的特征未知以及样本数量不平衡的局限性问题,提出基于半监督辅助分类生成对抗网络的纸币红外特征鉴伪算法.辅助分类生成对抗模型可以扩充样本的数据集,经过半监督的方式训练得到分类器进行分类,实现对纸币红外特征的鉴伪.实验结果表明,该算法能提高假币鉴伪的准确率以及泛化能力. 相似文献
7.
使用生成对抗网络(GAN)扩充宫颈癌病理图像的数据集以提高计算机辅助诊断的准确率.首先,使用GAN进行细胞质部分图像生成;其次,使用两次k-means聚类对生成图像进行筛选;最后,使用Inception-V3模型对数据集进行分类训练.结果表明,在测试集相同的情况下,该方法可以将总体分类准确率提升约2.5%,尤其对低分化宫颈癌病理图像有显著效果.通过GAN解决了组织病理学图像无方向性、内容复杂、前景目标规则性差等问题,证明了该方法的有效性及发展潜力. 相似文献
8.
人脸姿态重建对于解决由于人脸姿态导致的人脸识别率降低的问题有重要意义,由于自遮挡,缺少大部分的人脸特征,重建正面人脸存在很大困难.近年来运用生成对抗网络的图像生成方法得到学界深入的研究,受生成对抗网络在人脸肤色,头发等属性变换等方面研究工作的启发,将人脸偏转角度作为人脸的一种全局姿态属性进行基于生成对抗机制的互换训练,... 相似文献
9.
结合三支决策和合成少数过采样技术(synthetic minority over-sampling technique, SMOTE),提出了一种新的采样方法—三支过采样(three-way over-sampling, 3WOS)。3WOS通过对所有样本构建三支决策模型,选取该模型边界域中的样本作为关键样本进行SMOTE过采样,从而有效缓解样本聚集和分离问题,在一定程度上提高了分类器性能。该方法首先在少数类样本上应用三支决策和支持向量数据描述,将所有样本数据进行三分;其次,找出所有关键样本的k个最近邻少数类样本,并使用线性插值方式对每个关键样本合成新样本,然后形成新的少数类样本;最后,将更新后的样本集用于训练分类器。实验结果表明,3WOS方法比其他方法在基分类器上有较好的分类准确度、F-measure、G-mean和较少的代价值。 相似文献
10.
自生成对抗网络提出以来,基于生成对抗网络的拓展模型在图像处理等领域均有显著成效,但其在回归预测问题上的应用较少.在概率回归过程中,通过构建条件概率分布模拟特征与实际目标之间的潜在关系是一种常用方法,但在实际问题中条件概率分布过于复杂,似然估计难以捕捉.为此,首先分析高斯过程回归在稀疏样本回归预测中的预测精度,将其作为稀疏样本回归预测的基准线.通过分析条件生成对抗网络的构造,提出利用条件生成对抗网络解决稀疏样本回归预测问题.最终通过对比分析4种非线性模拟数据回归预测结果,发现提出的条件生成对抗网络模型相较基于Matern32核函数的高斯过程回归具有更好的预测精度. 相似文献
11.
机场航班量不断增长,必然会带来机场高峰时段延误水平的增加。因此机场延误水平的科学预测对确保机场运行效率具有重要意义。论文首先根据航空器运行特性建立机场排队网络模型;然后利用Lempel-Ziv算法计算不同时间尺度的航班时间序列复杂度,确定刻画航班延误的小时间尺度,由此确定排队网络模型参数,并用实例进行验证;最后运用AirTop仿真软件以全天平均延误、高峰小时平均延误作为关键指标,仿真得出机场延误水平变化趋势。通过将仿真数据与计算结果进行对比分析发现,机场排队网络模型能够较好的反应真实情况下的机场延误水平;而选用小时间尺度15 min进行机场排队网络模型参数计算,结果更贴近真实机场延误水平。 相似文献
12.
随着中国民航业的快速发展,航班延误情况一直较为严重.建立了航班计划优化模型,将软备份运力分配在飞行时间和过站时间中,提高了航班的正常率、起飞的准点率和航班串的鲁棒性;为了进一步提高航班的正常率,追踪航班串中各航班的过站机场和离场时间,用加权马尔科夫链预测处在该时间段的过站机场的延误状态,并针对不同的延误状态作出相应的延... 相似文献
13.
随着可再生能源机组以多微网的形式接入配电网,其出力的不确定性会给配电网与多微网调度带来挑战。因此,如何对配电网与多微网中可再生能源的特性进行分析,准确把握可再生能源的出力特性,建立考虑可再生能源出力特性的配电网与多微网调度模型,成为目前亟待研究和解决的问题。本文提出了一种基于Wasserstein生成对抗网络的配电网与多微网日前随机调度方法。首先针对风电以及光伏日前预测的不确定性,采用基于Wasserstein生成对抗网络的数据驱动算法,对风电和光伏出力预测误差进行场景生成;对于生成的风光出力场景,基于K-mediods场景削减法得到风光典型场景;在配电网与多微网调度目标函数中综合考虑调度的经济性指标以及韧性指标,基于场景法模拟可再生能源出力的不确定性,建立配电网与多微网日前随机调度模型并求解。仿真结果表明,所提的配电网与多微网随机调度模型在可再生能源出力场景生成方面,相比于传统假定概率分布的生成方法,其生成的场景更接近实际场景。 相似文献
14.
基于贝叶斯网络的机场航班延误因素分析 总被引:1,自引:0,他引:1
中国民航业近年来快速发展,航班量增多、航班密度逐步加大,许多资源配置的矛盾也日益凸显出来。机场大面积航班延误难以避免。针对上述问题,在航班延误波及分析的基础上,建立机场航班延误的贝叶斯网络分析模型。通过机场航班数据网络学习和测试,得到了不同因素对机场航班延误的影响程度、不同时间段的延误情况,为机场当局解决大面积航班延误提供决策依据。 相似文献
15.
为及时掌控多个机场之间的航班延误程度,研究物元可拓方法在机场航班起飞延误关联性中的应用。通过建立分时段航班起飞延误的物元模型,运用物元可拓方法,对多个机场的航班起飞延误情况进行分析。根据机场间航班起飞延误的关联度计算结果,选取关联性较大的机场,对目标机场的航班起飞延误程度进行预测;并通过实例验证了该方法的可行性。算例表明:所提出的方法能够有效地分析多个机场航班起飞延误之间的关系,并能够对起飞延误的发生起到预警作用。 相似文献
16.
17.
基于机器学习的煤与瓦斯分类预测方法中,各突出案例的数量不平衡会导致预测准确率降低。为了提升煤与瓦斯突出预测模型的准确率及稳定性,构建了过采样算法和支持向量机(support vector machine, SVM)组合的分类预测模型。首先,通过聚类分析将突出样本分成多个簇,在每个簇中对可能的噪声点按概率去除;然后通过过采样算法合成新样本,以减少样本数量不均衡对模型训练的影响;最后,用支持向量机模型结合粒子群算法对新数据集进行训练调优。实验结果表明:提出的模型在G-mean、曲线下面积(area under curve, AUC)值上均高于传统的分类模型,具有更强的算法鲁棒性,并且随着突出样本数量的减少,其优势更加明显。 相似文献
18.
针对飞行试验过程中的盘旋性能分析问题,提出一种以试飞数据为基础的盘旋性能仿真分析方法。首先依据拉依达准则识别试飞数据中的异常值,并根据提出的移动基准区间牛顿插值方法对异常值修正;然后建立飞机盘旋运动的动力学计算模型,采用欧拉角法通过坐标变换矩阵求解飞机盘旋动力学方程,计算结果应用中心插值算法进行平滑处理。最后基于某型固定翼飞机实际飞行试验中记录的试飞数据进行算例分析,依据能量机动理论绘制完整的盘旋性能飞行包线,将理论计算结果与仿真结果进行对比表明了所建模型与仿真分析方法的有效性与正确性,为飞机的反馈设计及飞行性能的改进提供方法及依据,在工程实际应用上具有一定的可行性。 相似文献
19.
针对现有基因微阵列数据分类中存在的数据维度高、容易发生过拟合的问题,提出了基于BTLBOGSA(Binary TLBOGSA)与卷积神经网络(Convolutional Neural Network, CNN)的基因微阵列数据分类模型(BTLBOGSA-CNN)。该模型首先针对基因微阵列数据分类时存在的数据维度高的问题,利用新的编码策略,将连续搜索空间转换为二元搜索空间,结合教与学优化(Teaching-Learning-Based Optimization, TLBO)算法的二元变体与引力搜索算法(Gravitational Search Algorithm, GSA)的各自特点,基于BTLBOGSA方法从基因微阵列数据集中选择具有高鉴别性的基因;然后针对基因微阵列数据分类易发生过拟合问题的现象,利用卷积神经网络进行基因微阵列数据的分类。利用公开的基因微阵列数据集进行仿真实验,从TLBO算法与GSA结合的有效性、BTLBOGSA与CNN结合的有效性、BTLBOGSA-CNN与其他已有分类模型相比的有效性3个方面进行对比分析,结果表明,BTLBOGSA-CNN模型可以在较少的特征基因下... 相似文献