首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

2.
针对股市的非线性和不确定性的特点,本文提出了一种基于支持向量机自回归分析的股市动态预测模型。该模型利用滚动时间窗动态截取股票时间序列,然后对其进行相空间重构,最后利用支持向量机回归算法,在高维映射空间中求解线性回归问题。利用上证综指的长期和短期数据对该模型的预测效果进行了验证,并将预测结果与RBF神经网络预测模型进行了的对比。预测和对比结果表明,支持向量机自回归预测模型具有较强的泛化能力,适合于股市预测。  相似文献   

3.
针对高维数据集,提出一种利用预测变量之间的图结构信息来改进稀疏逻辑回归模型的方法。该方法通过利用高维图结构数据或者重叠组结构来进行逻辑回归建模,即使预测变量的图结构未知,该方法仍适用,当图结构为某些特殊形式时,目前流行的方法,如Adaptive Lasso,(Overlapping) Group Lasso和岭回归都可以看作是该模型方法的特例。数值模拟和实例分析应用表明:该方法能有效地利用预测变量图结构信息,提高模型在估计、预测以及变量选择等方面的表现,并且该模型在有限样本情形下是有效的;该模型方法克服了数据集的维数问题,利用高维数据的图结构提高了稀疏逻辑回归模型的性能,可广泛应用于高通量基因数据集的疾病分类研究中。  相似文献   

4.
随着大数据、人工智能以及高性能计算的快速发展, 数据驱动的新材料研发成为研究热点. 在对材料数据进行数据挖掘的过程中, 需要对特征集合进行预处理, 通过减少无关冗余特征, 不仅可以避免模型过拟合, 还能提高模型的可解释性. 基于此, 提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning, FSRL) 算法, 将封装式特征选择抽象成机器学习模型和"环境"互动的过程, 并根据利益最大化准则将对应特征加入特征子集中. 同时, 为了提高模型的预测精度, 还提出一种基于符号变换的特征构造方法来生成新的特征. 最后, 将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中. 实验结果表明, FSRL 算法的分类准确率最高提升了 2.8%, 而在回归任务中, 基于特征构造的 FSRL 算法使得预测精度最高提升了 22.9%.  相似文献   

5.
针对传统支持向量回归机在机制上难以直接对时变信号进行处理的问题, 提出了一种用于时间序列预测 的过程支持向量回归模型, 采用涡流搜索算法优化选择模型参数, 采用 UCI(University of California Irvine)数据 库的空气质量数据集和比利时 SIDC(Solar Influences Data Analysis Center)的太阳黑子数据进行仿真实验。 实验 结果表明, 该模型预测结果均优于粒子群过程支持向量回归机和支持向量回归机的预测结果, 具有较好的预测 能力。  相似文献   

6.
王瑞  万定生 《科学技术与工程》2021,21(25):10774-10779
水文时间序列受多种环境因素影响,表现出明显的综合性,传统的利用单一神经网络进行特征提取解释性不足。提出一种基于支持向量回归和高斯过程回归的水文时间序列特征提取方法。首先,罗列水文时间序列候选特征,将特征组合等价于0-1规划,并将各特征组合分别进行支持向量回归与高斯过程回归建模;其次,利用遗传算法演化求解一组最优特征组合,使得支持向量回归和高斯过程回归输出误差同时最小;最后,为了证明所提方法的高效性与准确性,以屯溪流域水文时间序列数据为对象进行验证。实验结果表明,基于支持向量回归和高斯过程回归特征提取方法的水文时间序列预测结果优于传统神经网络特征提取方法。  相似文献   

7.
从观察数据中发现变量之间的因果关系是许多科学研究领域的关键问题,传统Granger因果模型受到维度灾难的影响,难以准确地在高维时间序列中发现因果关系.提出一种基于分位数因子模型的Granger因果分析新方法 QFMCGC用于高维时间序列因果关系的判定.首先,QFM-CGC采用赤池信息量准则进行模型选择,避免人为干预设置滞后阶数的操作;然后,对向量自回归(Vector Autoregressive,VAR)模型中的条件变量建立分位数因子模型进行降维,减少VAR模型中的待估计系数,对降维后的VAR模型重新进行条件Granger因果分析;最后,使用蒙特卡洛模拟评估不同方法识别底层系统与观测时间序列的连通性结构的能力.在不同维度变量的线性仿真系统和两组现实数据集上与基准方法和经典方法进行了比较,实验结果验证了该方法的有效性.  相似文献   

8.
基于支持向量机的混沌时间序列预测   总被引:1,自引:0,他引:1  
支持向量机(SVM)是一种基于结构风险最小化原理的学习技术,是一种具有很好泛化性能的回归方法.针对混沌时间序列特点,提出混沌时间序列预测的支持向量机建模的思路、特点及关键参数的选取.对模型进行了实例研究,结果表明该模型能较好地处理混沌时间序列,具有较高的泛化能力和很好的预测精度.  相似文献   

9.
针对膜蛋白分类预测问题,在氨基酸组分基础上引入氨基酸位置信息,计算多种氨基酸残基指数的相关系数并选择最优组合方式;融合2类特征信息对膜蛋白序列进行特征提取;采用支持向量机算法作为分类器,构建了一种新型膜蛋白分类模型,在自检验、Jackknife检验和独立测试集检验3种典型方式下,预测准确率分别为98.25%、88.10%和95.62%.结果表明,多特征融合能够有效提取膜蛋白序列的特征信息,与现有方法相比,该分类模型具有较高的分类预测成功率.  相似文献   

10.
提出了一种采用GM(1,1)模型预测目标特征变化的新方法。该方法通过对目标区域进行分块,计算块区域像素和,同时利用短时时间序列对像素和序列进行累加处理生成新序列,通过GM(1,1)模型得到目标的预测模型。GM(1,1)像素预测模型方法对目标具有较强的预判能力,对短时特征变化具有较好的预测能力。跟踪算法能很好地将特征变化与预测结合到一起,利用该方法进行跟踪测试,对比当前传统跟踪算法其跟踪性能有显著提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号