首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着大数据、人工智能以及高性能计算的快速发展, 数据驱动的新材料研发成为研究热点. 在对材料数据进行数据挖掘的过程中, 需要对特征集合进行预处理, 通过减少无关冗余特征, 不仅可以避免模型过拟合, 还能提高模型的可解释性. 基于此, 提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning, FSRL) 算法, 将封装式特征选择抽象成机器学习模型和"环境"互动的过程, 并根据利益最大化准则将对应特征加入特征子集中. 同时, 为了提高模型的预测精度, 还提出一种基于符号变换的特征构造方法来生成新的特征. 最后, 将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中. 实验结果表明, FSRL 算法的分类准确率最高提升了 2.8%, 而在回归任务中, 基于特征构造的 FSRL 算法使得预测精度最高提升了 22.9%.  相似文献   

2.
针对神经网络存在的过学习、欠学习、局部极小值等问题,提出了一种基于支持向量机(SVM)的数字调制方式的识别方法。从信号的瞬时幅度,瞬时相位,瞬时频率,频谱,包络变化等特性中提取了7个特征参数,用于训练支持向量机。运用二叉树理论设计多类分类器,与已有算法相比,具有简单、高速、高精度的特点。仿真结果证明,在高斯白噪声(AWGN)下,当信噪比大于15dB时,对2ASK、4ASK、8ASK、2FSK、4FSK、8FSK、BPSK、QPSK、8PSK调制方式的识别率可以达到97% 以上。  相似文献   

3.
封之聪  祝云  高枫 《科学技术与工程》2022,22(26):11394-11401
在火力发电过程中,蒸汽量的准确测量,对于汽轮机机组的经济稳定运行具有重要的意义。针对传统蒸汽量测量方法精度低的问题,提出了一种基于宽度学习系统(broad learning system, BLS)和Lasso (least absolute shrinkage and selection operator)回归模型的组合预测模型。首先利用One-class SVM (one-class support vector machines)算法对样本进行异常值检测,将检测得到的异常值剔除。然后,采用最大信息系数(maximal informationcoefficient, MIC)对特征变量和蒸汽量进行非线性关联性分析,确定宽度学习系统和Lasso回归模型的输入变量,通过训练得出各自的预测结果。最后,通过最优加权组合法确定两单一模型的权重系数,将它们所得的预测结果线性组合,得到最终的预测结果。实例表明,所建立的组合模型有效地缓解了单一模型在变化剧烈的峰值和谷值预测偏差大的问题,能够准确地预测蒸汽量。  相似文献   

4.
Vine copula模型在描述高维数据间的非线性、非高斯特性相依关系问题上提供了一种新的思路,在化工过程建模领域受到越来越多关注。笔者将LASSO(least absolute shrinkage and selection operator)回归引入R-vine copula(LASSO-R-vine copula, LRVC),根据变量间联系的强弱程度确定变量在R-vine矩阵中的位置,利用回归分析正则化路径选择R-vine copula矩阵结构,遵循R-vine矩阵构建规则和回归过程确定R-vine结构矩阵模型,以获得一个与变量独立性有关的稀疏矩阵模型。该方法构建的矩阵结构独立于copula函数类型和参数,在处理高维度复杂工业过程数据时,利用稀疏模型和惩罚力度简化copula函数类型选择过程,缩短了建模时间,使统计建模具有更强的灵活性。该方法在TE(Tennessee Eastman)和醋酸脱水过程故障监测中表现出较好的预测效果,证明了提出的方法在非线性、非高斯过程的有效性。  相似文献   

5.
为鉴定溃疡性结肠炎(ulcerative colitis, UC)中与能量代谢相关的关键基因,通过从GSE87466数据集中提取能量代谢相关基因的表达量并进行差异分析后对其进行富集分析,使用最小绝对收缩和选择算子(the least absolute shrinkage and selection operator, LASSO)算法和支持向量机器-递归特征消除(support vector machine-recursive feature elimination, SVM-RFE)算法识别UC能量代谢关键基因,对关键基因进行富集分析、免疫浸润分析、关键基因靶向药物预测和构建ceRNA网络,最后用GSE75214作为验证集对关键基因的表达进行验证。结果表明:共筛选出32个与能量代谢相关基因,通过LASSO和SVM算法鉴定出5个关键基因(SLC16A1、ACSF2、NR1H4、CHST11和CBR3)。单基因富集结果显示关键基因通过糖酵解/葡萄糖新生、丁酸代谢、丙酮酸代谢等途径参与UC的发生发展。验证集GSE75214对关键基因进行验证发现表达均具有差异。为从能量代谢角度治疗溃疡性结肠...  相似文献   

6.
一种新的基于支持向量机的自动调制识别方案   总被引:1,自引:0,他引:1  
为了解决在合作或非合作的通信应用领域中(如软件无线电,电子侦察系统等)多种调制信号之间的切换问题,提出1种基于多类别支持向量机(SVM)的模拟和数字信号的调制识别的新方案。SVM将特征向量非线性地映射到高维特征空间中,并建立1个最优超平面来实现信号调制方式的分类。这种方法避免了在人工神经网络中的过学习、欠学习以及局部最小化的问题。仿真中将应用于调制识别的SVM算法与人工神经网络算法(ANN)做了比较,结果表明SVM自动调制识别方法结构简单,识别率高,解决小样本的能力强,在信噪比SNR不低于5dB时,正确识别率达到94%以上,适于在工程中应用。  相似文献   

7.
随着电子商务的高速发展,如何通过最优商品定价决策来帮助企业获得最优利润已成为网络零售商运营管理的重要研究方向.随着促销活动的频次和种类的不断增加,商品存在促销关联效应,不同的促销策略会对商品间的销量产生影响.首先,应用Granger-LAS SO (least absolute shrinkage and select...  相似文献   

8.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

9.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

10.
为科学地对港口物流服务商进行评估及选择,基于数据包络分析(DEA)模型,结合定性的不确定因素,提出非精确数据包络分析(IDEA)模型的港口物流服务商优选方法.该方法无需更多精确信息,并兼有一般DEA的特点,较好地解决了DEA无法处理定性因素的问题.算例分析结果表明了该方法的有效性和实用性.  相似文献   

11.
基于定性空间推理对空间关系给出一个通用特征集合, 并结合网络爬虫、 文本挖掘、 空间数据库和机器学习方法提出一种针对中文文本的通用空间关系识别框架, 解决了大数据中中文文本的空间关系识别问题. 与传统人工建立的空间关系模型相比, 该方法具有更高的识别率, 适用于处理大数据中中文文本的空间信息.  相似文献   

12.
Essential proteins are vital to the survival of a cell. There are various features related to the essentiality of proteins, such as biological and topological features. Many computational methods have been developed to identify essential proteins by using these features. However, it is still a big challenge to design an effective method that is able to select suitable features and integrate them to predict essential proteins. In this work, we first collect 26 features, and use SVM-RFE to select some of them to create a feature space for predicting essential proteins, and then remove the features that share the biological meaning with other features in the feature space according to their Pearson Correlation Coefficients(PCC). The experiments are carried out on S. cerevisiae data. Six features are determined as the best subset of features. To assess the prediction performance of our method, we further compare it with some machine learning methods, such as SVM, Naive Bayes, Bayes Network, and NBTree when inputting the different number of features. The results show that those methods using the 6 features outperform that using other features, which confirms the effectiveness of our feature selection method for essential protein prediction.  相似文献   

13.
脑机接口(brain-computer interface,BCI)的分类性能一定程度上取决于对脑电信号的预处理方法,这项研究提出了一种空域时域滤波的预处理方法,以解决人类视觉系统中的潜伏延迟对编码调制视觉诱发电位(c-VEP) BCI的目标识别性能的影响。基于一个平均信号和单次试验信号之间的最小均方误差(the least mean square error,LMSE)创建时域空域滤波器,并且通过最小绝对收缩和选择算子(the least absolute shrinkage and selection operator,LASSO)将稀疏约束应用于滤波器的权重系数,并用模板匹配法来对目标进行识别。将算法应用于由63比特的M序列及其循环移位序列调制的16个目标的c-VEP BCI,并与通用的空域滤波算法典型相关分析(CCA)及空域时域逆滤波算法进行比较。结果表明本研究所提出的算法在分类准确率方面优于其他两种算法。  相似文献   

14.
机器学习在多变量拟合、复杂数据相关性分析、隐含信息挖掘利用等方面具有强大功能,在机械结构故障预测和材料寿命预测方向的应用研究成为热点.本文介绍机器学习在材料疲劳和腐蚀寿命预测中的应用,深入探讨BP神经网络、支持向量回归、聚类分析算法和集成算法综合应用的研究现状,总结模型参数的选取方法和模型性能的评估指标,并对机器学习在材料疲劳和腐蚀寿命预测研究领域存在的主要问题和发展趋势进行剖析.  相似文献   

15.
刘炼  王强  陈浩 《科学技术与工程》2022,22(11):4367-4374
针对传统基于机器学习的电力系统暂态稳定评估方法存在准确率偏低和泛化能力不足的问题,提出了一种基于特征选择和改进随机森林的在线暂态稳定评估方法。首先,通过最大化联合互信息挖掘电网运行数据之间的相关性,筛选出具有代表性的关键特征子集;然后,考虑到电力系统数据库中稳定样本与失稳样本之间的类别不平衡问题,通过改进bootstrap抽样和对决策树进行加权处理,增强随机森林对失稳样本的识别能力;最后,基于改进的随机森林算法,建立关键特征数据与暂态稳定标签之间的映射关系。实验结果表明,所提方法具有较高的准确性和较强的鲁棒性,能够满足在线应用的需求。  相似文献   

16.
 概述了机器学习的主要方法及其在遥感影像的主要应用方向,涵盖环境生态遥感中机器学习技术的研究、应用情况及近年来的新进展。通过使用深度学习对FY-3C气象卫星资料进行积雪检测的应用实例,说明深度学习模型可以利用大数据的优势不断提高检测精度,在某些指标中取得了更优于传统机器学习的精度,可解决传统机器学习难以解决的一些问题,从而带动遥感应用模式的创新。  相似文献   

17.
研究剪接位点可以更深入地探索剪接机制和基因预测方法,准确预测剪接位点至关重要。基于深度学习技术提出一种新的预测方法,无需人工提取样本特征,以基因序列的K-MER编码向量作为输入,采用训练后的卷积神经网络(CNN)模型进行预测。基于人类基因HS3D供体数据集,与传统机器学习方法进行预测比较,结果表明预测模型的主要性能指标,包含马修斯相关系数(MCC)、灵敏度(SN)均超过传统的机器学习方法。  相似文献   

18.
基于IPSO-SVM的地铁车辆牵引控制单元故障诊断   总被引:2,自引:0,他引:2  
地铁车辆牵引控制单元(TCU)是地铁系统的核心单元之一,准确诊断其故障状态对整个地铁车辆安全运行至关重要.基于数据的故障诊断方法是当前热点方法之一.针对牵引控制单元故障诊断中检测参数多、故障类别多的特点,提出了改进的粒子群优化支持向量机(IPSO-SVM)方法,克服了传统方法存在过拟合、收敛速度慢、易陷入局部最优的缺点.使用UCI机器学习数据库中的5个数据集进行仿真实验,结果表明:IPSO-SVM分类精度高于ICPSO-SVM、PSO-SVM、GA-SVM.进一步将此方法应用于地铁车辆实际数据,同样得到了较好的分类结果,验证了所提方法的有效性.  相似文献   

19.
近年来,随着深度学习的兴起,机器学习在油气领域得到了进一步深入发展。但是,由于油气行业的特殊性和复杂性,目前还没有建成适用于深度学习的训练样本库,也没有针对性的模型建立和选择方法体系。此外,深度学习方法的不可解释性,导致了学习的模型对环境的高度依赖,制约了机器学习在油气行业中的推广应用。从机器学习的发展阶段出发,介绍机器学习在油气行业各领域的应用中所涉及的重大突破及仍然存在的问题。针对油气行业中不同类型数据的处理方法、样本建立以及如何进行模型适应性分析等方面给出了建议,提出可解释机器学习在油气人工智能上的发展潜力以及研究方向。  相似文献   

20.
为了在P2P内容分发系统的可用结点间合理分配数据请求,设计了一种基于并行机调度模型的优化内容分发数据调度算法.仿真结果表明,在典型的数据块选择方法条件下,该算法相比常用的随机结点选择数据调度方法可以进一步提高系统吐吞能力,同时减轻源服务器的负载.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号