首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着数据量的不断增多,对于预测精度的要求也越来越高。引入了机器学习中的损失函数和梯度下降算法,与传统的线性规划求解组合系数方法相比,简化了计算步骤,在保证精度的同时也提升了算法对大量数据的处理能力。最后通过实例表明,基于机器学习方法的区间组合预测模型能够有效地提升预测精度。  相似文献   

2.
机器学习在多变量拟合、复杂数据相关性分析、隐含信息挖掘利用等方面具有强大功能,在机械结构故障预测和材料寿命预测方向的应用研究成为热点.本文介绍机器学习在材料疲劳和腐蚀寿命预测中的应用,深入探讨BP神经网络、支持向量回归、聚类分析算法和集成算法综合应用的研究现状,总结模型参数的选取方法和模型性能的评估指标,并对机器学习在材料疲劳和腐蚀寿命预测研究领域存在的主要问题和发展趋势进行剖析.  相似文献   

3.
随着人工智能技术的快速发展和材料数据的显著增加,机器学习和人工智能辅助设计高性能钢材正成为材料科学的主流范式。机器学习方法是一种基于计算机科学、统计学及材料科学之间的跨学科科学,聚焦于发现众多数据之间的相关性。与材料科学中传统的物理建模方法相比,机器学习方法的主要优势在于克服了材料本身复杂的物理机制,为新型高性能材料的研发提供了新的思路。本文从数据预处理和机器学习模型的介绍开始,包括算法选择和模型评估。然后,以优化成分、结构、工艺和性能为主题,回顾了机器学习方法在钢铁研究领域应用的一些典型案例。此外,还介绍了机器学习方法在以性能为导向的材料成分逆向设计工程以及在钢材缺陷检测领域中的应用。最后,探讨了机器学习在材料领域的适用性和局限性,并对未来的发展方向和前景进行了展望。  相似文献   

4.
近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生大量错误标注,即标签噪声。另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染。训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加。因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义。通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析。  相似文献   

5.
机器学习是计算机智能(也叫人工智能)的一个主要的子领域。它的主要目标就是利用计算的方法从数据中提取信息。神经网络方法,一般被认为是机器学习研究中的第一次突破,它自上世纪80年代以来开始流行,而核方法是在上世纪90年代后半期作为机器学习研究的第二波高潮而到来的。本书对于机器学习方法和它在环境科学中的应用给出了统一的处理。  相似文献   

6.
高熵材料(high-entropy material, HEM)是一类具有良好性能的新型材料,以其较好的催化潜力、耐腐蚀性能等特点受到广泛关注.传统的高熵催化剂研究大多局限于各自的知识体系,难以兼容合并,不利于更优异的催化剂的后续研发.机器学习(machine learning,ML)作为一种基于大数据集来建立数理模型、进行研究推理的新兴学科,正逐步成为人们重点关注的人工智能科学分支.通过机器学习建立大数据库可以有效改善传统的研究状况,使研究效率大为提高.机器学习能用于识别定量的组分-结构-性能关系,通过从历史数据中学习而无需通过显式编程来加速电催化剂的设计.对机器学习算法、高熵材料进行了介绍,并阐述了机器学习在设计高熵电催化剂中的应用,讨论了机器学习在高熵电催化剂筛选和预测方面的发展前景.  相似文献   

7.
近年来随着"IP"热潮兴起,网络文学市场发展迅速,逐渐成为文化娱乐行业投资热点.本文将机器学习方法引入到小说排行预测方面,通过网络爬虫获取网络小说信息并提取了影响排行的特征,提出了基于BP神经网络模型进行小说排行预测.针对训练数据的不均衡,本文采用ROC和AUC作为预测评价指标;实验结果表明,基于BP神经网络的网络小说排行预测的准确率较高,相比传统的文学定性分析方法,机器学习预测方法可解释性和应用性更高.  相似文献   

8.
水力压裂是一种广泛使用的油气井增产技术,总结机器学习在水力压裂作业中的应用研究,重点讨论机器学习在工程实际中的应用价值.分析经典机器学习算法、机器学习对水力压裂作业中的参数预测与评估以及机器学习对水力压裂作业的产能预测与优化等.讨论机器学习算法辅助水力压裂分析,提高水力压裂产率,并通过机器学习算法将数据转换为可用信息辅...  相似文献   

9.
超参数优化问题一直是自动化机器学习研究的重点问题,针对特定的需求建立机器学习模型,需要调整大量的超参数。其中,超参数组合形成了大规模的超参数搜索空间,从而需要大量的运行时间。然而,有效探索大量超参数组合具有一定的挑战,现有的自动化超参数优化方法时间复杂度很高。为此,利用相似数据集的最优超参数区间的历史知识,提出了一种基于数据集元特征的超参数优化方法。首先,使用自动化机器学习系统寻找最优超参数的区间范围,然后对历史数据集元特征采用递归特征消除法进行特征提取作为特征向量,将此特征向量与最优超参数区间的对应关系利用XGBoost算法建立预测模型,并使用该模型预测新数据集的最优超参数区间。对OpenML平台的数据集进行实验,结果表明该方法预测的最优超参数区间的精度达87%。同时,把此预测区间作为自动化机器学习系统的搜索空间范围,在很大程度上缩短了运行时间,且确保一定的性能。  相似文献   

10.
魏东  张天祎  冉义兵 《科学技术与工程》2021,21(28):11910-11920
基于警务数据和时空数据构建犯罪预测模型,利用机器学习手段进行案事件预测,在国家安全稳定领域具有重要的意义。犯罪预测涉及三个主要方面:特征选择与处理、预测模型和地理信息可视化。分析了犯罪预测理论与方法的基本思想,在探索犯罪的生成机理和演化规律基础上,对经验模型和时空模型研究成果进行了综述。在此基础上,对根据不同预测特征选取最优算法的策略进行了讨论,同时对比简述了各类算法的特点,并对现存问题和未来研究方向进行了探讨。  相似文献   

11.
岩爆类型预测是防治和控制硬岩矿山岩爆灾害的有效方式。基于国内外397组岩爆案例数据,规范训练集与测试集的数据预处理方式,采用模型参数优化及交叉验证技术获得最近邻、支持向量机与决策树模型最佳参数;对比分析主成分分析法(PCA)与过采样SMOTE对3种机器学习算法预测准确率的影响,并采用准确率、精确率、召回率、F1等指标对模型预测性能进行评估。结果表明:主成分分析对3种机器学习模型的预测准确率并无提升,不同岩爆类型的样本之间不具有较为明显的决策边界;过采样SMOTE算法仅对决策树模型有明显的提升,基于过采样建立的SMOTE-DT模型预测准确率为77.50%,高于仅对原始数据集进行标准化处理的KNN、SVM模型的68.75%与57.50%;SMOTE-DT在高估与低估岩爆类型表现优于KNN与SVM模型,对于四种岩爆类型的F1值均大于0.7,岩爆预测性能稳定可靠。此外,采用本文构建的3种机器学习模型对山西紫金金矿进行了岩爆类型预测,模型预测结果与现场观测结果相一致。本文构建的三种用于岩爆类型预测的机器学习模型避免了训练集信息泄露对测试集造成影响,研究结果为岩爆类型预测及规范机器学习模型训练过程提供了理论支撑。  相似文献   

12.
老油田在长期开发过程中积累了大量的数据资源,为机器学习技术应用提供了基础。以深入挖掘数据资源内在关系为目的,提出基于机器学习的剩余油分布预测新方法。首先以测井解释成果、油藏工程理论计算和多套油藏数模结果为基础数据,开展数据融合和处理,给出12个维度参数的具体计算方法,形成样本资料库;利用支持向量机和长短期记忆神经网络模型分别开展见水波及识别和剩余油分布预测训练,搭建剩余油预测模型,实现在输入储层物性参数、油水流动特征参数和生产参数的情况下,简单快速预测油藏平面剩余油分布的目的。测试表明,新预测模型计算的剩余油饱和度与数值模拟计算结果相比,预测准确率达到96%。  相似文献   

13.
机器学习中的神经网络模型,具有强大的数据分类和图形识别功能,在统计物理尤其是相变领域得到了非常广泛的应用.本文综述了近年来机器学习算法在主要相变模型中的应用进展.首先,介绍了主流机器学习算法的背景知识,及应用在平衡相变中的开创性工作.其次,以一个典型的非平衡相变模型——有向逾渗为例,详细介绍了课题组运用监督、无监督和半监督学习在相分类、临界点预测、临界指数测量的一些最新研究结果.接着阐述了机器学习算法在量子多体、软物质物理以及高能物理等领域中相变研究的相关工作.最后进行了相应讨论与展望.  相似文献   

14.
该文探讨了基于大数据技术的机器学习算法,基于大数据进行机器学习的模型提高了算法的准确性,机器学习实现分析更高级别的数据,基于Spark+Hadoop处理技术的机器学习适应迭代式机器学习模型的特定需求,机器学习分析数据中的关系获得规律预测新样本。对数据进行收集、统计和分析的大数据系统引入机器学习进行大数据计算,机器学习的深度和广度也提升了大数据分析效率。  相似文献   

15.
太阳物理研究已经进入大数据时代,而机器学习作为大数据研究的一种良好工具已经获得越来越多的认可.本文评述了自2007年以来机器学习在太阳物理中的应用.从结果上看,最近4年这一领域的研究明显增加.所利用的数据包括地面和空间的各种仪器、各种类型和波段的太阳观测资料.研究领域涵盖太阳耀斑、日冕物质抛射、太阳黑子等太阳物理研究的主要方面.目前虽然获得一些很好的结果,但尚未有突破性的进展.使用的机器学习方法涉及分类、回归、聚类、降维以及深度学习等手段,但经典的算法,尤其是分类方法依然占据主导地位.这意味着机器学习在太阳物理的应用还处于起步阶段,但同样也意味着在这一领域还有很多工作可以深入开展.  相似文献   

16.
后基因时代,探索和解释隐藏在分子生物学数据库中的有用信息是对生物信息学研究人员的巨大挑战!为了解决分子生物学中遇到的这些难题,有效厦廉价的方法是非常必要的.机器学习是一个崭新的计算机应用领域,而生物信息学是生物学与计算机科学以厦应用数学等学科相互交叉而形成的一门新兴学科.本文分析了机器学习技术的内容,介绍了生物信息学的内涵和新的应用技术,同时探索了机器学习技术对生物信息挖掘应用的途径.这些方法有助于加速生物分子结构预测、基因发现、基因组学和蛋白组学等方面的研究进展.  相似文献   

17.
机器学习方法及其在生物信息学中的应用   总被引:1,自引:0,他引:1  
分析了机器学习技术的内容,介绍了生物信息学的内涵和新的应用技术,同时探索了机器学习技术对生物信息挖掘应用的途径.这些方法有助于加速生物分子结构预测、基因发现、基因组学和蛋白组学等方面研究的进展.  相似文献   

18.
准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密气藏分段压裂水平井产能预测方法,该方法综合利用已收集的地质、压裂水平井产能及钻完井等多类型数据,通过机器学习算法直接挖掘数据内部规律,建立产能预测模型。此外,为解决常规机器学习模型的“黑盒子”问题,还利用SHAP(SHapley Additive exPlanations)方法对建立的机器学习模型进行全局和局部解释,分析影响产能的主要因素,增加了模型的可信性和透明度。以苏里格气田苏东示范区为例,验证了该方法的有效性和实用性。与油气藏数值方法相比,该方法不仅提高了产能预测的精度,而且缩短了建模周期,加快了计算速度。  相似文献   

19.
机器学习作为大数据时代实现数据分析及挖掘的主要工具被广泛研究及使用。时序数据预测一直是数据挖掘中的重点及难点,基于机器学习的时序数据预测方法主要分为线性预测方法和非线性预测方法。线性预测方法计算简单,容易建模,适用于短期的时序数据预测;非线性预测方法涵盖广泛,能够很好地捕捉时序数据之间的非线性关系,能够更好地对时序数据进行预测。本文将以股票时序数据预测为例,对时序数据预测方法进行详细介绍,重点分析非线性预测方法,并探讨其未来的发展趋势。  相似文献   

20.
基于Lie群的机器学习理论框架   总被引:5,自引:0,他引:5  
借用具有良好数学结构的Lie群来研究机器学习,提出了基于Lie群的机器学习(ML)基本概念、对偶空间学习概念等,形成了基于Lie群的学习理论框架.该理论框架可以用代数和几何的方法来描述机器学习系统,弥补了原有机器学习理论的不足.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号