首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 500 毫秒
1.
自动文本分类中类别特征提取是文本分类中的关键,传统特征提取算法存在特征提取不够准确,进而导致分类精度不高.为解决此问题,本文提出了一种有效的特征提取方法一基于滑动窗口的特征提取方法,用来构成文本分类的模型,该方法能扩大特征的提取范围.实验表明,改进后的分类模型可以有效地提高文本的分类精度。  相似文献   

2.
自动文本分类中类别特征提取是文本分类中的关键,传统特征提取算法存在特征提取不够准确,进而导致分类精度不高。为解决此问题,本文提出了一种有效的特征提取方法——基于滑动窗口的特征提取方法,用来构成文本分类的模型,该方法能扩大特征的提取范围。实验表明,改进后的分类模型可以有效地提高文本的分类精度。  相似文献   

3.
传统的机器学习方法在处理类别不平衡数据时分类性能较低,为此提出一种基于类别不平衡数据的层次分类模型.层次分类模型采用AdaBoost方法为基准分类器,以分类器误报率和特征建立数学模型,并证明层次分类模型的参数可以计算得到.首先以层次分类树为结构建立模型,接着针对层次分类树的结构模型进行分类代价计算,得到模型的代价与每层特征之间的定量数学描述,然后将该分类代价转换为优化问题并给出优化问题的求解过程,同时给出层次分类模型的计算结果.在UCI数据集上进行大量测试,以AUC和F-Measure为评价标准,相比于现有的不平衡分类方法,层次分类模型具有更优的分类性能.  相似文献   

4.
针对网络安全态势要素获取中大规模复杂攻击样本分类困难的问题,提出一种基于条件变分自编码网络的安全态势要素分类架构。该架构分为编码网络和生成网络两部分,均采用深度神经网络作为其基础框架。编码网络用于对高维数据进行降维,提取其隐含特征;生成网络用于对降维后的样本进行重构,生成新的样本。在生成网络中引入混合密度模型优化其特征提取能力,提高重构数据的准确性。采用训练数据对该架构进行训练,训练后的编码网络作为分类器,识别样本类型;生成网络生成指定类别的样本数据,以平衡复杂样本中各类攻击样本的数量,提高分类精度。仿真结果表明,与其他对比模型相比,所提分类架构具有较好的降维效果和较高的态势要素分类精度。  相似文献   

5.
提出XGBoost-ESN组合模型股价预测方法.使用网格搜索法对XGBoost模型和ESN模型进行参数优化并改进模型结构,利用最小二乘法联合XGBoost和ESN进行数据预测.测试结果表明,改进的XGBoost-ESN组合模型能有效减少预测误差,对股票价格预测的精度更高.  相似文献   

6.
为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法 .该方法通过引入信息熵及修正因子,缓解了数据不平衡对分类准确率及召回率造成的不良影响.实验结果表明:所提出的分类方法在准确率及召回率上与word2vec均值模型相比,分别提高7.3%及10.5%.  相似文献   

7.
为提高XGBoost算法预测精度,采用布谷鸟搜索算法全局优化XGBoost的超参数包括学习率、输出结点分裂的最小损失、树模型的最大深度和弱学习器的数量,构建CS-XGBoost模型训练数据集。实验结果表明,基于CS-XGBoost的收入分类模型的准确率、精确率、F1分数和AUC等指标分别为95.67%、97.17%、95.56%和97.96%,均优于Logistic回归、支持向量机、随机森林、XGBoost算法和基于网格搜索的XGBoost算法;基于CS-XGBoost的房价预测模型的决定系数、均方根误差及平均绝对误差分别为0.905 5、2.943 5及2.165 4,预测精度较XGBoost算法得到显著提升。  相似文献   

8.
采用三角形函数隶属度法确定模糊最小二乘支持向量机(fuzzy least squares support vector machine,FLS-SVM)输入参数隶属度,采用自适应变尺度混沌免疫算法优化FLS-SVM的参数,从而构建改进模糊最小二乘支持向量机(improved fuzzy least squares support vector machines,IFLS-SVM)分类辨识模型,用Ripley数据集、MONK数据集和PIMA数据集进行仿真实验,并用于地下金属矿山采场信号分类辨识与中国国际贸易安全分类辨识。研究结果表明:与LS-SVM分类辨识模型和FLS-SVM分类辨识模型相比,IFLS-SVM分类辨识模型能有效提高带噪声点和异常点数据集的分类精度,且分类辨识精度相对误差较小。  相似文献   

9.
一种基于级联模型的类别不平衡数据分类方法   总被引:6,自引:0,他引:6  
真实世界问题中,不同类别的样本在数目上往往差别很大,而传统机器学习方法难以对小类样本进行正确分类,若小类的样本是足够重要的,就会带来较大的损失.因此,对类别分布不平衡数据的学习已成为机器学习目前面临的一个挑战.受计算机视觉中级联模型的启发,提出一种针对不平衡数据的分类方法BalanceCascade.该方法逐步缩小大类别使数据集趋于平衡,在此过程中训练得到的一系列分类器通过集成方式对预测样本进行分类.实验结果表明,该方法可以有效地提高在不平衡数据上的分类性能,尤其是在分类性能受数据的不平衡性严重影响的情况下.  相似文献   

10.
类别不平衡数据的分类问题是数据挖掘及机器学习过程中的一个研究热点,基于代价敏感学习方法通常用于解决类别不平衡数据分类问题,然而,它在实际应用过程中通常因样本的误分类成本未知而受到限制.针对此问题,文中采用群体智能算法优化样本的误分类代价.果蝇优化算法(Fruit fly optimization algorithm,FOA)是一种全局优化群智能算法,该算法具有原理简单、调节参数较少、收敛速度较高等优点.本研究首先提出了一种基于动态调整寻优步长的果蝇优化算法;其次,利用此果蝇优化算法良好的全局和局部搜索性能,对类别不平衡数据中样本的误分类代价进行了优化;最后,将改进果蝇优化算法学习样本误分类代价的策略应用到乳腺组织数据集的分类研究中.实验结果表明,本算法对类别不平衡数据的分类结果较好,能够有效的识别正、负两类样,解决了因误分类成本的先验信息无法直接获取而使基于代价敏感的不平衡数据分类方法使用受限的问题.  相似文献   

11.
研究了隧道监控量测结果在围岩动态分级中的应用.通过对隧道监测数据的统计分析,得出了对围岩动态分级具有意义的指标和各级围岩所对应的各指标的数值范围,用以指导施工阶段的隧道围岩动态分级、隧道的反馈设计和施工过程中的预测预报.实例证明,准确的隧道监测数据可以进一步完善和优化围岩分级,提高围岩分级的可靠性,为隧道围岩动态分级提供了一条新的途径.  相似文献   

12.
位于我国西北部的东天山地区,拥有着复杂的地质条件,因此如何快速准确预测隧道掌子面前方的围岩质量的难度增大,有一种能准确客观反映岩体基本特性的围岩分类,是隧道设计与施工的重要参考依据。本文旨在建立一种能客观准确评价东天山地区工程地质环境及预测围岩等级的方法,依托在建东天山隧道项目,选取东天山特长隧道已开挖典型地质区段,以工程地质分区、高关联度物探技术参数指标及物探偏移图像为基础,组成机器学习训练样本;并采用 Python 语言基于TensorFlow深度学习框架编写深度学习网络算法训练样本,建立围岩类别预测模型,并采用新开挖段数据不断验证与优化模型,最后将预测精度最高的模型推广应用于天山地区隧道围岩类别预测,结果表明用TST偏移图像+地质分区+物探指标数据集训练出来的模型效果最好。  相似文献   

13.
Nowadays aviation accidents have become one of the major causes of severe injuries and fatalities around the world. This attracts the research community to look into aviation safety by applying data analysis techniques based on an advanced machine learning algorithm. An ensemble classification model based on Aviation Safety Reporting System(ASRS) has been proposed to analyze aviation safety targeting the people injured in the system.The ensemble classification model shall contain two modules: the data-driven module consisting of data cleaning, feature selection,and imbalanced data division and reorganization, and the modeldriven module stacked by Random Forest(RF), XGBoost(XGB),and Light Gradient Boosting Machine(LGBM) separately. The results indicate that the ensemble model could solve the data imbalance while vastly improving accuracy. LGBM illustrates higher accuracy and faster run in the analysis of a single model of the ASRS-based imbalanced data, while the ensemble model has the best performance in classification at the same time. The ensemble model proposed for imbalanced data classification can provide a certain reference for similar data processing while improving the safety of civil aviation.  相似文献   

14.
吴松锋  刘忠  李奇  胡丰产 《科学技术与工程》2022,22(35):15775-15783
富水隧道的施工中往往采用帷幕注浆法对围岩进行堵水加固,需准确获取富水深埋隧道帷幕注浆法加固后隧道围岩的位移场与应力场大小;基于流固耦合理论,建立隧道注浆帷幕力学模型,推导了围岩位移与有效应力的解析式;以大瑞铁路某富水深埋隧道为工程背景,采用建立的力学模型计算了6种加固方案,并分析了围岩剪切模量和弹性系数对位移场与应力场变化的影响;通过与有限元数值模拟结果以及现场监测结果对比,验证所建立力学模型的准确性。研究结果表明:所建立的力学模型可较为准确地计算帷幕注浆法施工的隧道围岩位移与有效应力;较大的剪切模量和弹性系数可抑制围岩位移,但会增大围岩的径向和环向有效应力。  相似文献   

15.
现阶段隧道围岩分级工作主要在勘察设计阶段进行,但由于受周边环境及勘察手段的限制,分级结果往往与围岩实际情况不符。为准确获得隧道围岩等级,基于声波-回弹联合测试法,建立"BP神经网络模型"在施工阶段快速预测岩石强度(R_c),利用掌子面炮孔进行岩体纵波波速测试并通过公式计算完整性系数(K_v)后,得到基于岩体基本质量指标(BQ)的施工阶段围岩快速分级法,并以宝汉高速石门隧道为依托在施工阶段对围岩进行分级。结果表明:建立的BP神经网络预测模型可实现岩石强度的现场快速无损预测,预测结果具有较高准确度;根据岩体纵波波速测试结果,可实现岩体完整性系数的定量计算,进而完成石门隧道施工阶段围岩快速分级,对比勘察阶段的分级结果,施工阶段所获得的分级结果更加精确。  相似文献   

16.
为确定公路隧道施工过程中塌方风险等级,选取工程地质等4项一级指标,围岩级别等12项二级指标,建立熵权-改进灰色关联的公路隧道塌方风险评价模型。采用熵权法计算评价指标权重;采用改进灰色关联法确定各段隧道与隧道塌方各风险等级的关联度,并与所求得的权重相结合确定最终的风险等级,并将结果与工程实例相印证。结果表明:公路隧道塌方的12项风险因素中,年均降水量、隧道跨度、围岩级别、隧道埋深对隧道塌方影响较大;采用本文模型对四段隧道进行评价,评价结果均与实际相符。可见该评价模型为在建隧道施工塌方风险等级的确定与预防提供了科学而有效的依据。  相似文献   

17.
以明垭子软岩隧道为工程依托,结合现场围岩岩性应用理论分析得出隧道围岩变形的理论极限位移,通过FLAC数值模拟软件建立相应的计算模型,分析了现场施工引起的隧道围岩变形值,根据位移评判依据来评判隧道的稳定性,通过现场监测分析明垭子隧道围岩的变形特点。研究结论对软岩隧道的安全施工有一定的参考价值。  相似文献   

18.
围岩纵向变形曲线能直观、有效地反映隧道开挖过程中洞壁围岩变形受掌子面前端“空间效应”的影响,为支护结构施作的最佳时机提供理论依据。以某软岩大断面隧道为例,基于Unlu和Gercek推导围岩纵向变形曲线方程(位移释放系数),在综合考虑泊松比和弹性模量以及粘聚力、内摩擦角、爆破参数等提出优化改进;运用FLAC3D分析改进围岩纵向变形曲线方程的合理性和有效性。结果表明:(1)围岩纵向变形曲线方程与弹性模量以及粘聚力、内摩擦角呈非线性正比关系,与爆破参数呈非线性反比关系;(2)对比现场监测数据与理论计算数据发现Unlu和Gercek推导围岩纵向变形曲线方程在x>=0段偏差较大,提出增加“扩大收敛函数”提高其精度,相关系数由原来的R-square=0.8左右,提高到R-square=0.95左右;(3)通过与数值模拟数据对比,改进后的围岩纵向变形曲线方程能更好的与其相吻合,证实了改进后的围岩纵向变形曲线方程更具有合理性和实用性;(4)提出围岩位移增量出现陡增点时的位移释放系数值为施加支护的最佳时机,得出Ⅲ级围岩在长台阶法施工施作时,距掌子面x=2.24m左右处开始施作支护为最佳,Ⅳ级围岩在采用CRD工法施作时,距掌子面x=1.47m左右处开始施作支护为最佳。  相似文献   

19.
地震属性可以用来解释与预测地质构造,因此地震属性被广泛地运用在煤矿地质构造的识别。但一般情况下,勘探区中无构造区域与有构造区域分布不均衡,无构造区域远远多于有构造区域。机器学习中,传统的分类器更习惯于偏向多数类,这使得如何有效地识别出构造体成为一个难题。为了解决这一问题,提出了一种针对不平衡数据集的改进极限梯度提升(extreme gradient boosting, XGBoost)构造识别方法。该方法的原理是,首先,以基于三维地震勘探成果数据体提取的12种地震属性为数据集特征,以实际揭露后的地质构造为数据集标签构建多属性数据集,然后以特征对标签的相关性为标准,过滤掉冗余的特征;其次,将边界样本分类算法(boundary sample classification, BSC)与合成少数类过采样技术(synthetic minority over-sampling technique, SMOTE)相结合形成BSC-SMOTE算法。用BSC-SMOTE算法对原始数据集进行平衡,再利用平衡后的数据集训练XGBoost分类器,并用贝叶斯优化(Bayesian optimization, B...  相似文献   

20.
隧道围岩变形量预测的灰色模型应用比较研究   总被引:16,自引:0,他引:16  
隧道施工过程中的围岩变形监测是掌握围岩的动态信息、确保施工期间隧道稳定性的重要手段.围岩位移预测则是支护形式、支扩参数设计恰当与否和了解运营以后隧道长期稳定性的关键所在.传统预测方法有基于岩体力学理论的计算方法、基于实测值的拟合方法等,本文通过以实际工程原始数据列作为参考数列,建立围岩预测量测数据的灰色预测预测模型以及3种GM(1,1)改进模型,并通过比较结果及关联度分析发现,一般的GM(1,1)灰色预测模型适用于围岩变形量的短期预测,更新递增模型和新陈代谢模型在作较长期预测时,预测精度更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号