期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张阳张涛陈锦王禹邹琪《北京理工大学学报》2019,39(12):1258-1262

网络入侵检测已经广泛运用机器学习模型,但是研究者们多关注模型选择和参数优化,很少考虑数据不平衡的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE （synthetic minority oversampling technique）数据再平衡算法为研究重点,应用入侵检测数据集KDD99作为原始训练集,使用简单抽样和SMOTE算法生成再平衡训练集.采用多种机器学习模型分别在原始训练集和再平衡训练集进行5折交叉验证.实验结果表明,与原始训练集相比,使用再平衡训练集建模能够在不降低甚至提高多数类样本识别效果前提下,使少数类样本的识别准确率和召回率增强10%～20%.因此,SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用. 相似文献

2.

基于卷积神经网络-双向长短期记忆网络的人体活动识别方法

孙彦玺陈继斌武东辉《科学技术与工程》2022,22(4):1517-1525

针对人体活动传感器数据的时序性特点,以及当前机器学习算法过度依赖手工特征提取的问题,提出了一种融合卷积神经网络和双向长短期记忆网络的深度学习模型(convolutional neural network-bidirectional long short term memory network,CNN-BiLSTM)进行... 相似文献

3.

针对不平衡数据集的入侵检测算法

陈美霞郭躬德黄杰刘永芬《福建师范大学学报(自然科学版)》2010,26(4)

采用少类样本合成过采样技术(SMOTE)与二叉树多类支持向量机(BTSVM)相结合的入侵检测算法来解决实际应用中经常遇到的类别不平衡的分类问题.该方法首先对不平衡类别的训练集使用BTSVM分类,然后对求出各分类器中的支持向量使用SMOTE方法进行向上采样,最后用不平衡类别的测试集在新的分类模型中进行测试.实验结果表明本算法能够有效地提高不平衡数据集的分类性能. 相似文献

4.

基于OS-ELM和SDAE的Wi-Fi入侵检测方法

刘明峰侯路郭顺森韩然赵宇飞《北京交通大学学报(自然科学版)》2019,43(5)

为解决大多数Wi-Fi网络入侵检测方法实时性差、误报率高等问题,提出一种基于在线序列极限学习机(OS-ELM)的实时Wi-Fi网络入侵检测系统模型.首先,考虑到实验样本数据中正常与异常数据极不平衡的问题,采用SMOTE算法对数据样本中的异常数据和正常数据进行平衡处理操作,使分类器的分类效果不受样本数据集中多数类样本的影响.然后使用栈式降噪自编码网络(SDAE)对平衡后的数据进行降维,消除无关或冗余特征降低检测建模规模,避免维度灾难.最后,在AWID数据集进行处理并输入到OS-ELM分类器中,结果表明:与其他基于浅层学习算法的检测方法相比,所提方法可有效地精简数据特征,降低了检测时间,同时在检测精度和误报率方面也体现出了更优性能. 相似文献

5.

改进的KNN分类异常点检测方法

朱林杰赵广鹏康亮河《甘肃科技纵横》2022,51(1):8-11

针对入侵检测中异常点误报率较高的问题,提出了改进KNN与异常点检测算法相结合来处理数据的方法,以降低入侵检测误报率.该方法首先采用卡方特征选择方法进行数据特征选择,其次采用孤立森林、距离、局部异常因子(IDL)结合查找出异常点,然后使用SMOTE平衡数据,使得所有的样本达到一个类平衡状态,再采用KNN分类.最后采用公开... 相似文献

6.

面向不平衡数据集融合Canopy和K-means的SMOTE改进算法

郭朝有许喆马砚堃曹蒙蒙《科学技术与工程》2020,20(22):9069-9074

针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。相似文献

7.

融合DBN和BiLSTM的工业互联网入侵检测方法

胡向东盛顺利《重庆邮电大学学报(自然科学版)》2022,34(1):134-146

针对当前工业互联网的攻击行为复杂,其网络数据具有海量、高维、时序性和非线性等特征,导致传统入侵检测方法的特征提取困难、检测率低、泛化能力差等问题,提出一种融合深度信念网络(deep belief network,DBN)和双向长短时记忆网络(Bi-directional long short-term memory,B... 相似文献

8.

基于时间序列的异常检测算法的研究

臧晶张经纬《科技资讯》2023,(10):225-228

在时间序列数据下,针对传统的器件故障检测技术对不同的器件检测率低、小样本数据分类不平衡等问题,对数据异常检测准确率造成很大的影响。该文构建一种机器学习和深度学习相结合的时间序列异常检测算法,针对时间序列数据分类不平衡问题,引入合成少数类过采样技术（Synthetic Minority Oversampling Technique,SMOTE）,使得各类别之间的数据达到均衡状态,用最小绝对收缩和选择算法（Least Absolute Shrinkage and Selection Operator,LASSO）进行特征选择,从而得到对异常检测结果影响较大的特征项,最后,使用基于添加注意力机制的长短期记忆网络（Long Short-Term Memory,LSTM）作为异常检测分类器,完成基于时间序列异常检测算法的实现。相似文献

9.

基于SMOTE与LSTM的核电厂小样本不平衡故障诊断

黄学颖刘永阔单龙飞《应用科技》2022,(1):94-98

由于小样本不平衡数据的存在,对核电厂故障诊断准确率造成极大的影响,针对核电厂小样本不平衡的问题,文中提出一种合成少数类过采样技术(SMOTE)与长短期记忆(LSTM)深度神经网络相结合的算法进行核电厂小样本不平衡故障诊断,实验结果表明采用该方法进行故障诊断具有很高的诊断准确率. 相似文献

10.

CWGAN-DNN：一种条件Wasserstein生成对抗网络入侵检测方法

下载免费PDF全文

贺佳星王晓丹宋亚飞来杰《空军工程大学学报(自然科学版)》2021,22(5):67-74

针对现有的基于机器学习的入侵检测系统对类不平衡数据检测准确率低的问题,提出一种基于条件Wasserstein生成对抗网络(CWGAN)和深度神经网络(DNN)的入侵检测(CWGAN-DNN).CWGAN-DN N通过生成样本来改善数据集的类不平衡问题,提升对少数类和未知类的检测效率.首先,通过变分高斯混合模型(VGM)对原始数据中的连续特征进行处理,将连续特征的高斯混合分布进行分解;然后利用CWGAN学习预处理后数据的分布并生成新的少数类数据样本、平衡训练数据集;最后,利用平衡训练集对DNN进行训练,将训练得到的DNN用于入侵检测.在NSL-KDD数据集上进行的实验结果表明:利用CWGAN生成的数据进行训练,DNN的分类准确率和F1分数提升了5％,AUC下降了2％;与其他类均衡方法相比,CWGAN-DNN的准确率至少提升了3％、F1分数和AUC提升了1％. 相似文献

11.

基于分布式光纤传感系统的有载变压器故障检测技术研究

董贯雷姜晓东孙鹏杨光耿俊琪王家文渠帅黄胜王晨尚盈《山东科学》2023,(5):52-59

提出基于分布式光纤传感技术的人工神经网络有载变压器故障检测预报模型，通过人工模拟变压器的故障状态及正常运行状态，并通过k-means SMOTE数据扩充方法，可以有限扩充少量故障数据集，使故障数据量可以和正常数据量达到一致，将扩充后的故障数据与正常运行的数据一起送入长短期记忆卷积神经网络(convolutional neural networks long short term memory, CNN-LSTM)识别模型，最终可以将故障的识别率提升到100%,这对采用分布式光纤传感技术在有载变压器故障识别系统上的发展具有重要意义。相似文献

12.

结合特征选择的SAE-LSTM入侵检测模型

王文涛汤婕王嘉鑫《中南民族大学学报(自然科学版)》2022,(3):347-355

入侵检测系统(IDS)是计算机和通信系统中对攻击进行预警的重要技术.目前的IDS在安全检测方面存在2个问题:1)存在大量高维冗余数据及不相关特征干扰分类过程;2)现有模型多是针对早期网络攻击类型,对新型攻击适应性较差.针对这2个问题,提出了一种结合特征选择的SAE-LSTM入侵检测框架,采用融合聚类思想的随机森林特征打... 相似文献

13.

基于生成对抗网络的入侵检测类别不平衡问题数据增强方法

孙佳佳李承礼常德显高立伟《科学技术与工程》2022,22(18):7965-7971

数据类别不平衡问题是制约机器学习技术在入侵检测领域应用效果的重要因素。当训练数据不均衡时,训练得到模型的分类结果往往倾向多数类,从而极大影响分类效果。针对基于机器学习算法进行入侵检测时训练样本不均衡以及由于数据隐私性导致训练样本不足和更新慢的问题,提出一种基于生成对抗网络和深度神经网络相结合的入侵数据增强方法,以实现样本集的类别均衡。通过NSL-KDD数据集对模型评估,本文所提方法不仅具有较高的准确率,而且对未知攻击和只有少数样本的攻击类型具有较高的检测率。相似文献

14.

基于深度确定性策略梯度的热力站一次侧优化控制

李琦韩冰城《科学技术与工程》2019,19(29):193-200

针对热力站供热量与需求量不匹配的现象,提出一种基于深度确定性策略梯度(DDPG)的热力站一次侧优化控制方法。采用LSTM(long short term memory)算法对热力站进行建模,然后结合集中供热系统运行机理,使用DDPG控制算法对热力站一次侧供水流量序列求解。运用包头某热力站的大量历史工况数据,进行仿真实验,结果表明该方法的有效性,一定程度上实现了热力站的按需供热,提高热量的利用率。相似文献

15.

基于深度森林算法的分布式WSN入侵检测模型

董瑞洪闫厚华张秋余李学勇《兰州理工大学学报》2020,46(4):103

针对现有的特征选择算法和分类算法在无线传感器网络(WSN)入侵检测系统中检测性能表现不佳、检测实时性差、模型复杂度高等问题,提出一种基于随机森林和深度森林算法的分布式WSN入侵检测模型.该模型首先对传感器节点流量数据进行预处理;然后将轻量级随机森林分类器部署到传感器节点和簇头节点,传感器节点和簇头节点合作对流量数据进行处理,并在基站上采用深度森林算法从大量流量数据中发现攻击行为;最后对WSN中的入侵行为进行实时分类入侵检测.使用无线传感器数据集WSN-DS和NSL-KDD数据集来评估所提出的模型性能.实验结果表明,该模型与现有的入侵检测模型相比,具有良好的检测性能,实时性较高,可避免模型过度拟合. 相似文献

16.

基于蚁群聚类的不平衡数据过采样方法

高阳刘其成牟春晓《烟台大学学报(自然科学与工程版)》2021,(2):210-216

针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE.一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek ... 相似文献

17.

基于DBN-LSTM的滚动轴承剩余寿命预测模型

慎明俊高宏玉张守京王典《科学技术与工程》2021,21(31):13328-13333

针对滚动轴承退化数据的复杂性和传统的寿命预测方法不能充分利用数据的相关性从而导致预测精度不高的问题,提出了一种基于融合深度置信神经网络（deep belief neural , DBN）和长短时记忆神经网络（long-short term memory , LSTM）的剩余寿命预测模型。该模型首先采用带通滤波降噪对滚动轴承振动数据进行去噪,然后依据均方根特征和峭度特征在轴承全寿命周期内的趋势图确定模型的预测起始点;其次利用优化后的4层DBN网络完成深度特征提取并用于LSTM的训练与测试。通过轴承全寿命周期试验证明提出模型的可靠性,并且与传统LSTM、BP(back propagation)神经网络和DBN-BP模型的预测结果进行对比,验证了本文模型的有效性。相似文献

18.

基于混合采样和特征选择的改进随机森林算法研究

汪力纯刘水生《南京邮电大学学报(自然科学版)》2022,(1):81-89

随机森林算法是根据Bagging抽样和随机特征子集划分策略,由多棵决策树组成的集成算法。与其他分类算法相比,随机森林算法有更高的分类精度、更低的泛化误差以及训练速度快等特点,因此在数据挖掘领域得到了多方面的应用。然而随机森林算法在分类预测特征维度高且不平衡的数据时,分类性能受到了极大限制。为了更好地处理高维不平衡数据,文中提出了一种基于混合采样和特征选择的改进随机森林算法(Hybrid Samping&Feature Selection Random Forest, HF＿RF)。该算法首先从数据层面出发,通过SMOTE算法和随机欠采样相结合的方式对高维不平衡数据集进行预处理,同时引入聚类算法对SMOTE算法进行改进,提高对负类样本的处理性能;然后从算法层面出发,通过ReliefF算法对平衡后的高维数据赋予不同的权值,剔除不相关和冗余特征,对高维数据进行维度约简;最后采用加权投票原则进一步提高算法的分类性能。实验结果显示,改进后的算法与原算法相比,在处理高维不平衡数据方面的各评价指标更高,证明HF＿RF算法对于高维不平衡数据的分类性能高于传统随机森林算法。相似文献

19.

小样本不平衡设备数据下的机器学习策略研究

陈扬刘勤明梁耀旭《上海理工大学学报》2022,44(4):407-416

针对小样本数据样本容量不足与分布不平衡的设备寿命预测问题,构建基于改进SMOTE算法与改进KNN(K-NearestNeighbor)算法联合优化模型。首先,设置噪声比例系数β排除样本数据中的噪声,随后通过类B-SMOTE(Borderline-SMOTE)算法与传统SOMTE算法结合构建改进SMOTE(ISMOTE)算法对存在分布问题的少数类样本进行新增优化,避免因为样本分布不平衡以及样本数量较少引起的偏差。其次,针对分类过程中边界模糊的样本点,通过利用粒子群算法寻求每个样本种类中心点并计算样本距离均值建立分隔阈值■,对阈值范围内的样本点利用“投票法”判断样本种类,规避KNN算法在处理数据时因为不同种类样本混合而出现误差的问题。最后,通过利用美国卡特彼勒公司液压泵状态数据以及凌津滩水电站水导轴承振动数据进行仿真,算例证明上述两种改进算法在面对小样本不平衡设备数据时可以准确分析设备运行状态以及预测设备未来健康发展趋势。相似文献

20.

面向网络安全不平衡数据的特征学习和分类研究应用

韩凤董宗学军何戡连莲《科学技术与工程》2023,23(3):1130-1137

网络数据的正确分类对于网络环境的监控和维护具有重要作用。在数据不平衡状态下解决数据分类和处理复杂的特征关系尤为重要,为此提出一种改进SMOTE(synthetic minority over-sampling technique)+GA-XGBoost(genetic algorithm-extreme gradient boosting)的机器学习分类方法。将局部离群因子引入SMOTE插值过程,对少数类样本过采样,并对多数类样本随机欠采样,从而实现样本再平衡;同时,在模型训练过程中为增加模型拟合度,将具有进化迭代优势的遗传算法与XGBoost相结合,解决XGBoost参数众多、特征学习收敛较慢等问题。实验采用UNSW＿NB15数据集,选择多层感知机、K近邻、决策树等机器学习算法及SMOTE+XGBoost等不平衡数据训练方法进行试验对比,结果表明该方法具有较好的分类预测准确率(97.40%)及较高的平均召回率(70.2%)和平均F₁-score(68.8%)。并在本实验室工业信息安全平台采集的数据进行实验研究,分类准确率为99%,进一步验证了该方法的有效性和可行... 相似文献