期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王太勇王廷虎王鹏乔卉卉徐明达《天津大学学报(自然科学与工程技术版)》2020,(6):601-608

状态监测与故障诊断是保证机械设备安全稳定运行的必要手段.本文提出一种基于注意力机制双向LSTM网络(ABiLSTM)的深度学习框架用于机械设备智能故障诊断.首先,将传感器采集的设备原始数据进行预处理,并划分为训练样本集与测试样本集;其次,训练多个不同尺度的双向LSTM网络对原始时域信号进行特征提取,得到设备故障多尺度特征;再次,通过引入注意力机制,对不同双向LSTM网络提取特征的权重参数进行优化,筛选保留目标特征,滤除冗杂特征,以实现精准提取有效故障特征;最后,在输出端利用Softmax分类器输出故障分类结果.通过利用发动机气缸振动实验数据和凯斯西储大学滚动轴承实验数据进行故障诊断实验,故障识别准确率均达到99%以上.实验结果表明,ABiLSTM模型可以实现对原始时域信号的多尺度特征提取和故障诊断,通过与深度卷积网络(CNN)、深度去噪自编码器(DAE)和支持向量机(SVM)等方法进行对比,ABiLSTM模型的故障识别性能优于各类常见模型.另外,通过利用凯斯西储大学滚动轴承在不同工况条件下的数据,对ABiLSTM模型进行泛化性能实验,变工况样本的故障识别准确率仍然能够达到95%以上. 相似文献

2.

短期风力发电负荷预测的新方法

姜旭初许宇澄宋超《北京师范大学学报(自然科学版)》2022,58(1):39-46

以陆上风力发电负荷数据作为研究对象,将注意力机制引入双向长短期记忆与卷积神经网络（CNN）的混合模型来预测短期电力负荷．结果显示:1）注意力机制通过对不同时步的输入进行加权,能够显著提升双向长短期记忆网络的预测性能;2）双向长短期记忆网络-CNN结构比CNN-双向长短期记忆网络结构更适用于短期负荷预测,前者相较后者能够充分利用时序信息,不会在输入初期就丢失关键信息;3）基于注意力机制的双向长短期记忆网络-CNN混合模型的均方根误差（RMSE）、平均绝对百分比误差（MAPE）分别达到了575.35和7.02%,比次佳模型（基于注意力机制的双向长短期记忆网络-CNN混合模型）分别降低了2.75%和9.65%,其在风电短期负荷预测方面有很好的应用前景．相似文献

3.

基于双层注意力机制的联合深度推荐模型

刘慧婷纪强刘慧敏赵鹏《华南理工大学学报(自然科学版)》2020,48(6):97-105

许多电子商务网站中存在用户编写的大量评论信息,大部分推荐系统虽然利用了评论信息,但仅从单词级别而不是评论级别来评估评论的重要性。如果只考虑评论中的重要单词,而忽略了真正有用的评论,则会降低推荐模型的性能。基于此,文中提出了一种基于双层注意力机制的联合深度推荐模型(DLALSTM)。该模型首先利用双向长短期记忆网络(BiLSTM)分别对用户和项目评论进行词以及评论级别联合建模,并通过两层注意力机制聚合为评论表示和用户/项目表示,然后把从评论中学习的用户和项目的潜在表示融入由评分矩阵得到的用户偏好和项目特征,实现评分预测。采用文中模型在Yelp和亚马逊的不同领域数据集上进行实验评估,并与常用的推荐方法进行比较,发现文中提出的模型性能超过目前常用的推荐方法,同时该模型能够缓解数据稀疏问题,且具有较好的可解释性。相似文献

4.

基于自注意力机制与BiLSTM的短文本匹配模型

胡怡然夏芳《武汉科技大学学报》2023,(1):75-80

现有短文本匹配方法更多关注于句子之间的交互方式,而较少考虑短文本自身关键特征的提取,为此本文提出一个融合自注意力机制和双向长短期记忆网络(BiLSTM)的短文本匹配模型。首先利用BiLSTM和自注意力机制进行特征编码,通过残差连接缓解信息丢失问题;然后利用双向注意力网络进行特征交叉,得到考虑了两个短文本之间交互影响的编码形式;最后将自注意力编码与双向注意力编码进行拼接,既能保留句子本身的重要特征,又能得到交互的特征信息。在两个公开数据集Quora和MRPC上进行对比实验,结果表明,该模型能有效改善短文本匹配性能,特别是在Quora数据集上的准确率达到87.59%,明显优于其他6种常见的同类模型。相似文献

5.

基于注意力机制和双向长短期记忆网络的电能质量扰动识别

王以忠栾振国郭肖勇许素霞侯勇《天津科技大学学报》2021,(4):51-56

提出一种基于深度学习的电能质量扰动信号分类新方法.该方法应用注意力机制和双向长短期记忆网络构建分类模型,并利用Matlab仿真产生训练数据集与验证数据集.考虑了7种常见的复合扰动信号,并将其作为序列数据直接输入到网络中进行训练和验证.实验结果表明,本方法能准确地识别不同的扰动信号,在验证集上模型的识别准确率可以达到99... 相似文献

6.

融合多模态的虚假新闻检测

吴娇汪可馨许锟《哈尔滨商业大学学报(自然科学版)》2023,(1):47-52

在社交媒体高速发展方便信息交流的同时,虚假新闻也在网络上大量传播,对社会稳定造成了很大的影响.针对当前虚假新闻检测工作大多充分考虑虚假新闻中新闻文本内容而忽略图像内容的问题,提出了一种基于注意力的BiLSTM-CNN多模态虚假新闻检测模型.该模型首先使用双向长短期记忆神经记忆网络(BiLSTM)提取文本内容特征,使用卷积神经网络(CNN)提取图像语义特征,利用注意力机制(Attention)层对提取的内容特征信息分配相应的权重,再将两种特征融合以形成重新参数化的多模态特征作为输入进行虚假新闻检测.实验表明,该方法达到了98.3%的正确率. 相似文献

7.

基于注意力机制的LSTM长江汛期水位预测方法研究

王迎飞黄应平肖敏熊彪周爽爽靳专《三峡大学学报(自然科学版)》2022,(3):13-19

为提高长短期记忆网络(Long Short-Term Memory,LSTM)在水位预测任务中的准确性,以及提高LSTM对数据中时空信息的利用率,本文提出了一种基于Softmax函数的注意力模块,并将其应用在LSTM的输入前,使模型可以根据输入数据中的时间和空间信息,自主地生成带有权重的词义向量,并赋予输入序列时间和空... 相似文献

8.

基于多特征融合的股票走势预测研究

刘月娟王武《云南民族大学学报(自然科学版)》2022,(2):227-234

为了更好地对股票走势进行预测,提出了一种在原有BiLSTM基础上引入注意力机制的股票预测模型,该模型不仅将股票交易数据作为模型输入,同时考虑到金融新闻对股价的影响.针对Reddit中苹果公司2010年到2018年间每日的新闻标题进行了研究,模型的输入特征来自于3部分：一是从文本数据中提取出的语义特征,二是股票的历史交易数据,三是从文本数据中提取出的情感特征,最后将上述输入特征融合到一起放入BiLSTM+Attention模型中进行训练,达到对股票的次日收盘价预测的效果.最终对5个模型进行对比实验,评价指标结果表明,提出的模型较其他模型相比预测效果更好. 相似文献

9.

基于Hyperband-CNN-BiLSTM模型的车辆油耗预测方法

下载免费PDF全文

吐尔逊·买买提孙慧刘亚楼《科学技术与工程》2025,25(9):3896-3904

为了有效地预测车辆的燃油消耗,提高燃油经济性并推动节能减排,提出一种基于Hyperband-CNN-BiLSTM的机动车油耗预测方法。首先基于实际道路测试收集到的车辆运行状态数据和油耗数据,分析了影响车辆油耗的显著性因素;其次结合卷积神经网络（convolutional neural network, CNN）强大的特征提取能力和双向长短期记忆网络（bidirectional long short-term memory, BiLSTM）在处理时序数据方面的优势,构建了基于CNN-BiLSTM的车辆油耗预测组合模型;然后,为提高模型预测准确性,通过Hyperband优化算法对组合模型进行优化,并将车辆油耗影响因素作为模型输入特征,对模型进行训练,实现对车辆油耗的建模和预测;最后,选取CNN、LSTM、BiLSTM、CNN-LSTM、CNN-BiLSTM作为对比模型,对Hyperband-CNN-BiLSTM预测模型效果进行评价。结果表明,相较于其他模型,Hyperband-CNN-BiLSTM模型的平均绝对误差（mean absolute error, MAE）和均方根误差（root mean squared error, RMSE）最小,分别为0.057 69和0.119 25,R²最大,为0.991 76,模型预测效果最佳。相似文献

10.

基于模糊逻辑的FBiLSTM-Attention短期负荷预测

下载免费PDF全文

张岩康泽鹏高晓芝杨楠王昭雷《河北科技大学学报》2025,46(1):41-48

针对电力负荷数据由于受多种因素的影响具有高度不确定性的问题,将负荷数据的不确定性与深度学习算法相结合,提出了一种基于模糊逻辑的FBiLSTM-Attention短期负荷预测模型,以提高负荷预测的精度。首先,对原始数据进行数据预处理,包括缺失值填充、相关性分析及数据归一化;其次,通过K-Means聚类将每个特征的数据转换成模糊规则引入模糊逻辑的处理,同时,模型结构方面采用双向长短期记忆网络(BiLSTM)和注意力机制(Attention);最后,对所提方法和传统的LSTM与BiLSTM-Attention模型的预测结果进行对比。结果表明,结合了模糊逻辑的模型精确度和鲁棒性都有了明显的提升,具有更好的预测性能。所提模型可以有效提高处理不确定性数据的能力,为负荷预测研究提供了参考。相似文献

11.

基于Attention机制和ResNet的CNN-BiLSTM短期电力负荷预测模型研究

王立则谢东周立峰王汉青《南华大学学报(自然科学版)》2023,(1):33-39, 86

短期电力负荷预测有利于电力系统的高效运行,对电力市场实现有效调度有重要意义。短期电力负荷受多种因素影响,波动性大、随机性强,使得其预测准确率低。双向长短期记忆网络和卷积神经网络难以在短期负荷序列中提取足够多的信息,本文提出了一种结合注意力机制和残差网络的卷积神经网络-双向长短期记忆网络短期负荷预测方法。首先利用基准模型卷积神经网络-双向长短期记忆网络对输入特征进行信息提取,然后利用注意力机制突出提取到的关键信息,最后通过残差网络创建残差层以充分学习时序特征。通过某公开数据集进行实验,结果表明该方法的平均绝对百分比误差达到2.80%,均方根误差达到2.15,并与常用的五种模型预测结果对比,验证了所提模型的准确性及有效性。相似文献

12.

基于注意力机制优化长短期记忆网络的短期电力负荷预测

王健易姝慧刘浩王春枝刘俭汪根荣《中南民族大学学报(自然科学版)》2023,(1):73-81

在电力系统的经济调度中,如何合理利用电力负荷的过去和现在来推测其未来价值,具有非常长远的社会经济价值.短期电力负荷数据具有明显的时间特征,传统的深度模型越来越多地应用于该领域.然而,深度模型可能存在梯度爆炸或梯度消失,为此,提出了一种注意力机制优化长短期记忆网络的短期负荷预测模型.该模型将长短期记忆网络单元中的激活函数改进为加权激活函数组,并加入注意力机制以提高预测精度. 相似文献

13.

基于Attention机制的LSTM股价预测模型

林昕朱小栋《重庆工商大学学报(自然科学版)》2022,39(2):75-82

针对时间序列分析方法和神经网络对于股价预测具有一定局限性的问题,将基于Attention机制的LSTM模型应用于股价预测;以2014-01-02—2020-09-22日的上证工业指数、上证环保指数等相关数据为样本,在LSTM模型中引入Attention机制,使模型聚焦于重要的股价特征信息,预测股票第二日的最高价;实证研... 相似文献

14.

基于注意力机制结合CNN-BiLSTM模型的电子病历文本分类

下载免费PDF全文

李超凡马凯《科学技术与工程》2022,22(6):2363-2370

为了解决中文电子病历文本分类的高维稀疏性、算法模型收敛速度较慢、分类效果不佳等问题,提出了一种基于注意力机制结合CNN-BiLSTM模型的病历文本分类模型。该模型首先使用word2vec工具进行词向量表示,利用多层卷积神经网络(convolutional neural networks, CNN)结构提取病历文本的局部特征,通过拼接操作丰富局部特征表示,再利用双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)提取上下文的语义关联信息,获取句子级别的高层特征表达。最后通过Attention机制进行特征加权,降低噪声特征的影响,并输入softmax层进行分类。在多组对比实验的实验结果表明,该模型取得了97.85%的F₁,有效地提升了文本分类的效果。相似文献

15.

基于CNN-ATTBiLSTM的文本情感分析

刘书齐王以松陈攀峰《贵州大学学报(自然科学版)》2019,36(2)

卷积神经网络(CNN)和循环神经网络(RNN)已经被证明在文本情感分析中是有效的文本表示模型。然而,CNN只考虑连续词之间的局部信息,忽略了词语之间长距离的上下文依赖信息,在前向传播的过程中池化操作会丢失一部分语义信息; RNN在文本长度较短的情况下相比CNN并没有展现应有的优势。本文通过融合CNN和基于注意力机制的双向长短期记忆(ATTBiLSTM)网络提取的特征,提高模型的文本表示能力,同时为了防止过拟合,采取dropout策略。在中科院谭松波博士整理的酒店评论数据集上进行实验,结果表明本文提出的模型相比基线模型可以提取出更丰富的特征,效果较基线模型有所提升。相似文献

16.

基于ERNIE与多特征融合的中文命名实体识别

陈克金叶善力《浙江科技学院学报》2023,(5):421-429+456

【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integration, ERNIE)与多特征融合的实体识别方法。【方法】首先,通过预训练模型ERNIE获得词向量;然后将词向量并行输入双向长短时记忆网络(bidirectional long short-term memory network, BiLSTM)与膨胀卷积神经网络(iterated dilated convolutional neural network, IDCNN)中提取特征,再将输出特征向量进行融合;最后通过条件随机场(conditional random field, CRF)解码获取最佳序列。【结果】本研究所提出的模型优于其他传统模型,在微软亚洲研究院(Microsoft Research Asia, MSRA)数据集上的F₁值达到了95.18%,相比基准模型BiLSTM-CRF F<... 相似文献

17.

基于数据增强技术与CNN-BiLSTM-Attention的油田注水流量预测及效果

下载免费PDF全文

李艳辉王衍萌《科学技术与工程》2023,23(32):13896-13902

准确识别地层注水情况是油田开发的重要前提,对制定合理的注水发展规划也具有重要的指导意义。为准确预测注水,提出一种结合卷积神经网络、双向长短期记忆网络与注意力机制的油田注水流量预测方法,该方法首先将卷积神经网络(convolutional neural network,CNN)和双向长短期记忆网络(bidirection long short-term memory,BiLSTM)进行联合,用于捕获注水流量的复杂非线性时空关系,然后采用注意力机制来关注输入的重要特征。并针对油田历史数据匮乏问题,提出使用数据增强技术来增加一维时间序列的数据量。采用国内某油田注水井真实历史注水数据进行实验,研究结果表明,本研究中提出的CNN-BiLSTM-Attention预测模型的平均绝对误差(Mmean absolute error,MAE)、均方根误差(root mean square errorRoot Mean Square Error, RMSE)、平均绝对百分比误差(mean absolute percentage errorMean Absolute Percentage Error,MAPE)和决定系数(Ccoefficient of Ddetermination,R2)MAE、RMSE、MAPE 和R2 分别为0.027、0.043、9.936和0.968,通过多种模型对比,表明该方法具有较高的预测精度,可以更准确地预测注水流量。此外,研究还证实,采用数据增强技术可以有效提高模型的预测精度。研究成果可为油田精细化注水提供调整方案与高质量数据,从而为油田智能化开发提供理论依据。相似文献

18.

基于混合神经网络的序列推荐算法

下载免费PDF全文

刘纵横汪海涛姜瑛陈星《重庆邮电大学学报(自然科学版)》2021,33(3):466-474

为了提高推荐算法的推荐性能,在序列建模过程中,针对循环神经网络(recurrent neural network,RNN)无法并行运算导致建模速度与准确度较低,以及在偏好预测过程中对用户不同阶段偏好没有动态融合的问题,提出了一种基于混合神经网络的序列推荐算法.在算法模型的用户交互序列建模阶段,考虑到用户近期偏好变化频繁... 相似文献

19.

基于DSCNN-BiLSTM的入侵检测方法

下载免费PDF全文

商富博韩忠华林硕单丹戚爰伟《科学技术与工程》2021,21(8):3214-3222

针对传统的入侵检测方法无法有效提取网络流量数据特征的问题,提出了一种基于DSCNN-BiLSTM的入侵检测方法,该方法引入了深度可分离卷积代替标准卷积从而减少了模型参数,降低了计算量,并应用双向长短期记忆网络(BiLSTM)提取长距离依赖信息的特征,充分考虑了前后特征之间的影响.首先,通过主成分分析法(PCA)对网络流量数据进行特征降维,并创新性地将一维网络流量数据转化为三维图像数据;然后,分别运用深度可分离卷积神经网络(DSCNN)和双向长短期记忆网络(BiLSTM)提取网络流量数据的空间特征和时间特征;最后,利用KDDCUP99数据集进行训练、验证和测试.实验结果表明,与其他传统的入侵检测方法相比,该方法具有更高的准确率和更低的漏报率. 相似文献

20.

基于用户行为模拟的XSS漏洞检测

王丹刘源赵文兵付利华杜晓林《大连理工大学学报》2017,57(3):302-307

为改进XSS漏洞检测系统中对复杂网页漏洞注入点发现不够充分、动态地分析目标站点的响应信息不足等问题,改善XSS漏洞检测系统的注入点提取、攻击测试向量生成和响应分析等,提出了基于用户行为模拟的XSS漏洞检测方法.通过分析网页结构找到多种非格式化注入点,并通过综合考虑字符串长度、字符种类等因素对攻击向量进行了优化,以绕过服务器的过滤函数,缩短漏洞测试所用的时间.测试结果表明所提方法提高了漏洞注入点的检测覆盖率,提升了XSS漏洞的检测效果. 相似文献