首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
信息技术的发展使各种图像信息日益膨胀,如何从中找到重要的信息一直是机器视觉和信息处理研究中长期面临的重要问题。将视觉注意力机制引入到图像分析领域,则能获得高效的检索能力。本文首先介绍了视觉注意力、视觉注意力计算模型及研究现状,其次分析了图像中引入视觉显著性的必要性和重要性,论述了图像视觉显著性的层次、显著性特征的选择及度量;最后给出了有待研究的重点问题。  相似文献   

2.
杨磊  赵红东 《科学技术与工程》2020,20(33):13757-13761
环境声音识别(Eenvironment Ssound Rrecognition ,ESR)在基于情景感知和辅助技术等领域发挥着重要作用。卷积神经网络(CNN)和循环神经网络(RNN)作为两种最具代表性的特征提取方法,在语音和音乐信号处理方面都取得显著效果,然而二者都存在一定缺点,CNN无法有效提取时间特征,RNN在提取空间特征上也存在明显劣势。为了有效的提取并利用时间特征和空间特征,提出一种新模型,利用时间分布卷积神经网络(CNN)从梅尔频谱图中提取城市环境声音特征,然后应用双向长短时记忆网络(BiLSTM)从CNN输出中获取时间信息,最后在BRNN的输出序列上实施注意力机制,从而关注到与城市环境声音最相关的特征进而做出分类判断,注意力机制既提高了分类准确性,又增强了模型的可解释性。实验结果表明,在Urbansound8K数据集中,该模型可获得80.2%的分类准确率,这优于以前在同一数据集的报告结果  相似文献   

3.
传统视觉问答技术仅采用简单的位置注意力,缺乏语义注意力,从而引起问题推理错误.本文采用双重注意力机制从图像获取位置信息和语义信息,以外积形式进行融合,获得文本也采用双重注意力融合实体和对应关系的信息,帮助理解问题.双重注意力动态方式可以实现关系融合、动态学习,改变传统静态学习方式.以多标签分类器实现答案推理,减少传统二...  相似文献   

4.
针对使用卷积神经网络结构结合循环神经网络结构的模型在手语翻译任务中难以关注到手语视频序列中关键帧的问题,提出了一种结合全局注意力机制的手语翻译模型.该模型在长短时记忆网络中嵌入全局注意力机制,通过计算当前隐藏状态和源隐藏状态之间的相似度并得出对齐向量,让模型学习对齐权重,使模型关注到长手语视频序列中的关键帧,从而提升模型翻译的准确率.实验结果表明:加入全局注意力机制的模型在DEVISIGN_D数据集上的准确率优于3DCNN、CNN+LSTM等主流模型,并且在100分类的短手语词和长手语词数据集上,分别与未使用注意力机制的模型进行了对比,其准确率提升0.87%和1.60%,证明该注意力机制可以有效地提升模型翻译的准确率.  相似文献   

5.
针对目前情感分析中的循环神经网络模型缺乏对情感词的关注的问题,提出一种基于循环神经网络的情感词注意力模型,通过引入注意力机制,在情感分类时着重考虑文本中的情感词的影响.在NLPCC 2014情感分析数据集及IMDB影评数据集上进行试验,结果表明:该模型能够提高情感分析的效果.  相似文献   

6.
对肺结节的形状特征、边缘特征和内部特征进行准确分类,能够辅助影像科医生的日常诊断工作,提高影像报告的书写效率.针对这一问题,提出一种基于长短时记忆(LSTM)结构与注意力结构的多任务分类模型.该模型通过注意力机制融合各个任务间的共享特征,提高当前任务的特征抽取效果.LSTM结构分类器能够有效地筛选任务间的共享特征,提高模型的信息传递效率.实验表明,相较于传统多任务结构,所提模型在公开数据集LIDC-IDRI上能够取得更好的多特征分类效果,辅助医生快捷地获取肺结节特征信息.  相似文献   

7.
学龄人口是区域教育资源配置的重要依据,对区域内下一年小学入学规模进行准确预测,可以为区域内教育管理部门对教育资源进行调配提供辅助决策支持.该文针对区域内小学入学规模预测问题,考虑区域经济、人口等相关因素和小学入学规模的关联关系,提出了基于注意力机制的循环网络预测模型.该模型以长短时记忆网络模型为基础,引入注意力机制,自动提取小学入学规模与经济、人口等特征之间的关联关系以及进一步增强历史关键时间点的信息表达,提升预测准确率.在采用真实数据集进行试验的结果说明,该模型对比其它模型在多个评价指标上均有提升,具有更准确和更稳定的预测效果.  相似文献   

8.
9.
为了解决智能驾驶场景中对周边车辆未来行为的预测问题,研究了基于注意力机制的长短时记忆网络(LSTM)模型的车辆行为预测方法.首先提出了一种非均匀步长的时间序列数据划分方法,将属于特定行为的车辆时序信息进行分类;以LSTM为基本的神经网络框架,用注意力机制判断输入时序信息中各个时间步信息的重要程度,分配不同的权重值;以目标车辆及其周边车辆的历史轨迹信息作为算法输入,用来预测目标车辆将来的运动行为.结果表明:该算法可以解决固定步长的时序分类方法导致的信息遗漏或计算资源负担增加的问题,同时能够有效提高行为预测准确性,减少车辆行为预测时间.  相似文献   

10.
针对传统词向量无法在上下文中表示词的多义性,以及先验的情感资源未能在神经网络中得到充分利用等问题,提出一种基于知识增强语义表示(Enhanced Representation through Knowledge Integration,ERNIE)和双重注意力机制(Dual Attention Mechanism, DAM)的微博情感分析模型ERNIE-DAM.首先利用现有的情感资源构建一个包含情感词、否定词和程度副词的情感资源库;其次采用BLSTM网络和全连接网络分别对文本和文本中包含的情感信息进行编码,不同的注意力机制分别用于提取文本和情感信息中的上下文关系特征和情感特征,并且均采用ERNIE预训练模型获取文本的动态特征表示;最后将上下文关系特征和情感特征进行拼接融合,获取最终的特征向量表示.实验结果表明,新模型在COAE2014和weibo_senti_100k数据集上的分类准确率分别达到了94.50%和98.23%,同时也验证了将情感资源运用到神经网络中的有效性.  相似文献   

11.
针对航线订座需求预测中存在的预测结果不稳定,偏差较大的问题,提出了一种基于注意力机制 的长短时记忆神经网络(Long Short-term Memory Neural Network,LSTM)航线订座需求预测模型。首先, 对采集得到的航线订座需求数据进行数据清洗与指标计算处理,接着,对处理后的指标数据基于注意力机 制做权重分配,然后进行 LSTM 航线订座需求预测模型的建立,从而得到航线订座需求的最终预测结果 值。将训练优化得到的模型应用于国内某航司的航线订座需求预测中,计算出预测结果。实验结果表明, 基于注意力机制的 LSTM 航线订座需求预测模型预测精度较高,以厦门-上海为例,预测结果在与真实值 的对比下,平均绝对误差(Mean Absolute Error,MAE)为 13.1,均方根误差(Root Mean Square Error,RMSE) 为 17.2,相比较于移动平均法,指数平滑法,循环神经网络(Recurrent Neural Network,,RNN),CNN-LSTM 混合模型有较好的预测效果。  相似文献   

12.
提出了一种新的初级视觉模型,在此模型中,提出了一个基于小波时频特性的非均匀采样方案,以非规整信息表示图象信号,并形成多分辨率处理通道,通过引入一个反馈通道来模拟人眼的“眼动”,形成反馈闭环控制,最终我们试图通过此系统实现具有选择性注意力机制的初级视觉模型。  相似文献   

13.
针对航线订座需求预测中存在的预测结果不稳定,偏差较大的问题,提出一种基于注意力机制的长短时记忆神经网络航线订座需求预测模型. 首先,对采集得到的航线订座需求数据进行数据清洗与指标计算处理;接着,对处理后的指标数据基于注意力机制做权重分配;然后进行长短时记忆神经网络航线订座需求预测模型的建立,从而得到航线订座需求的最终预测结果值. 将训练优化得到的模型应用于国内某航司的航线订座需求预测中,计算出预测结果. 实验结果表明,基于注意力机制的长短时记忆神经网络航线订座需求预测模型预测精度较高,以厦门-上海航线为例,预测结果与真实值对比,平均绝对误差为13.1,均方根误差为17.2,相比较于移动平均法、指数平滑法及循环神经网络,CNN-LSTM混合模型有较好的预测效果.  相似文献   

14.
在生产过程中手机等智能设备的屏幕表面可能出现的微小缺陷与灰尘等脏污很相似,传统检测方法易将脏污误检为缺陷。为了提高产品表面微小缺陷的识别准确率,本文提出一种基于视觉注意力融合的检测方法。首先利用金字塔下采样初步识别出潜在目标,以减少图像数据量及提高计算效率,然后将角点检测、伽马变换和Otsu阈值分割等传统检测方法与3种显著性提取方法(布尔图显著性模型BMS、谱残差模型SR和频率调谐模型FT)相结合,建立了融合检测模型。实验结果表明,所提出的融合模型能够较为准确地区分出缺陷与脏污,F1值可达到0.73,与其他几种显著性检测方法相比,本文方法在对脏污的识别上具有明显优势。  相似文献   

15.
首先,提出构建双向的全连接结构用于更好提取上下文的信息;然后,利用双向的注意力机制将包含丰富文本特征的矩阵压缩成一个向量;最后,将双向的全连接结构和门控制结构相结合.通过实验验证了上述结构对于提升文本分类的准确率具有积极的作用.将这3种结构和双向的循环网络进行结合,组成了所提出的文本分类模型.通过在7个常用的文本分类数据集(AG、 DBP、 Yelp.P、 Yelp.F、 Yah.A、Ama.F、Ama.P)上进行的实验,得到了具有竞争性的结果并且在其中5个数据集(AG、DBP、Yelp.P、Ama.F、Ama.P)上获得了较好的实验效果.通过实验表明,所提出的文本分类模型能显著降低分类错误率.  相似文献   

16.
为了降低视频传感器网络中的网络负载,减少能量消耗、降低时延,提出了一种分层的基于注意力模型的多质量图像融合方法.通过对节点的结构化部署及视图间的区域映射,建立了基于动态注意力的节点唤醒机制.通过使用低层节点采集的高质量图像对高层节点低质量图像的融合,使注意力目标得到增强.实验结果证明了该融合方法的有效性.  相似文献   

17.
基于CNN-BLSTM的食品舆情实体关系抽取模型研究   总被引:1,自引:0,他引:1  
食品舆情实体关系抽取是构建食品舆情知识图谱的关键技术,也是当前信息抽取领域的重要研究课题。针对食品舆情中常出现的实体对多关系问题,在卷积神经网络(convolutional neural network,CNN)中引入基于位置感知的领域词语义注意力机制;在双向长短时记忆(bidirectional long short-term memory,BLSTM)网络中引入基于位置感知的语义角色注意力机制,构建基于CNN-BLSTM的食品舆情实体关系抽取模型。在食品舆情数据集上进行了对比实验,实验结果表明:基于CNN-BLSTM的食品舆情实体关系抽取模型在食品舆情数据集上准确率比常用的几种深度神经网络模型高出8.7%~13.94%,验证了模型的合理性和有效性。  相似文献   

18.
19.
随着网络的不断发展,越来越多的人们在网络中发表自己的言论,这些带有情感性的文本能够反映出人们的意见信息,对这些文本进行情感分析研究是文本分类的一个重要任务.文中提出了一种加入注意力机制的联合神经网络(convolutional neural network+long shout-term memory,CNN+ LST...  相似文献   

20.
针对汽车故障问答文本特征稀疏、语义信息不全、深层次语义特征较难提取等问题,提出基于问题-答案语义共现的多层次注意力卷积长短时记忆网络模型(co-occurrence word attention convolution LSTM neural network,CACL)的问题分类方法。通过向量空间模型计算问题与答案文本中语义相似的共现词,使用注意力机制聚焦问题文本中的共现词特征,输入卷积神经网络(convolutional neural network,CNN)提取问题局部特征,通过长短时记忆网络(long short-term memory network,LSTM)及词级别注意力机制提取长距离依赖特征及其更高层次的文本特征,采用Softmax进行问题分类。结果表明,相比较于主流的问题分类方法,该方法有效提高了问题分类的精度,最高提升了10.04%的准确率。同时,试验发现当选用11个有效共现词且共现词来自问题文本时,模型的处理精度最佳。合理利用问题-答案文本语义相似的共现词,能有效提升汽车故障问题的分类性能,且共现词的个数、来源对问题的分类精度有一定的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号