首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到13条相似文献,搜索用时 140 毫秒
1.
针对场景图像的细粒度分类任务,结合图像视觉和文本的多模态信息提出了一种基于注意力网络推理图的细粒度图像分类方法.首先提取场景图像的全局视觉特征、局部视觉特征和文本特征,把位置信息分别嵌入局部视觉特征和文本特征后拼接成新的特征,再将这个新的特征作为图结构的节点生成一个异构图;然后设计两条元路径将异构图分解成两个同构图,并...  相似文献   

2.
针对广播节目在传输过程中易受干扰的问题,提出了基于动态时间轴归整(DTW)算法的多词判别法语音识别技术,根据该方法通过提取Mel尺度倒谱参数,设计出基于DSP的广播节目抗干扰系统,实现广播信号的自动判别,实验表明该系统抗干扰能力显著增强.  相似文献   

3.
鉴于传统的异质信息网络通常存在的高维稀疏性缺点,首先提出将异质信息网络的高维顶点嵌入低维向量空间的无监督学习模型—— 基于生成对抗网络的异质网络表征学习(heterogeneous network representation learning based on generative adversarial netwo...  相似文献   

4.
摘要: Alpha稳定分布噪声导致二阶循环谱相干系数失效,使相应的通信信号调制识别算法退化. 针对这个问题,提出了基于分数低阶循环谱相干系数的识别算法. 文中给出了分数低阶循环谱相干系数的相关理论,分析了通信信号的分数低阶循环谱相干系数,在此基础上提取谱相干系数循环频率域特征作为识别特征参数. 用BP神经网络为分类器,实现了通信信号调制方法识别. 仿真结果表明,在Alpha稳定分布噪声下,该识别算法性能优于基于二阶循环谱相干系数的方法. 在高斯噪声条件下,两种识别算法性能相当.  相似文献   

5.
针对现有数字高程模型(digital elevation model, DEM)数据空洞填充算法存在修复效果不连续、适用空值范围狭小以及细节重构丢失等问题,提出了一种融合自注意力机制的生成式对抗网络的DEM空洞填充方法。首先,构造自注意力机制提取DEM数据特征信息,改善DEM空洞填充结果高程值不连续和纹理细节缺失的问题。其次,在生成器中使用对称结构的卷积与反卷积网络结构,保证生成可靠度较高的数据以实现空洞区域填充,并利用判别器实现空洞填充结果的预分类。最后,结合重构损失函数进行训练,提升DEM空洞填充结果对异常值的鲁棒性,增强模型的回归能力。采用不同分辨率DEM数据进行空洞填充并与现有方法进行对比,结果表明:所提方法能够大幅提升填充精度,有效解决原始数据中存在的空洞问题。  相似文献   

6.
当前基于神经网络的入侵检测方法并没有将数据分类信息考虑在内,无法有效利用网络流量数据的时序信息,为此将门控循环单元(gated recurrent unit,GRU)和基于分类信息的特征嵌入技术结合起来,构建了基于GRU与特征嵌入的网络入侵检测模型.利用UNSW-NB15数据集进行模型仿真实验,结果表明该模型提高了对入...  相似文献   

7.
基于用户会话日志,提出了一种融合XGBoost和门控循环单元网络的TF-Ranking推荐方法。该方法利用门控循环单元学习用户行为。首先,利用XGBoost进行特征提取,克服了传统方法中数据模型复杂的缺陷,使数据模型在保持原始属性的基础上大大降低了复杂度;其次,利用改进后的Dropout网络对数据进行处理,使得召回率提高了1.32%;最后,基于Learning to Rank与Pairwise方法训练用户会话数据,尽可能为用户提供一个与查询内容相关性较强的正向排序推荐清单。实验在Trivago RecSys Challenge 2019数据集上进行。结果表明,所提出的推荐算法在召回率和平均倒数排名上均有提高,而且可以应用于大规模数据推荐。  相似文献   

8.
针对传统神经网络提取的复杂环境声音特征微弱,导致分类准确率低的问题,提出了一种基于颜色通道特征融合的环境声音分类方法。首先,从原始音频数据中提取出三种声音特征,即对数梅尔频谱图(log-Mel spectrogram, LMS)、梅尔倒谱系数(Mel-scale frequency cepstral coefficients, MFCC)以及能量谱图(energy spectrum, ES);其次,分别将以上三者作为RGB颜色通道分量进行特征融合,形成包含更多特征信息的声谱图,更全面表征环境声音;再次,为了避免由于数据集较少导致所训练的模型泛化能力较差,对预训练模型VGG-16采用微调方法进行训练;最后,在两个广泛使用的环境声音分类数据集以及实际场景采集的音频上验证本文所提方法的有效性,并与其他模型的准确率进行对比。结果表明,本文所提方法在ESC-10以及ESC-50数据集上的准确率分别能够达到88.2%和65.2%,并且能提高实际场景采集的音频分类效果。  相似文献   

9.
为了解决感染区域比正常组织对比度低的问题,提出了一种基于三重注意力机制(triple attention mechanism,TAM)的新冠肺炎(corona virus disease 2019,COVID 19)病灶分割模型——TM-Net,并将其应用于条件生成对抗网络.MultiConv模块可以自动提取肺部切片中...  相似文献   

10.
驾驶疲劳识别研究对预防交通事故提高交通安全具有重要意义.提出了一种基于深度置信网络和生成模型的驾驶疲劳识别方法.为了有效地表示疲劳,采用深度置信网络从人脸图像中提取疲劳特征;结合已标注样本和未标注样本,提出了一种基于生成模型的半监督学习的疲劳识别方法,解决了疲劳识别中的小样本问题.在自建疲劳数据库上,采用该方法进行了驾驶疲劳识别的仿真实验,同时和其他几种方法进行了对比,结果表明该方法具有更高的识别精度.  相似文献   

11.
在方面信息情感分类中针对使用循环神经网络编码长距离文本的信息丢失问题,以及使用注意力机制提取情感信息时倾向于关注高频信息偏置问题,提出一种多模特征融合的方面信息情感分类方法,区分单点、多点以及局部三类不同表达模式的情感信息,通过对三类情感信息有侧重的关注、提取与融合,实现各类特征间相互确认与纠错,降低信息丢失与关注偏置问题,达到增强复杂情感表达模式下的方面信息情感分类能力的目的。实验结果表明,使用所提出的方法对三类情感信息进行提取与融合,可以使方面信息情感分类任务在准确率和F1值指标上得到进一步提升。  相似文献   

12.
无人机拍摄的图像具有分辨率高、视野大以及目标小的特点,而现有的目标检测方法对小目标特征的提取能力不足.为此,首先采用以中心点表示目标的检测网络CenterNet,引入可变形双重注意力机制,以提高对小目标的特征表达能力;然后针对原始非极大值抑制难以处理嵌套型冗余框的问题,在冗余检测剔除过程中提出了广义非极大值抑制方法;最...  相似文献   

13.
现有的检测方法对轨道板细微裂缝和夜间拍摄的裂缝图像存在误检和漏检的现象,为此提出了一种基于卷积神经网络的改进方法.将特征图分组后用注意力机制强化各组向量的特征表达,以动态聚合弱分类器预测结果的方式得到最终的裂缝置信度.借助投票机制有效降低最终的预测偏差,提升模型的鲁棒性.实验结果表明:该改进方法在减少模型参数的情况下,...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号