首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
文章查阅了国内外关于手语语序研究的文献,对研究结果进行分析归纳后得出:手语语序研究在国外开展比较深入,国内相关研究尚显薄弱;手语语序受到动词方向性、类标记结构、语义、语用以及非手控特征等多种因素的影响;判断手语基本语序的标准与口语大致相同;对被试的选择和实验材料的设计越来越科学合理。文章在分析归纳已有研究成果的基础上,提出了中国手语语序研究中应该注意的问题。  相似文献   

2.
针对行人重识别中因遮挡、姿态变化使模型特征无法充分表达行人信息的问题,提出了基于注意力机制与多尺度特征融合的行人重识别方法.首先使用改进的骨干网络R-ResNet50提取图像特征;其次,抽取网络不同尺度的特征层嵌入注意力机制DANet,使模型更关注于重点信息;最后,对提取出的关键特征进行多尺度特征融合,实现特征间的优势...  相似文献   

3.
本研究针对现有图像修复方法不能有效地分离结构和纹理信息,修复结果往往会出现边界模糊、结构扭曲等伪影问题,提出了基于潜在特征重构和注意力机制的人脸图像修复方法。人脸图像修复方法分为两阶段,第一阶段,通过结构重建器网络提取样式向量,按照StyleGAN所述的原理分为粗尺度特征、中尺度特征和精细特征三组,插入到预先训练好的StyleGAN生成器中,产生初步的修复结果;第二阶段通过构建纹理生成网络并使用上下文注意力机制,注意力分数由注意力计算模块计算,注意力转移模块根据较高级别特征图和注意力分数来填充较低级别特征图中的对应缺失区域,以细化上一阶段初步的人脸修复结果。在CelebA-HQ数据集上的训练并进行测试,本文的方法在定量和定性分析两个方面均优于现有方法。因此,基于潜在特征重构和注意力机制的人脸图像修复方法能够有效地修复缺损人脸图像,大大减少了边界过度平滑和存在纹理伪影的问题。  相似文献   

4.
针对花样滑冰运动人体运动轨迹复杂、动作类型多样、普通人肉眼难以区分且常规的行为识别方法识别准确率低的问题,提出了一种基于时空图卷积网络与多通道注意力机制融合方法 (SAT-GCN)的花样滑冰动作识别算法。该算法首先将视频提取成连续的单独帧,使用OpenPose算法提取人体骨骼关键点数据,降低背景噪声干扰;然后使用时空图卷积算法对骨骼关键点数据进行动作分类。算法对时空图卷积算法进行改进,加入了多通道时空注意力机制融合模块,使得模型更加关注重要的关键点、时间帧片段、特征;使用时序卷积网络(TCN)提取人体骨架关键点在时间序列上的特征;使用SoftMax对提取后的特征进行动作分类。在花样滑冰数据集FSD-10和公开的人类行为数据集Kinetics-Skeleton上进行训练和测试,与改进前的时空图卷积网络(ST-GCN)进行对比,本文所提算法的预测准确率在2个数据集上均有所提升,验证了多通道注意力机制融合方法在花样滑冰选手动作检测任务中的有效性。  相似文献   

5.
在神经网络的推荐模型基础上引入自注意力机制,提出一种改进的基于自注意力机制TransNet推荐模型SATransNet。SATransNet模型使用卷积神经网络提取评论特征,通过自注意力神经网络自动学习特征内部的依赖关系,由依赖关系来决定需要关注的特征,从而解决数据表达能力不足的缺陷。本文在不同数据集上进行了实验比较与分析,SATransNet推荐模型在不同数据集上的预测评分较好,均方误差总体呈优。与基于注意力机制的推荐模型相比,SATransNet推荐模型的归一化折损累计增益均有提升,具有较好的预测评分效果和推荐相关性。  相似文献   

6.
针对真实环境场景会同时出现多种事件导致场景分类准确率受到干扰信息影响的问题,本文提出了一种基于自注意力机制的多模态场景分类方法。首先,对音频进行特征提取并使用自注意力机制获得关注信息;然后,对视频进行分帧图片抽取,通过ResNet 50对图片特征进行提取;最后,将两个模态的特征进行拼接并再次使用自注意力机制对特征信息进行抓取分类。基于DCASE2021 Challenge Task 1B数据集的实验结果表明,与其基线系统、双模态信息简单拼接、视频辅助音频和音频辅助视频的分类系统相比,基于自注意力机制的多模态场景分类系统的准确率优于单模态互相辅助决策的场景分类系统。  相似文献   

7.
针对传统基于3D CNNs(三维卷积神经网络)的手语识别方法模型计算复杂度和内存占用较高,及基于RNNs(循环神经网络)的连续手语识别方法的长距离建模能力不足的问题,提出一种基于轻量3DCNNs和Transformer的手语识别方法.首先使用轻量3D CNNs进行孤立词手语识别的时空建模,然后提出RKD(随机知识蒸馏),从多个教师模型中提取知识以提高轻量三维卷积的特征提取能力;针对连续手语,在特征提取后使用完全基于自注意力的Transformer进行全局建模.实验结果表明:所提方法在CSL-500和CSL-continuous数据集上可以获得95.10%的识别率和1.9的WER(词错误率),证明了所提方法的有效性.  相似文献   

8.
基于计算机视觉的手语识别技术可以为聋校的双语教学带来很大的便利,而手语识别技术的难点之一在于视频关键帧的提取.根据手语视频关键帧的特点和手语者的手语习惯,提出了一种面向手语识别的视频关键帧提取和优化算法.首先利用卷积自编码器提取视频帧的深度特征,对其进行K-means聚类,在每类视频帧中采用清晰度筛选取出最清晰的视频帧...  相似文献   

9.
事件要素识别是事件抽取的基本任务,对后续任务的开展起着重要作用.随着深度学习技术的发展,神经网络逐渐成为事件要素识别的主流方法.近几年,注意力机制在自然语言处理领域得到广泛使用,但注意力机制依赖于嵌入层对上下文特征的提取,在事件要素识别等序列标注问题中效果不理想.针对这一问题,提出了一种基于注意力机制的双维注意力机制,从矩阵行和列两个维度计算注意力得分,因此可以较好地提取句子的上下文特征,并且使用了动态目标损失函数,通过动态给予不同标签不同的权重,一定程度上缓解了样本不平衡和数据稀疏带来的模型泛化不足问题.在CEC2.0中文突发事件语料库上对比实验表明,所提方法取得较好效果.  相似文献   

10.
经典的卷积神经网络文本分类模型仅仅着眼于全局特征,没有考虑到局部特征.为了解决此问题,引入了注意力机制,用于提取文本中的关键词,把全局特征与局部特征综合在一起,使得文本的特征表达更加丰富.实验结果表明:卷积神经网络分类模型比传统的机器学习方法分类效果更好,而引入注意力机制后的卷积神经网络模型相比于经典的文本分类模型,分类效果也有了一定程度的提高.  相似文献   

11.
针对半导体生产过程中的晶粒缺陷检测任务,提出了一种融入多头注意力机制的新型CNN模型(Attn-Net).该模型使用深度可分离卷积和标准卷积累加的卷积结构提取输入图像特征,借助多头注意力机制更新特征权重,输出注意力机制筛选的图像分类结果.在13513张晶粒图像构成的数据集上训练、验证及测试,并与VGG-16、ResNe...  相似文献   

12.
许天然  吴垚  苏红旗 《科技资讯》2012,(19):24-24,26
文中使用图像轮廓填充图形作为手语手势的特征参数进行静态手语识别。关键是提取出图像边缘轮廓,并做出轮廓填充图形,根据这个特征参数对待测图像进行手语手势的特征匹配。该方法对图像亮度、缩放、平移、旋转具有不变性,而且该方法计算简单、快速,可以用于基于移动终端(Android手机操作系统平台下)的手语识别系统。  相似文献   

13.
现代汉语从句后置型假设句是一种主要用于言域的语用性特殊假设句式。因使用非常规语序而语义关系不明,便强制要求使用假设标记,同时排斥推论标记,形成“……,如果……的话”这样的典型结构形式。其语体分布和假设标记显示了其书面化倾向,具有追补说明作用的从句可为主句所言提供适宜性条件。这种特殊语序假设句能在汉语中使用开来,外受西文翻译的影响,内则因凸显强调主句内容及与前后文保持语义连贯的语用需要。语用表达需求是假设句语序变异的主要原因。  相似文献   

14.
工业生产中带钢表面缺陷具有缺陷类型多变、背景杂乱和对比度低等特点,现有的缺陷检测方法无法检测出完整的缺陷对象。针对上述问题,提出一种基于U型残差编解码网络的带钢缺陷检测算法。在编码阶段,算法利用全卷积神经网络提取丰富的多尺度缺陷特征,并结合注意力机制加速模型收敛。在解码阶段,使用所提出的U型残差解码网络恢复编码阶段编码的显著性信息。此外,设计了一个残差细化网络,用以进一步优化粗糙的显著图。实验结果表明,所提出的算法具有较强的鲁棒性。  相似文献   

15.
针对MobileNetV2网络在图像分类任务中特征表达不足的问题,提出一种结合注意力机制对MobileNet网络的改进策略。利用一种新颖的高效且无参的注意力模块,同时结合I-block模块来替换MobileNet网络中的倒残差模块,采用RReLU激活函数替代原ReLU激活函数保留更多特征,结合inception结构进行多尺度特征提取与融合,使其可以提供更强的多尺度特征表达并服务于图像分类任务,使用数据扩增技术,生成更多样本。与6种方法进行对比,实验结果表明,采用3D注意力机制的网络在数据集CIFAR-10、CIFAR-100上以最少的网络参数分别取得94.09%和75.35%的最高精度,表明该改进方法可以有效地进行快速图像分类。  相似文献   

16.
你知道吗     
方宇 《青年科学》2010,(6):31-31
中国人讲中文,英国人讲英文,中国人的手语和英国人的手语有没有分别?中国聋哑人用中国手语可不可以和美国聋哑人士沟通呢?  相似文献   

17.
对上海中小学教材德目教育文本分类进行研究,提出了基于转换器的双向编码表征(BERT)预训练模型、双向长短期记忆(BiLSTM)网络和注意力机制的模型IoMET_BBA. 通过合成少数类过采样技术(SMOTE)与探索性数据分析(EDA)技术进行数据增强,使用BERT模型生成富含语境信息的语义向量,通过BiLSTM提取特征,并结合注意力机制来获得词语权重信息,通过全连接层进行分类. 对比实验的结果表明,IoMET_BBA的F1度量值达到了86.14%,优于其他模型,可以精确地评估教材德目教育文本.  相似文献   

18.
针对密集行人检测中行人之间高度遮挡重叠所带来的精度低和漏检高的问题,提出一种单阶段密集行人检测方法Dense-YOLOv5。实验基于YOLOv5-L,首先使用改进的RepVGG模块来替代原有3×3卷积加强密集场景下特征信息的提取;然后在原有3个检测头的基础上添加1个检测头降低对小尺度行人的漏检;最后在网络特征融合阶段引入注意力机制,添加1个高效通道注意力(efficient channel attention,ECA)模块提高对有用信息定位的精度。实验结果表明:DenseYOLOv5相比原YOLOv5在CrowdHuman数据集上,在保证实时性的前提下,平均精度(AP)提高了3.6%,对数漏检率平均值(MR-2)降低了4.0%,证明了Dense-YOLOv方法在密集行人检测中的有效性。  相似文献   

19.
为提高慢性阻塞性肺疾病氧减状态的辨识性能,该文将注意力机制有效融入长短期记忆神经网络,提出了一种基于注意力机制的长短期记忆神经网络方法:首先,抽取每个待辨识状态点的四种有效鉴别特征,包括血脉氧饱和度指数、脉搏、血脉氧饱和度指数的窗口特征以及梯度特征;其次,在此特征表示的基础上,通过引入注意力机制,使用训练集来训练基于注意力机制的长短期记忆神经网络;最后,使用测试集来验证所训练模型的有效性。与多个经典机器学习算法的对比实验结果表明:所提出的基于注意力机制的长短期记忆神经网络方法的辨识模型能够准确识别氧减状态,全局性能指标曲线下面积达到了0.853 1。所提方法对于慢性阻塞性肺疾病的准确诊断具有重要的参考价值。  相似文献   

20.
传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词向量表达;然后将文本向量输入到双向门控循环单元(BiGRU)中提取文本特征信息;最后将标签词与注意力机制结合,选出文本的倾向标签词,计算倾向标签词与文本向量的注意力得分,根据注意力得分更新文本向量。通过对比实验,本文模型比传统模型在文本分类任务中的准确率更高。使用XLNet作为词嵌入模型,在注意力计算时结合标签词能够提升模型的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号