排序方式: 共有33条查询结果,搜索用时 0 毫秒
11.
12.
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。 相似文献
13.
14.
正他曾经是一名知青,因为坚定的科学梦,走上了钟爱的科学研究之路;他是国际高能物理领域的知名学者,怀揣着对国家和母校的深厚感情,毅然回国效力。他的科研履历很长,从中国到瑞士、从美国到中国,他获得过诸多荣誉。他就是中国科学技术大学教授、2013年中国科学院新晋院士赵政国。人生关键词:勤奋和毅力在赵政国的人生词典里,勤奋和毅力是两个关键词。 相似文献
15.
新型输液90°弯头结构流固耦合特性 总被引:1,自引:0,他引:1
采用双向耦合法研究了一种新型流体脉动衰减弯头,讨论了结构参数对其流固耦合特性的影响.结果表明:原始弯头内总压差为29.50627 kPa,内部流场极不均匀,其最大变形量为20.689μm,最大应力为180.08 kPa,变形方式是两侧拉长、中间向里凹陷,呈双椭圆形,对其具有"拉直"效应;当导流器按黄金比例排列,片数为2,横截面弯曲半径为200mm,出口延长度为40mm设计时,优化结构内总压差为10.707 87 kPa,比原始弯头减小了63.71%,但该结构最大变形为330.39 μm,最大应力为1 569.10kPa;最终方案增加导流器片数至3片,导流器厚度为3 mm,优化后结构内总压差为12.46956kPa,比原始弯头减小了57.74%,其最大变形为20.898 μm,最大应力为259.80kPa,且内部流场均匀. 相似文献
16.
17.
建立完备的激励机制,是企业梦寐以求的,企业都期望自己的员工在有效的激励机制的指导下,其行为指向是企业希望的,与企业利益一致,然而由于种种因素:激励机制本身的特性——用作激励的指标的可量化性及其能被量化的程度;需要考虑的质量确认指标体系的维度——单一还是多重;以及被激励者的状态,被激励者参与任务的数量等等,企业激励机制作用的有效发挥受到了影响。本文就是在考虑上述因素的基础上,同时加入企业相应的需要支出的激励成本因素,通过分析说明了激励机制的完备化是有限的这一观点。 相似文献
18.
19.
在计算机组装教学过程中,教学条件不足和硬件更新迅速等问题影响了教学的效果,采用虚拟现实技术对计算机组装课程中所需的硬件和实验过程进行仿真,可以很好地解决这些问题.开发了基于VRML的计算机组装虚拟实验系统;描述了实现虚拟实验的各种关键技术,包括虚拟场景的构建、虚拟部件的动态组合、虚拟实验场景交互等.将该虚拟实验系统用于实际教学中可达到预期的教学效果. 相似文献
20.
提出一种多尺度编解码深度卷积神经网络结构,使用生成对抗的思想对模糊图像直接进行盲复原.首先,设计一种优化多尺度残差块应用在编解码器内部,在减少参数量的同时提高了网络非线性表达能力;其次,分别计算多尺度网络每层对应的L2损失,确保逐级去模糊后的图像更加接近真实图像;最后,在GoPro数据集和真实道路交通模糊图像上进行仿真... 相似文献