首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文提出了一个基于估计共振峰走向的汉语韵母识别方案。实验中利用倒频谱的性质对语音的短时谱进行同态平滑处理,分析了复合韵母共振峰走向现象与语音学理论的一致性。根据频谱分析的结果建立了一个以共振峰走向为识别模型的韵母识别系统。对10位发音人的860个韵母(单韵母、双元音和三元音韵母)发音进行识别测验,平均识别率达到88.1%。本文为复韵母的不认人识别提供了一种合理的方法。  相似文献   

2.
针对传统语音唇动分析模型容易忽略唇动帧间时变信息从而影响一致性判别结果的问题,提出一种基于平移不变学习字典的一致性判决方法.该方法将平移不变稀疏表示引入语音唇动一致性分析,通过音视频联合字典学习算法训练出时空平移不变的音视频字典,并采用新的数据映射方式对学习算法中的稀疏编码部分进行改进;利用字典中的音视频联合原子作为描述不同音节或词语发音时音频与唇形同步变化关系的模板,最后根据这种模板制定出语音唇动一致性评分判决准则.对四类音视频不一致数据的实验结果表明:本方法与传统统计类方法相比,对于少音节语料,总体等错误率(EER)平均从23.6%下降到11.3%;对于多音节语句,总体EER平均从22.1%下降到15.9%.  相似文献   

3.
基于SVD的唇动视觉语音特征提取技术   总被引:1,自引:0,他引:1  
唇动视觉语音特征提取是音视频驱动的人脸动画唇动表示和唇读研究的关键技术.首先针对彩色视频图像进行唇色增强,对增强后的灰度图像进行闽值分割,获取唇部包围框,并根据口型发音的视觉特征进行初分类;然后进行尺度与灰度归一化处理,对预处理后的图像提取奇异值特征;最后采用基于欧氏距离的模板匹配法对该奇异值特征所包含的视觉语音信息进行测试试验.结果表明该低维度特征包含了大量唇动视觉语音信息,可用于单个人在自然环境下的唇语口型识别.  相似文献   

4.
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。  相似文献   

5.
针对唇读识别中唇形状态的描述问题,提出一种基于Fourier描述子的唇形分类方法.该方法通过迭代演算获得嘴唇的位置与大小,先通过边缘侦测法找出唇形边缘;再由Fourier描述子找出唇形外形的重要特征值,进而表达唇形状态的有效信息;最后将转换出的Fourier描述子经过正规化处理后,输入到人工神经元网络中进行分类.实验结果表明,该方法的唇形分类正确率较高,且耗时较少,为唇读识别中各状态的确定提供了依据.  相似文献   

6.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。  相似文献   

7.
主要通过实地记音,运用有关音韵知识,对李谱英教授和陈晓锦教授所设计的玉林白话的声母表、韵母表进行辨析,对玉林白话的声母表、韵母表提出一些与前人不同的看法。  相似文献   

8.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

9.
马燕  魏华 《甘肃科技纵横》2012,41(6):143-144,14
本论文结合实际语音调查,通过分析录音比较了兰州话韵母对本地大学生英语元音发音的影响,归纳出兰州方言区学生英语语音习得易出现的问题,并针对这些问题提出可行的教学建议。  相似文献   

10.
提出了一个新的基于等分节点法的时延驱动布局算法.该算法基于对电路时延图的拓扑结构分析,将优化关键路径时延的问题转换成优化关键路径上单元位置的问题,通过建立优化位置单元的队列链表,采用一种新的等分节点法有效地寻找路径上单元的目标位置,从而优化路径上的线网长度,最终达到优化最长路径时延的目的.另外,启发式迭代优化方法很好地统一了以线长优化和路径时延优化为目标的布局算法.对MCNC标准单元测试电路中组合和时序电路的实验结果显示,电路经过时延驱动优化布局后的最大路径时延最多减少了31%.  相似文献   

11.
矢量量化技术和隐马尔柯夫模型方法在韵母识别中的应用   总被引:2,自引:0,他引:2  
本文应用矢量量化技术(Vector Quantization)和隐马尔柯夫模型方法(Hidden Markov Model)为一个全字汇量的孤立字普通话语音识别系统设计了韵母识别子系统.该系统由韵母信号析取器、滤波器阵列特征分析器、矢量量化器、预识别器、隐马尔柯夫模型匹配器和决策器组成.根据对汉语中1172个不同音节的语音信号测试结果,决策器输出的准确率(即系统的最后识别准确率)为89.5%,而前两个估计的识别准确率则达到97.2%.系统的训练包括生成矢量量化器的码字和为每一个韵母建立隐马尔柯夫模型,改进了Linde 等人提出的码字生成算法,提出了一个得到隐马尔柯夫模型参数的系统化方法.  相似文献   

12.
魏小伟 《科技信息》2010,(17):103-103,408
普通话水平测试是一项对应试者运用普通话所达到的标准程度的检测和评定,测试一律采用口试方式进行①。这项工作主要通过普通话测评员对应试者普通话读说能力进行判断分析作出相应的等级评价。基础语音层次指普通话水平测试的前两项内容即:单音节字词、双音节词语的朗读。主要考察应试者普通话声母、韵母、声调的发音以及双音节词语中音变规律的掌握情况。它们在普通话水平测试过程中处在前沿位置,因而会给测评员留下比较深刻的印象,而从心理学的角度讲,第一印象对于主观性考核是非常重要的。就审音角度而言,越是基础语音层次审音要求越高——这就是普通话水平测试中基础语音层次的审音要求。  相似文献   

13.
研究了具有时延和通信拓扑变换的移动传感器网络(MSN)分布式融合估计问题.结合无色信息滤波、自适应一致性算法并考虑通信时延而设计的基于自适应一致性的融合结构,提出了一种名为基于自适应一致性的分布式无色信息滤波(AC_DUIF)的分布式融合估计算法.以空中移动传感器网络跟踪移动目标为例,通过仿真验证了所提算法的性能.仿真结果表明,该方法能够在以分布形式提高网络中各节点对目标位置估计精度的同时,保证节点之间的一致性,并具备对网络通信延时的适应能力.  相似文献   

14.
针对目前唇读系统多采用HMM的识别方法,提出了基于AdaBoost的唇读识别方法,有效地解决了样本空间的交叠问题,通过强化训练那些难以分类的样本,使得识别性能有所提高.该方法改进了迭代过程中权值的变化率,降低了样本权重更新速度;同时区分噪声样本,减小不合理弱分类器的权重,使得改进后的算法降低了噪声对强分类器的影响.  相似文献   

15.
针对OFDM系统下行链路,无线分组调度须实现系统吞吐量、多业务QoS带宽速率、时延保证和公平性方面的诸多要求,提出一种能够实现自适应补偿的累积服务时延比例公平调度(DCPF)算法.该算法根据信道状态、累积服务时延等进行多目标判决,实施无线分组调度.分析和仿真结果表明,该算法可提供较好的QoS时延保证,并极大地提高各用户长期公平性.  相似文献   

16.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

17.
为了提高Reed-Solomon码的纠错性能,分析并给出了能提高Reed-Solomon码纠错能力的代数软判决译码算法的译码流程,讨论了译码中需要的软信息的计算方法,推导了代数软判决译码算法的译码成功条件.在此基础上,提出了一种改进的代数软判决译码算法,并对改进算法的运算量和译码时延进行了分析.算法针对推导的译码成功条件,通过改变代数软判决译码算法中插值算法的选择输出准则,更有效地利用了接收端的软信息.仿真结果表明,在译码时延基本不变的条件下,提出的算法比代数软判决译码算法提供更多的译码增益.  相似文献   

18.
文章通过对12位泰国学生汉语复元音韵母的习得情况进行调查,分析了各个学习阶段的泰国学生汉语复元音韵母的偏误率和偏误形式出现的规律,找出每一个二合、三合元音韵母的偏误特点、存在的难度梯级。其中,二合元音韵母偏误主要发生在ie、ou、üe、uo;三合元音韵母的难点主要是ui、iu。文章最后指出产生这些偏误的主要原因,并且针对这些偏误,提出了一些相应的教学对策。  相似文献   

19.
人脸主要特征位置标定与唇动序列跟踪   总被引:1,自引:0,他引:1  
通过对人脸主要特征位置的粗标定,得到眼睛位置的精标定,进而确定的粗位置,构造了一个的变形模型,通过多变量寻优算法获得比较准确的发音嘴形特征,这对于人机自然交互,听觉视觉双模态语音识别,计算机视觉的研究都有重要意义,这处方法简单、快捷,通过试验验证有较好的效果。  相似文献   

20.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号