首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

2.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大.通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法.  相似文献   

3.
徐怡 《科技信息》2012,(15):270-270,287
二语学习者在习得二语语音时会把母语中的音素、声调等迁移到二语当中。方言对英语语音学习的负迁移作用明显。本文通过对淄博方言与英语发音规律的对比研究.分析了淄博方言在英语辅音、元音、重音和语调方面的干扰,进而提出在英语教学中可以采取尽量减少母语对英语语音学习负迁移的教学方法。  相似文献   

4.
昭通地处我国云南省的东北部,以昭阳区为行政区.昭通方言属于汉语北方方言西南官话中的云南次方言,在语音、词汇和语法等方面有独特的地域特色.关于昭通方言语音的研究成果主要集中在20世纪90年代,随着语言的发展变化,昭通方言语音内部产生了新的特点.文章采用实验语音学研究方法,以昭通方言中的一级元音为研究对象,通过对各元音共振峰和舌位分布进行分析后,最终得出元音的舌位分布和声学特征,并结合目前发音实际,对元音[y]和[?]的声学表现进行详细分析,得出元音的发音特点.研究结论有助于昭通方言音系的归纳整理,还有利于针对方言特点进行的普通话推广工作.  相似文献   

5.
语言是人类交流信息的主要媒介,如果能用数字计算机来识别语言,必然能对人类交流信息的过程带来无可估量的影响。正因为如此,语言识别问题在近二十年来受到了很大的注意,同时由于这一问题牵涉面很广,边缘性很强,因此它又成为计算机科学中使人颇感兴趣的问题之一。Wolf曾对七十年代初期以前有关这一问题的研究作了一个较好的总结(主要指美国对英语识别所进行的研究)。语音的识别看来基本上所采用的是对于音素或类似于音素的识别,这是因为尽管人可以发出频带相当宽的声音,但作为语音来说,大致上是由几十个基本发音单元,即音素所构成的。这样,我们依靠内存于计算机中的数量不多的音素模型就可能进行语言的识别。英语的音素大致有四十多个。汉语(普通话)计算机识别用的音素可以建立在汉语拼音的基础上。如果仅从元音、辅音来说,则也不过三十多个。汉语拼音把发音单元分为声母和韵母,声母即辅音,韵母则包括单元音和复合元音。关于音素识别方面的一些辅助识别工作,诸如音节、清音、浊音、元音的区分等都与英语识别问题相类似,汉语语音识别方面的一个特殊问题是关于声调的识别。汉语以及许多亚洲语系都有声调识别的问题。汉语(普通话)分成阴平(—)、阳平(/)、上(V)、去(\)四声。如果每一个韵母加上四声的变化,则音素模型的数字将大为增多,这将增加识别检索时的困难。问题的复杂性还不止于此,如地(di)、期(qi)这类字,四声的变化只在于韵母本身,因此不影响其他相关连的音素d、q。如烟(yan)、望(wang)、两(liang) 这类带复合元音的字,四声的变化贯串于整个音节,这就是说四声的变化将影响这一音节中的其他音素,这样一来问题的复杂性就提高了。据说有些方言,如广东话,有多至十种声调的,如果把不纯正的发  相似文献   

6.
3.0.1 我们曾在《四川方言音系与英语音系的初步比较研究》(马川冬、谭伦华,1996)—文中,对四川方言音系与英语音系做了较为详细的比较分析和研究,找出了两种音系间存在的差异,以期求出四川方言区英语语音教学的重点和难点。但这些差异是否就一定会在语音习得过程中给学习者造成障碍呢?我们认为有必要对学生常见语音错误进行一番分析再下结论为好。3.0.2 在多年的英语教学活动中,我们曾接触过来自四川绝大部分地区的学生,发现四川方言区学生在学习英语语音的普遍存在着一些问题。下面我们将从两大方面分析常见的语音错误。一、音质成分方面的错误分析3.1.1 音素3.1.1.1 不注意短元音与长元音在音质上的区别英语音系有四对元音可以利用音长区别词义,它们是(?)和(?),其中带点的元音发音比不带点的长。这是英语元音的区别特征之一。但是,这不是唯一的特征。初  相似文献   

7.
粤语、客家话、壮语是桂东南地区使用最广泛的方言,在语音方面与英语有着很大的差异,导致了该地区母语对英语学习的负向迁移影响很大.本文通过比较英语和这些方言的语音特征,着重分析这些方言在英语元音音素、辅音音素方面具有普遍性的负向迁移,揭示该地区方言对英语语音学习干扰的原因及方式.  相似文献   

8.
《潍坊学院学报》2014,(3):33-37
综合运用语音学、音系学及第二语言习得的相关理论,通过对庄河地区学生英语学习的发音进行实地调查,探究庄河方言语音对英语语音习得的表现。研究发现,庄河方言语音对于当地学生英语语音的习得起有着负迁移影响,主要表现为:庄河地区学生用方言语音[e]代替英语元音[ai],用方言语音j[(■)]代替英语[(■)]和[dr],用方言语音q[(■)]代替英语[(■)]和[tr],用方言语音x[(■)]代替英语[(■)],用方言中的元音y[i]代替英语辅音[(■)]和[r]。针对庄河方言语音对于英语语音习得的负迁移,我们在实际的教学和学习中,不仅应该重视这两种语音系统的不同之处,更应该多进行实际练习,从而减少方言语音对英语语音习得的负迁移影响。  相似文献   

9.
语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数据和1h的测试数据,同时介绍了构建维吾尔语语音识别系统所需要的音素集、词表、文本数据等相关资源,以及用于构建基线系统的脚本。给出了该基线系统在纯净测试数据和噪声测试数据上的识别性能。该数据库为维吾尔语语音识别研究提供了可以借鉴的标准数据库。  相似文献   

10.
在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。  相似文献   

11.
基于小波分析的梅尔频率倒谱参数?   总被引:1,自引:0,他引:1  
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC.  相似文献   

12.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

13.
在语音识别系统中,易混淆语音是导致系统识别率下降的重要原因。汉语音节是由声母和韵母组成的,在易混淆语音中,其韵母部分的混淆度很大。针对易混淆语音的韵母部分,通过改进特征提取的方法来提高易混韵母之间的区分度,提出了一种基于小波分解和线性预测(WLPC)的特征提取方法,并用局部保持映射(Locality Preserving Projections)算法对提取的特征进行了特征变换。实验结果显示,与传统的MFCC特征相比,该特征能更好的区分不同的韵母。  相似文献   

14.
利用语音识别技术,依英语发音的特有性,搭建完整合理的计算机辅助英语发音评测系统。整个系统包括3个部分:语音段验证、语音信号切割和发音评测。其中语音段验证利用置信度评估的技术,并依据置信度阀值对评测语音内容是否需要评测做出判断;语音信号切割是以预先训练好的英语发音声学模型为切割依据,通过强制对位的方式切割出正确的发音区段;英语发音评测是系统的核心,使用的评测方式是比较评测语音和标准语音的相似度,采用4个评测特征:发音完整度、韵律性、语速和准确度进行发音相似度评测。针对不同的特征参数设计合理的评测机制,并对4个特征参数进行加权运算,以建立一个完整合理的英语发音评测系统。实验证明,系统能够给出比较客观的评分,达到预期设计目标。  相似文献   

15.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

16.
基于HTK的普米语孤立词的识别,通过对特定发音人和非特定发音人的语音进行特征分析、预处理、提取MFCC特征参数,从而建立每个普米词的HMM模型,最后采用Viterbi算法进行模型的训练和匹配.实验表明:对特定发音人和非特定发音人,随着普米词个数的增加,识别率虽有所下降,但是变化很小,识别率均超过了95.00%,识别效果很好.语料的信噪比和发音人的发音稳定性是导致识别率下降的重要原因.  相似文献   

17.
一般学者认为,汉语儿化仅对韵尾、韵腹有影响。本文以山东安丘方言为例,指出儿化不仅会影响到韵尾、韵腹,而且也影响到韵头,直至声母。儿化作用贯穿于整个音节,并且引起了一系列的语音变化。  相似文献   

18.
一种改进的DTW语音识别系统   总被引:1,自引:0,他引:1  
苏昊  王民  李宝 《中国西部科技》2011,10(1):38-39,94
动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。  相似文献   

19.
舌头是人类重要的发音器官,对发音时其形状的降维分析能有效协助语言学家分析人类的发音模式。主成分分析(Principal Component Analysis, PCA)是目前最常用的舌位轮廓降维分析方法。近年来,基于深度学习的自动编码器在降维方面被证明优于PCA。然而,舌头隐藏于口腔内部,难以获得大量的相关数据,这使得传统自动编码器无法直接用于舌位轮廓建模研究。为此,本文提出一种面向小样本舌位运动轮廓数据的双阶段自动编码器降维方法。首先该方法采用主动形状模型(Active Shape Model, ASM)产生大量舌头轮廓生理变形数据,并构建通用轮廓重建模型;接着,在第一阶段模型上添加降维层,用于对舌位轮廓数据进行压缩和分析。实验选取了从人类发音X光片中获得的240个元音舌形数据,并将该方法与传统PCA方法进行比较。结果表明,所提出方法获得的元音舌位图谱在二维平面上相对于传统PCA方法,区分度更好,具有更好的舌形降维和重建能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号