首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。  相似文献   

2.
浅议中国学生英语辅音群发音的问题及对策   总被引:1,自引:0,他引:1  
英语音节的结构和汉语大不相同。汉语普通话的每个音节(字)中从没有两个辅音连在一起的现象,而英语的音节里却有各种各样的辅音群,要正确地对这些辅音群进行发音确非易事。本文对学生在念辅音群时常遇到的困难和常犯的错误作了具体分析,认为他们中或是因为受汉语发音习惯的影响;或是由于不了解英语语音中特有的规律或特点;或是不知道正确的发音原理,并对此提出了一些纠音的教学方法。  相似文献   

3.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

4.
语言是人类交流信息的主要媒介,如果能用数字计算机来识别语言,必然能对人类交流信息的过程带来无可估量的影响。正因为如此,语言识别问题在近二十年来受到了很大的注意,同时由于这一问题牵涉面很广,边缘性很强,因此它又成为计算机科学中使人颇感兴趣的问题之一。Wolf曾对七十年代初期以前有关这一问题的研究作了一个较好的总结(主要指美国对英语识别所进行的研究)。语音的识别看来基本上所采用的是对于音素或类似于音素的识别,这是因为尽管人可以发出频带相当宽的声音,但作为语音来说,大致上是由几十个基本发音单元,即音素所构成的。这样,我们依靠内存于计算机中的数量不多的音素模型就可能进行语言的识别。英语的音素大致有四十多个。汉语(普通话)计算机识别用的音素可以建立在汉语拼音的基础上。如果仅从元音、辅音来说,则也不过三十多个。汉语拼音把发音单元分为声母和韵母,声母即辅音,韵母则包括单元音和复合元音。关于音素识别方面的一些辅助识别工作,诸如音节、清音、浊音、元音的区分等都与英语识别问题相类似,汉语语音识别方面的一个特殊问题是关于声调的识别。汉语以及许多亚洲语系都有声调识别的问题。汉语(普通话)分成阴平(—)、阳平(/)、上(V)、去(\)四声。如果每一个韵母加上四声的变化,则音素模型的数字将大为增多,这将增加识别检索时的困难。问题的复杂性还不止于此,如地(di)、期(qi)这类字,四声的变化只在于韵母本身,因此不影响其他相关连的音素d、q。如烟(yan)、望(wang)、两(liang) 这类带复合元音的字,四声的变化贯串于整个音节,这就是说四声的变化将影响这一音节中的其他音素,这样一来问题的复杂性就提高了。据说有些方言,如广东话,有多至十种声调的,如果把不纯正的发  相似文献   

5.
基于小波分析的梅尔频率倒谱参数?   总被引:1,自引:0,他引:1  
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC.  相似文献   

6.
语速影响音段的语音实现以及相邻音段发音动作的时间关系,然而对普通话音段产出的影响却并不清楚。该文使用动态电子腭位方法分析语速对普通话跨音节辅音丛/#C2/中音段发音动作的时间关系以及V1#C2V2中音段的生理和声学特征的影响。研究发现:辅音丛音段发音动作的绝对时差和动作重叠度随语速的加快而增大;音段的生理/声学时长与语速线性相关,语速对辅音动作幅度的影响与辅音发音部位和方式有关;元音动作幅度减弱,在声学上表现出央化的趋势。研究结果表明:普通话语速控制与音段发音动作的时间关系以及音段动作的时空特征有关,音段发音属性和发音人发音策略也影响不同语速条件下的音段产出。  相似文献   

7.
刘红星 《科技资讯》2011,(32):160-161
":掌握语流中的语音变化规律、连读、辅音爆破和语音同化等技巧"这是《高校英语专业英语教学大纲》在语音教学上对音位变异知识的要求,但是无论是教师还是学生对其的重视程度还远远不够。学习语音要注意静动结合:静态的音素发音要把好关,更要在实践中分析概括动态的音变规律,这才是培养地道英语发音的正确途径。  相似文献   

8.
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低.  相似文献   

9.
该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。  相似文献   

10.
3 乐辅音的功能 乐辅音家族的成员,具有许多相同的特征,也具有许多相同的功能;但是,由于各自音质的不同、发音部位及发声方法的差异,其功能也就有差别。 3.1 拼合 噪音声波跟乐音声波的交衍叫拼合。  相似文献   

11.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大.通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法.  相似文献   

12.
一种基于分形理论的语音分割新方法   总被引:1,自引:0,他引:1  
语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求取语音波形的分维值轨迹可把人的发音分割成句子、词、甚至音素.实验证明,该方法在语音分割中取得了很好的效果.  相似文献   

13.
文章以藏文字母中的七组送气与不送气辅音为研究对象,利用语音空气动力学PAS6600提取各个辅音的气流信号参数.从呼气时长、平均呼气速度、呼出气流量等三项参数,分析相同辅音的各项参数在不同性别间存在的差异,以及不同发音方法和发音部位的辅音在同一气流信号中的不同表现.发现在藏语中不送气音的呼气时长比送气音大;平均呼气速度的大小从男女平均呼气速度的平均值来看送气音的平均呼气速度比不送气音大;呼出气流量的信号虽受发音方法和发音部位的影响,但主要还是跟发音人的性别有关系,即男性的呼出气流量比女性的呼出气流量要大,这主要跟其生理特征有直接的关系.  相似文献   

14.
徐怡 《科技信息》2012,(15):270-270,287
二语学习者在习得二语语音时会把母语中的音素、声调等迁移到二语当中。方言对英语语音学习的负迁移作用明显。本文通过对淄博方言与英语发音规律的对比研究.分析了淄博方言在英语辅音、元音、重音和语调方面的干扰,进而提出在英语教学中可以采取尽量减少母语对英语语音学习负迁移的教学方法。  相似文献   

15.
文章采用语音空气动力学PAS6600,对所提取生理学参数进行分析,从生理上说明汉语普通话辅音中不送气/送气音在发音过程中的生理变化:汉语普通话不送气音与之相对应的送气音,在发音时发音部位并不是完全相同的;塞音在发音时,辅音收紧点越靠后,在听感上越响亮.这主要是由于声门下压力的影响.  相似文献   

16.
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。  相似文献   

17.
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。  相似文献   

18.
在语音识别中,为了得到分布共享的异音模型,先要知道与发音语境无关的音素模型.在本文中,给出一种用于训练与发音语境无关音素模型的方法,然后利用这种音素模型完成对异音模型的训练、以及对异音模型的输出分布的二值决策树聚类.实验结果表明,使用给出的方法,可以实现对与发音语境的无关音素模型,以及异音模型的可靠训练.  相似文献   

19.
黄丽艳  金慧敏 《科技信息》2010,(5):187-187,202
随着交流的日益国际化,英语的实际应用能力以及英语口语的流畅表达成为现代英语学习的必需,英语语音是学好英语口语的基础,辅音是英语语音中的的重要组成部分,从语言学的角度来说,语音是处于语言学习的核心位置,而辅音又是语音学习的核心和基础,所以加强辅音的学习对我国英语学习者是不可忽视的一方面。但是受各方面的影响.我国英语学习者在辅音发音方面存在着各种问题,从语言学的角度,通过对辅音发音方法和发音器官的全面具体分析,总结英语辅音发音问题,并针对这些问题提出具体的训练方法,不仅能为辅音学习提供客观依据,还能为提高英语学习者的语音能力和口语水平提供新的思路。  相似文献   

20.
粤语、客家话、壮语是桂东南地区使用最广泛的方言,在语音方面与英语有着很大的差异,导致了该地区母语对英语学习的负向迁移影响很大.本文通过比较英语和这些方言的语音特征,着重分析这些方言在英语元音音素、辅音音素方面具有普遍性的负向迁移,揭示该地区方言对英语语音学习干扰的原因及方式.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号