共查询到20条相似文献,搜索用时 718 毫秒
1.
该文使用动态电子腭位(EPG)研究普通话V1n#C2V2双音节中后续音节C2和V2对前鼻韵尾/n/以及V1的逆向协同发音影响。实验结果发现:C2舌前音和舌面后塞音决定前鼻尾的发音部位和舌形姿态,不存在V2对V1的逆向影响;C2为双唇音和舌尖中音条件下,存在V2对V1n的逆向影响,前者表现为从V1后过渡段开始舌体动作向V2过渡,后者只出现在鼻音时段后部;C2为舌面后擦音和唇齿擦音的时候,前鼻尾发音部位多未同化或部分同化,这可能与发音人的发音策略有关。该结果支持普通话辅音的协同发音阻力等级序列,同时能够为建立普通话发音生理模型奠定理论基础。 相似文献
2.
论述了采用统计模型进行汉语韵律层次结构分析和韵律建模的思路,将韵律结构划分为3个基本层级:韵律词,韵律短语和韵律短语群,提出了一种新的基于统计的韵律结构模型。实验表明该模型对韵律词边界的预测准确率和召回率分别达90.37%和92.48%:对韵律短语边界的预测准确率和召回率分别达82.43%和85.59%。同时,描述了一个汉语连续语流语音合成的选音算法,它适用于基于大语料库的语音合成系统。由于同时考虑单音节、二字韵律词、三字韵律词和四字韵律词,从而降低了因拼接点不连续而造成的音质损失,提高了合成语音的自然度。 相似文献
3.
《清华大学学报(自然科学版)》2017,(12)
对维吾尔语的韵律结构进行了全面的研究,从维吾尔语语音合成(text to speech,TTS)语音库中提取了音节的时长、能量、基频均值、最大值、最小值和基频范围等韵律特征参数,分析了其在音节处于不同韵律层次时的变化规律。提取了语音数据中韵律边界前后的音节延长量、音高重置和无声段等声学特征参数,并对它们的分布规律进行了统计分析。实验结果表明:不同韵律层级之间时长延长量和音高差值随着边界层级的提高而增加;韵律词边界之间没有显著地停顿,韵律短语和语调短语层级边界之间的平均停顿时长分别是154.2和212.8ms。 相似文献
4.
5.
TD-PSOLA技术在汉语语音波形编码合成中的应用 总被引:1,自引:0,他引:1
吴耀中 《福建师范大学学报(自然科学版)》1999,15(1):40-43
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。 相似文献
6.
文章运用EPG对汉语普通话6个辅音后接特定元音/a/进行录音,通过相关软件,提取它们的TC、CA、CC参数进行分析.得出以下结论:汉语普通话辅塞擦音的塞音部分对擦音部分有影响,影响程度主要与发音部位相关,舌尖前音比舌尖后音的塞音部分对擦音部分的影响要大.不送气的塞擦音的舌腭接触前于擦音.用EPG记录发音时舌腭接触状态能够更客观、更精确地记录和描写语音,丰富和修正传统语音学的若干解释和理论. 相似文献
7.
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标. 相似文献
8.
《天津大学学报(自然科学与工程技术版)》2020,(3)
韵律结构预测作为语音合成系统中的一个关键步骤,其结果直接影响合成语音的自然度和可懂度.本文提出了一种基于预训练语言表示模型的韵律结构预测方法,以字为建模单位,在预训练语言模型的基础上对每个韵律层级设置了独立的输出层,利用韵律标注数据对预训练模型进行微调.另外在此基础上额外增加了分词任务,通过多任务学习的方法对各韵律层级间的关系及韵律与词间的关系建模,实现对输入文本各级韵律边界的同时预测.实验首先证明了多输出结构设置的合理性及使用预训练模型的有效性,并验证了分词任务的加入可以进一步提升模型性能;将最优的结果与设置的两个基线模型相比,在韵律词和韵律短语预测的F1值上与条件随机场模型相比分别有2.48%和4.50%的绝对提升,而与双向长短时记忆网络相比分别有6.2%和5.4%的绝对提升;最后实验表明该方法可以在保证预测性能的同时减少对训练数据量的需求. 相似文献
9.
从语音学、语音迁移和感知同化方式等理论和英语语音习得者产生的语音偏误看,以厦门方言为母语的学习者在英语语音辅音系统习得过程中会产生浊塞音、鼻音尾韵、爆破音和声门清擦音等正迁移以及齿龈音、唇齿音、鼻音、摩擦音、软腭音和爆破音等的负迁移现象,其原因在于厦门方言和英语音段音位上辅音系统存在的差异。厦门方言为母语的学习者在英语语音学习中应充分利用正迁移现象,以汉语普通话为英语语音习得的中介与过渡,并利用对比法和多媒体技术等几种有效的方法和途径克服负迁移作用,以提高英语语音学习效果。 相似文献
10.
基于概率频度的普通话韵律结构预测统计模型 总被引:1,自引:0,他引:1
为进一步提高文语转换系统中韵律结构预测的准确度,提出了一个基于概率频度的统计模型的方法,预测韵律词和韵律短语边界两级韵律结构。该方法提取与韵律词和韵律短语边界有关的语言学特征(词性、语法词、长度和位置等),并进行样本训练计算各个特征的概率频度值,最终分别建立韵律词和韵律短语的统计模型。实验结果表明:统计模型的方法对于韵律词和韵律短语边界预测的正确率分别可达90.6%和84.6%,并与决策树算法和T ransform ation-based learn ing(TBL)转换规则学习算法比较,提高10%以上的正确率。 相似文献
11.
在藏语单句的层面上,通过时长参数的统计分析,对韵律词和韵律短语两层韵律单元的时长特征进行了研究.研究结果确定了藏语韵律词和韵律短语的基本大小,韵律词为4±2个音节,韵律短语为6±3个音节;藏语韵律单元的总体时长分布差异较大,但不同韵律单元的时长伸缩幅度差异较小.藏语韵律单元的时长分布类型以尾长型为主;韵律单元边界处普遍具有边界前音节延长,边界后音节缩短现象的特征. 相似文献
12.
13.
该文提出了一种基于Viterbi解码的中文合成音库韵律短语边界自动标注方法,以降低大语料库单元拼接合成系统的构建成本。该方法分为模型训练和韵律标注两阶段:模型训练阶段得到频谱、基频和音素时长的上下文相关隐Markov模型(hidden Markov model,HMM);标注阶段借助训练得到的模型采用Viterbi解码完成韵律短语自动标注。实验结果表明:该方法进行韵律短语边界标注时的F-score值达到77.64%,超过了人工标注时不同标注人员之间的一致性水平;另外该方法可以方便地增加待标注韵律属性,具有良好的扩展性。 相似文献
14.
<正>确划分句子的韵律结构对于提高合成语音的质量具有重要的意义。特征的选择是韵律结构预测的关键因素之一。在中文信息处理中,文本特征可以分为浅层文本特征与深层文本特征。浅层特征包括词、词性、词长等;深层特征包括句法信息、语义信息等。该文在挖掘剖析句法结构、依存句法结构同韵律结构之间关系的基础上,从文本中获取相关浅层和深层文本特征,并采用条件随机场模型实现韵律短语预测。首先以浅层文本特征进行韵律短语识别,然后在此基础上加入句法依存深层文本特征进行模型构建。实验结果表明:加入句法依存特征后,韵律短语预测精确率提高了13.3%,召回率提高了14.69%,F值提高了14.1%。 相似文献
15.
基于小波分析的梅尔频率倒谱参数? 总被引:1,自引:0,他引:1
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC. 相似文献
16.
学习普通话的重要环节是在语流中模仿普通话的节律。停延作为节律的基础,确定了语流中的音步组合,进而关系到协同发音、连续变调等一系列语音现泉。停延的研究对于普通话的朗读教学具有重要的现实意义。该文以《普通话水平测试实施纲要》提供的60篇短文为语料,对于文中的停顿做出了定量、定性的分析:普通话的音步组合层的平均长度为5—7个音节,影响各篇短文音步组合层长度的主要因素是文体风格。该文根据60篇短文的语音资料,提出了设置句中无标点停顿的语义原则、语法原则、语用原则。根据语义原则,只能在有助于语义表达的地方停顿。根据语法原则,只能在构成语法结构的地方停顿。如果在某种情况下构成了非语法停顿,那是为了满足节律的需要。根据语用原则,人们通过对语境的分析,以停顿为手段,实现表情达意的最佳效果和节奏的匀称感。文中以大量例句,对各种语法结构中的语音停顿现泉进行比较说明,做出了令人信服的阐释。 相似文献
17.
《西北民族学院学报》2016,(1):18-22
文章采用语音空气动力学PAS6600,对所提取生理学参数进行分析,从生理上说明汉语普通话辅音中不送气/送气音在发音过程中的生理变化:汉语普通话不送气音与之相对应的送气音,在发音时发音部位并不是完全相同的;塞音在发音时,辅音收紧点越靠后,在听感上越响亮.这主要是由于声门下压力的影响. 相似文献
18.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求 相似文献
19.
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整,可调范围比较大,而且保证了合成语音的清晰度与自然度,非正式测听结果表明:该算法是一种很符合汉语语音的韵律调整的 算法。 相似文献
20.
为提高语音合成系统的性能,产生自然流畅的合成语音,该文结合多种拼接点过渡平滑算法,提出了一种以语境相关的音素为基本单元的基于隐Markov(hidden Markov model,HMM)模型的英语拼接合成系统.该合成方法兼有拼接合成以及参数合成的优点,具有相对的灵活性,以及一定的语音自然度.以音素为基本单元尽可能减少了拼接点的个数,降低拼接失真.实验结果表明,多种平滑算法的采用,保证了拼接边界过渡平滑连贯,提高了最终的拼接效果. 相似文献