期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

牛滨孔令志罗森林潘丽敏郭亮《北京理工大学学报》2009,29(4):351-355

提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%. 相似文献

2.

基于特征比较和模拟退火-遗传算法的普通话音素评分模型

王健关添叶大田《清华大学学报(自然科学版)》2012,(6):880-884

为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。相似文献

3.

声音转换实验系统的研究与实现

刘金凤符敏程德福《南京理工大学学报(自然科学版)》2005,29(Z1):211-214

声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。相似文献

4.

基于修正MFCC参数汉语耳语音的话者识别 总被引：12，自引：1，他引：12

林玮杨莉莉徐柏龄《南京大学学报(自然科学版)》2006,42(1):54-62

耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 相似文献

5.

面向多口音语音识别的声学模型重构

张超刘轶郑方《清华大学学报(自然科学版)》2011,(9):1161-1166

该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合,从而提高了重构后的声学模型的效率。实验表明:该方法在不降低对标准普通话的识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了9.25%和9.21%。相似文献

6.

基于短时和长时特征的语音情感识别研究

林奕琳韦岗《科学技术与工程》2006,6(4):450-454

基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。相似文献

7.

基于隐马尔可夫模型的非母语说话人口音识别

赵征鹏杨鉴普园媛尉洪《云南大学学报(自然科学版)》2004,26(B07):43-46

基于云南境内说话人母语为纳西语、僳僳语的汉语普通话语音，采用隐马尔可夫模型(HMM)，由标准普通话语音库训练得到基线系统的声学模型(HMMSTD)．然后以基线系统的声学模型为初始模型，分别用母语为纳西语、傈僳语的汉语普通话语音训练得到各自的声学模型(HMMNX和HMMLS)，对于未知语音，根据各识别系统的概率得分。采用最大概率准则进行口音的分类判决．实验表明，基于HMM的口音识别系统，其正确识别率达93％。相似文献

8.

子空间域相关特征变换与融合的语音识别方法

陈斌胡平舸屈丹《西安交通大学学报》2016,(4):60-67

为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。相似文献

9.

基于小波分析的梅尔频率倒谱参数? 总被引：1，自引：0，他引：1

董丽娜何怡叶卫平《北京师范大学学报(自然科学版)》2015,(5):469-474

采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC. 相似文献

10.

中小学生汉语普通话单元音特征的动态分析

刘亚丽孟子厚《中国传媒大学学报》2013,20(4)

以中小学生群体为研究对象,考察了不同性别及年龄下该群体汉语普通话单元音的发展特点.结果表明:(1)性别及年龄对汉语普通话单元音特征具有一定的显著性影响；(2)随年龄增长,中小学生单元音共振峰频率值逐渐减小并收敛于成年人相对应的单元音位置；(3)不同年龄及性别下的单元音声学三角形趋近于相似三角形. 相似文献