首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
语声转换通过改变语音信号的声学特征参数来调整语音的个性特征,从而使得转换后的源说话人语音听起来就像是目标说话人的声音一样.系统地介绍了当前语声转换技术的发展状况,在描述语声转换技术的应用场景和系统框架的基础上,着重阐述了系统的转换模块,即声道特性的转换和韵律转换,特别是重点介绍了声道特性的转换算法.简要地介绍了系统性能的测试方法,最后对全文进行了总结,并针对当前语声转换技术还存在的一些问题,对未来的发展进行了展望.  相似文献   

2.
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。  相似文献   

3.
高斯混合模型(GMM)在语音转换中得到了广泛应用,但其最大缺点在于进行谱包络转换时存在过平滑问题.研究了过平滑现象主要由转换函数中的均值项造成.因此提出一种替换均值法,在各均值项所对应的高斯混合模型类内,使用后验概率与均值项的后验概率最接近的特征来代替转换函数中的均值项.实验表明,采用该方法的语音转换算法能有效缓解过平滑现象,改善转换语音的听觉感知特性.  相似文献   

4.
根据语声控制过程的基本原理,讨论了实现系统的硬件方案,提出了一种采用高速DSP芯片TMS 32010实现并能独立工作的硬件结构;结合所设计硬件的特点,研讨了自动分析与自动识别输入命令的具体方法,并编写了相应的系统软件.最后给出了实验的结果,并对系统的进一步扩展提出了建议。  相似文献   

5.
基于高斯混合模型GMM的说话人识别方法   总被引:1,自引:0,他引:1  
臧晓昱 《科技信息》2006,2(1):21-17
高斯混合模型(GMM)是一种经典的说话人识别算法,本文在实现其算法的同时,主要模拟了不同噪声环境情况下高斯混合模型(GMM)的抗噪声性能,得到了一些有益结论。  相似文献   

6.
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.   相似文献   

7.
基于GMM的语音帧得分上的重优化   总被引:1,自引:1,他引:0  
在基于高斯混合模型的说话人鉴别中,对两个模型的整句得分A和B分别做归一化,并不能改变A和B的大小关系,也就是说,归一化与否并不影响系统的识别率.提出了一种基于语音帧得分下的非线性变换,重新调整了测试语句对各个模型得分的排序结果,在不影响原有正确识别的前提下,使原本被误识的部分语句得到确认.用138人的YOHO语料库做的实验,相对误识率降低了44.17%.  相似文献   

8.
提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CnV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果.  相似文献   

9.
基于MFCC和GMM的个性音乐推荐模型   总被引:1,自引:1,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%.  相似文献   

10.
提出并实现了一种基于广义人工神经网络和STRAIGHT模型的高效基频轨迹跟踪算法.一方面,STRAIGHT模型可以对语音信号的基频进行较大幅度的修改而不至于引起合成语音质量的下降.另一方面,利用人工神经网络优良的预测能力,学习源说话人和目标说话人的基频轨迹之间的内在联系,实现基音频率的转换.语谱图分析、主观意见分评价结果表明:提出的基频轨迹跟踪算法在合成语音质量及目标特征映射上都远远好于传统的基频转换算法.  相似文献   

11.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

12.
基于G auss ian混合模型的音色变换算法在预测目标说话人频谱时会出现过平滑问题,导致声音转换结果的音质下降。该文分析了造成过平滑问题的原因,并提出一种考虑帧间动态特征的音色变换改进算法,在估计参数的目标函数中加入了连续性和方差的影响,从而改善了映射结果的帧间连续性,并使方差最大化,克服了过平滑现象。实验表明该算法在保证变换结果的目标倾向性的同时,能够使变换语音的音质主观意见得分由3.11提高到3.89,证明动态特征对提高音色变换的音质有重要意义。  相似文献   

13.
运动目标阴影在很大程度上会影响运动目标跟踪、行为识别的正确性和有效性.为此,文中提出了一种基于混合高斯模型和马尔科夫随机场的自适应阴影检测方法.该方法首先对混合高斯模型进行改进,使其可以自适应调整参数学习率以消除浅阴影;然后采用马尔科夫随机场综合邻域的空间依赖性信息进行精确的阴影检测.为了提高基于马尔科夫随机场的阴影检...  相似文献   

14.
简单描述了波形音频文件的格式,提出了一种压缩波形音频文件的方法,给出了压缩依据和压缩结果,实验结果表明压缩方法是可行的。  相似文献   

15.
随着社会经济的发展和城市化进程的加快,如何对公共场所人群行为进行监控,防止由于人群密度过高导致的重大伤亡事件发生是很有必要的。结合混合高斯模型和灰度共生矩阵提出一种监控人群行为的算法,将纹理特征通过灰度共生矩阵计算特征量,机器学习所有特征量来判断人群行为,并通过标准数据集和自行拍摄数据集验证算法的有效性。采用人群的整体特征来表征不同人群,通过机器学习来区分不同人群的行为情况,可用于安防监控、资源管理等领域。  相似文献   

16.
结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。  相似文献   

17.
随着橄榄油掺假现象日趋严重,寻找一种简单有效的鉴伪分析方法至关重要.采用基于粒子群优化的高斯混合模型和高斯混合回归结合傅里叶变换红外光谱对橄榄油掺假样品进行定性和定量分析,取得了较好的分析结果.  相似文献   

18.
一种基于马可夫过程统计模型的语音激活检测方法   总被引:3,自引:0,他引:3       下载免费PDF全文
根据语音的特点,以一阶马可夫过程统计模型对语音进行建模,并在此基础上对语音的激活检测进行了性能分析。在方案的实现过程中,采用了多种平滑因子,进一步改进了语音判决的正确性。与通常所用的检测方法相比,在性能上有了一定程度的提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号