首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 593 毫秒
1.
为了研究模糊聚类算法在高斯混合模型(GMM)参数获取方面的应用,采用模糊C均值算法(FCM)进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率.  相似文献   

2.
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.   相似文献   

3.
为了实现高质量低速率语音编码,提出了高效线性预测Gauss混合模型(Gaussianmixturemodel,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linearspectralfrequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明LP-GMM-LSFQA在20b/帧时量化性能超过预测分裂矢量量化22b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。  相似文献   

4.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

5.
为了实现高质量低速率的语音编码,提出了高效线性预测Gauss混合模型(Gaussian mixture model,GMM)线谱频率参数量化算法(LP-GMM-LSFQA)。线谱频率(linear spectral frequency,LSF)参数先去均值,经过一阶线性预测,得到残差信号,将残差用协方差矩阵为对角阵GMM量化算法进行量化。在此基础上,利用反量化后参数自适应更新GMM的加权系数和均值,进一步提出了预测自适应GMM-LSF量化算法(LP-AGMM-LSFQA)。实验表明:LP-GMM-LSFQA在20 b/帧时量化性能超过预测分裂矢量量化22 b/帧时的量化性能,节约2b/帧;LP-AGMM-LSFQA量化性能优于LP-GMM-LSFQA。  相似文献   

6.
把KLT和重叠子帧用于在噪声环境下的说话人辨认.基于重叠子帧的分离方法,提出了一种有效技术去建立特征矢量矩阵和取得KLT技术的优点的有效性.做了几个实验.和GMM相比较,采用KLT/MMCE的辨认率得到了明显的提高.特别是当混合数达到128时,辨认率达到了98.5%.因此,实验结果现实所提出的方法确实能减少计算量和提高系统的辨认率.  相似文献   

7.
针对应用高斯混合模型(GMM)进行视频建模与分割时的模型选择及参数估计初值选择的难点,提出了一种基于GMM的视频对象分割算法.首先进行特征提取,在特征矢量中引入加权运动信息,可根据不同需要选择合理的加权系数,然后通过分割投影进行模型选择及期望最大化(EM)算法的参数初始化并估计参数,这种初值选择方案使得EM算法的初值和真实值较接近,加快了迭代运算的收敛速度,从而提高了视频对象的分割速度,最后对特征矢量进行聚类分割.仿真实验表明,在保持良好分割效果的同时,所提算法的运算速度约为常规方案的76%,并且具有良好的稳定性.  相似文献   

8.
针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。  相似文献   

9.
针对非对称语料库情况下的语音转换,提出了一种基于混合Gauss归一化的语音转换方法。通过背景说话人模型,分别自适应训练得到源说话人和目标说话人模型。利用训练得到的模型自适应参数,提出了基于Gauss归一化的特征映射方法,为了进一步提高转换效果,进而提出了混合Gauss归一化的方法。针对说话人模型中未被更新的参数,采用KL散度(Kullback-Leibler divergence)方法进行了优化。最后通过主客观实验对提出的算法的有效性进行了仿真和验证。实验结果表明:该文提出的基于混合Gauss归一化的语音转换方法,在倒谱失真度、转换语音的目标倾向度以及感知质量上,都获得了接近基于对称语音库的传统Gauss混合模型(Gaussian mixture model,GMM)方法的效果。  相似文献   

10.
针对说话人确认识别率低且易受到信道干扰的问题,提出一种基于GMM超向量和Fisher判别准则的稀疏分类算法。该算法首先采用GMM通用背景模型生成说话人的GMM超向量,在超向量集上利用类内协方差归一化方法抑制信道的干扰信息,通过计算GMM超向量与整体训练样本集的Fisher判别比来选择更具区分度的语音特征向量,构建高判别性的稀疏性过完备字典。最后,在过完备字典上对语音GMM超向量进行重构,选择重构误差最小的类别作为目标说话人。仿真实验结果表明:Fisher判别准则在稀疏性过完备字典的构建过程中具有较好的特征选择优势,可以提高稀疏分类的准确性。  相似文献   

11.
基于正交混合Gauss模型的脱机手写数字识别   总被引:6,自引:0,他引:6  
在基于统计方法的脱机手写数字识别中 ,为更加有效地描述特征的类条件概率分布 ,设计出性能优良的 Bayes分类器 ,采用了混合 Gauss模型。为减少模型的参数 ,通常假设各 Gauss分量的协方差矩阵为对角阵。由于各维特征之间统计相关 ,因此需要大量的 Gauss分量才能较好地描述特征的类条件概率分布 ,使得混合模型的阶数较高。为降低模型的阶数 ,采用了正交混合 Gauss模型 ,即先对各类别的特征分别进行 KL 变换 ,再将变换后的特征用混合 Gauss模型来表示。其中混合 Gauss模型的参数可以通过 EM算法进行估计。最后 ,在 NIST (National Institute of Standards andTechnology)手写数字样本集上对该方法的识别性能进行了验证  相似文献   

12.
提出了一种新的注册者模型——“时间一空间分布模型(TSDM)”,传统GMM用参数表征训练矢量的空间分布,但舍弃了训练矢量间的时间联系信息,而TSDM利用基于GMM中均值矢量的高阶协方差矩阵,可向训练矢量的空间分布模型中引入一定程度的训练矢量间时间联系.还给出了TSDM的判据生成方法.实验表明,TSDM能在长训练语句时获得与传统GMM相当的识别性能,在短训练语句时表现得更优秀.  相似文献   

13.
为了在训练样本受限的情况下,提高汉语方言辨识的效果,提出了一种基于AdaBoost的汉语方言辨识新方法.该方法将GMM与语言模型组成的辨识系统看成一组弱分类器,然后对这组弱分类器所得的分类结果进行加权投票,最终决定汉语方言测试语音的所属类别.实验结果表明:增加GMM或弱分类器的个数,可以有效提高系统的辨识效果;测试语音越长,系统辨识效果越好;当训练样本有限的情况下,采用AdBoost方法比采用ANN方法具有更高的辨识率.  相似文献   

14.
运用Matlab软件,以自己建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能.  相似文献   

15.
提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CnV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果.  相似文献   

16.
为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。比较了均值方差和排序两种归一化方法,并将多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明:排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。  相似文献   

17.
汉语方言辨识中常用的转移差分倒谱(SDC)特征往往存在较多的冗余信息.对此,提出动态时频倒谱(DT-FC)特征.首先对倒谱矩阵进行离散余弦变换(DCT),然后对变换后的矩阵元素进行重组.基于新特征,在高斯混合模型系统下对闽、粤、吴3种方言进行辨识.实验结果表明,DTFC特征的性能明显优于SDC特征,其平均辨识率可达98.89%,较SDC特征提高了3.1%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号