首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 694 毫秒
1.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

2.
一种量子神经网络说话人识别方法   总被引:1,自引:1,他引:1       下载免费PDF全文
针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。  相似文献   

3.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

4.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。  相似文献   

5.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

6.
一种基于小波神经网络混合模型的说话人识别方法   总被引:2,自引:2,他引:0  
提出一种混合模型,即将隐马尔可夫模型(HMM)和小波神经网络(WNN)相结合应用于说话人识别的模型.该方法利用HMM的时序建模能力以及小波神经网络较强的模式分类能力,进行与文本无关的说话人的识别.实验表明,采用这种混合模型可以提高系统的识别率,特别在噪声环境中具有一定的噪声鲁棒性,提高了识别性能.  相似文献   

7.
为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法.  相似文献   

8.
王彪 《科学技术与工程》2012,12(10):2462-2464
为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。  相似文献   

9.
为了研究模糊聚类算法在高斯混合模型(GMM)参数获取方面的应用,采用模糊C均值算法(FCM)进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率.  相似文献   

10.
建立一种好的声学模型对汉语方言识别系统的识别率有着重要的影响.为了改善汉语方言辨识效果,提出了一种新的高斯混合模型初始化方法.该方法将谱聚类算法运用到高斯混合模型参数的初始化之中,并与传统的K-Means初始化方法进行了比较.实验结果表明,谱聚类算法能够更好地优化高斯混合模型参数,并且系统辨识率也有了相对提高.  相似文献   

11.
与文本无关的话者识别一般采用高斯混合模型(GMM),而AdaBoost算法是用于提高各种现有学习算法精度的一种通用的优化算法.论文中讨论如何应用AdaBoostGMM算法进行说话人识别.  相似文献   

12.
针对传统的分类器融合存在的诸多问题,提高情感检测正确率,采用双模态(音频、视频)参数提取,选择差异性强的组合小波神经网络(MWNN)与混合高斯模型(GMMs)分类器.在语音韵律、音质特征与人脸几何特征提取后,对提取后的特征用主元分析法(PCA)进行降维,对分类器进行匹配化输出,最后引入GA算法来搜索最优的融合系数向量,充分发挥各分类器本身对特定情感的敏感特性.实验证明,与传统的融合算法相比,经匹配化的GA融合算法将识别率提高了4%~10%,具有更高的识别率与更强的泛化能力.  相似文献   

13.
目标跟踪是计算机视觉的关键技术,但快速运动所导致的目标运动模糊会影响跟踪的精度.提出融合高斯混合模型和深度学习的目标跟踪算法,利用高斯混合模型对目标视频进行建模,在卷积神经网络中提取浅层和深层的图像特征,将两个特征的响应值融合后实现跟踪目标的定位.首先,根据高斯混合模型建立样本数据集,利用概率密度函数筛选数据,依据正态分布获得对应的高斯分量;其次,在深度学习框架下对高斯混合后获得的样本数据提取浅层和深层特征;最后,将提取的浅层与深层特征响应值进行融合,并更新目标模型,实现目标跟踪定位.该算法在VOT-2016公开的数据集进行实验,与6个视频跟踪算法对比分析.实验表明,所提的算法表现出较好的性能,特别是在快速运动的评价指标中,该算法的抖动模糊精度比ECO算法提高6. 25%.  相似文献   

14.
本文利用主分量神经网络分析法(PCANN)和反向传播神经网络,提出了一种具有较强自适应性和较高识别率的说话人识别方法.在此算法过程中,主分量分析法主要是对语音信号的原始特征作分析以得到更好的特征参数;BP神经网络则是作为一个分类器对说话人进行分类.文章将主分量分析与BP神经网络相结合,提高了识别的正确率,增强了系统抗噪声能力,减少了训练时间和计算量,同时简化了网络结构.  相似文献   

15.
为了提高系统的鲁棒性,联合二代小波和TEO一起对语音进行去噪.为了解决动态环境下的说话人识别的误识率问题,在识别阶段,把小生境粒子群算法应用于GMM之中.从实验得出,采用本文提出的参数对于说话人识别的效果较好.采用基于小生境粒子群的高斯混合模型进一步提高了识别性能.  相似文献   

16.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

17.
一种新的高斯混合模型参数估计算法   总被引:3,自引:0,他引:3  
该文提出了一种高斯混合模型(GMM)参数估计的改进算法.原始的特征向量先经Schmidt正交化消除各维间的相关性,再用数学形态学方法估计出各维概率分布中混合分量的真实个数,最后按真实的混合分量个数用EM算法对各维分别作标量GMM参数估计.该方法能缓解GMM传统参数估计算法引起的“不易扩展”的不便.实验结果表明,将其应用于说话人辨认,能在较大幅度提高训练速度的基础上相对传统GMM参数估计方法获得更高的识别率.  相似文献   

18.
基于高斯混合模型GMM的说话人识别方法   总被引:1,自引:0,他引:1  
臧晓昱 《科技信息》2006,2(1):21-17
高斯混合模型(GMM)是一种经典的说话人识别算法,本文在实现其算法的同时,主要模拟了不同噪声环境情况下高斯混合模型(GMM)的抗噪声性能,得到了一些有益结论。  相似文献   

19.
针对说话人确认识别率低及鲁棒性差的问题,提出一种基于多约简α-GMM和支持向量机的说话人确认算法.该算法首先采用主成分分析方法对语音特征向量降维,在约简向量集上为话者建立α-GMM模型,并根据模型间的KL散度进行聚类,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果.仿真实验结果表明该算法具有良好的鲁棒性和较高的识别率.  相似文献   

20.
源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.为了克服分类线性转换算法(CLT)中分类不准带来的误差,引入了分类线性加权转换的策略,给出了一种基于径向基函数神经网络的分类线性加权转换算法(WCLT).在微软汉语普通话语音数据库上对转换语音分别作了客观和主观评估,验证了分类数目和训练集对两种转换算法的影响.实验结果表明,WCLT算法的转换效果优于CLT算法,一定程度上克服了高斯混合模型的转换算法(GMM)转换语音时,频谱过分光滑的现象,并在只有较少训练集数据时也能得到较好的转换效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号