首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

2.
基于GA/VQ的说话人辨认的研究与实现   总被引:3,自引:0,他引:3  
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。  相似文献   

3.
采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。  相似文献   

4.
阐述了分析非线性、非平稳信号的Hilbert—Huang变换(HHT)算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。  相似文献   

5.
应用于说话人识别的矢量量化算法在匹配识别时需要对已有码本进行全搜索,当说话人数量增加时,全搜索的匹配计算量也随之增大,影响系统性能,且不利于片上系统应用开发。针对这一问题,本文提出码本聚类矢量量化算法,通过对训练得到的码本进行聚类处理,获取说话人码本的分类情况及各子类的代表码本。在匹配识别时,首先确定待识别说话人所属的子类,再与该子类的初级码本进行匹配,最终确定说话人身份,通过这种方式减少了与其他不可能子类码本之间的匹配计算量。实验结果表明:选择优化后的码本聚类方式,系统使用全搜索计算次数的42.56%时,误识别率不超过5.00%。  相似文献   

6.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

7.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

8.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。  相似文献   

9.
基于矢量量化的组合参数法说话人识别   总被引:5,自引:0,他引:5  
 说话人识别的方法很多,提出的基于矢量量化(VQ)的算法,在语音特征表征上利用几种特征参数的组合使用来提高识别率,在VQ过程中,经典的K均值算法收敛速度快,但极易收敛于局部最佳点,为了使聚类算法收敛于全局最优点,同时提高识别率,采用模拟退火算法来改善聚类码本质量.讨论了具体的算法实现,并给出了一些实验数据,实验结果表明该处理方法是有效的.  相似文献   

10.
采用线性预测倒谱系数(linear prediction cepstrum coefficient, LPCC)作为语音的特征参数,矢量量化(vector quantity,VQ)方法进行模式匹配,探讨声纹识别以实现身份认证,并对此识别方法进行了相关的实验.通过验证,这种方法可以区分不同的说话人,并且在做说话人辨认实验时可达到较高的识别率.  相似文献   

11.
把KLT和重叠子帧用于在噪声环境下的说话人辨认.基于重叠子帧的分离方法,提出了一种有效技术去建立特征矢量矩阵和取得KLT技术的优点的有效性.做了几个实验.和GMM相比较,采用KLT/MMCE的辨认率得到了明显的提高.特别是当混合数达到128时,辨认率达到了98.5%.因此,实验结果现实所提出的方法确实能减少计算量和提高系统的辨认率.  相似文献   

12.
运动物体检测是视频监控系统的一个重要组成部分。针对经典码本目标检测算法存在的自适应动态背景能力不足,以及在复杂环境下检测精确度差的问题,提出一种基于区域信息的自适应码本目标检测算法。首先,利用添加学习率的方法对背景模型进行自适应更新以使其适应不同的光照环境。其次,结合区域信息,将待检测像素的码本和周围像素的码本融合,得到更为精确的背景模型。最后,对前景像背景一样进行建模和更新,使得前景和背景模型可以在预设参数的控制下相互转化,消除由于背景变化造成的误检。实验结果表明:所提算法在有随机噪声及光照变化的复杂环境下,依然具有较好的检测率和较好的鲁棒性。基本满足动态场景中运动目标检测的精度高、速度快、抗噪强以及光照适应性好等要求。  相似文献   

13.
为了提高对环境噪声的检测水平,增强监控系统对噪声数据的处理能力,利用GPRS作为通信手段,通过DataSocket技术实现了环境噪声虚拟仪器监控系统。依靠Labview强大的数据处理和图形显示能力实现了对环境噪声数据的采集、显示、分析处理。利用51单片机实现现场声压采集,通过单片机与上位机的通讯实现声级数据的实时显示以及隔音挡板的升降控制。试验证明本系统可靠、直观、易于操作。  相似文献   

14.
在柴油发动机气缸压力的识别过程中,针对缸盖振动信号的信噪比低且呈非平稳特性,影响神经网络对气缸压力识别的问题,提出了在径向基函数(RBF)网络训练前,对训练样本进行时域统计平均降噪预处理,再对实验样本进行识别.结果表明,时域统计平均有效提高了训练样本的信噪比,RBF网络经训练后,对柴油发动机气缸压力的识别具有计算速度快、识别精度高的优点.  相似文献   

15.
针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。  相似文献   

16.
脉冲涡流检测是无损检测的一个重要方法.由于检测过程噪声的干扰,信号在测量过程中不可避免的受到不同程度的污染.文章介绍了提升小波的基本原理、阐述了提升小波去噪的算法.利用提升小波对脉冲涡流检测过程中的噪声进行去噪,得到了去噪后的结果波形.实验结果表明,采用提升小波去噪可以使脉冲涡流检测结果信号的信噪比得到显著的提高.  相似文献   

17.
为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。  相似文献   

18.
封闭环境中远距离语音识别会受到混响效果的影响,从而降低语音识别率。混响建模(reverberation modeling for speech recognition,REMOS)是一种在模型域进行混响补偿的新方法,该方法在已知声源位置的情况下能有效提升远距离语音识别精度。但在实际应用中,往往难以预测声源的位置。利用最大后验概率的原理,基于对房间不同区域进行有区别补偿的思想,在按帧的隐马尔可夫模型 (hidden Markov model,HMM)补偿的基础上,提出一种在封闭环境中新的模型补偿方法。该方法利用K均值聚类K-means算法对房间冲击响应 (room impulse response,RIR)的优化集进行聚类,对所属相同类的混响模型进行合并处理,再把合并后的混响模型载入维特比算法中,对清晰语音的HMM模型进行按帧补偿。最后采用后验概率方法选择最佳补偿,使得模型域的混响补偿能最接近精确补偿。实验证明,该方法能进一步提升远距离语音识别的精度。  相似文献   

19.
联合波束形成与谱减法的麦克风阵列语音增强算法   总被引:1,自引:0,他引:1  
考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音信号和噪声信号加以区别,再经过延时补偿单元的相应处理,从而达到衰减噪声的目的,然后采用谱减法对波束形成器输出端的残留噪声进行后置处理.仿真实验结果表明。在小房间混响情况下,与其他方法相比,该方法不仅运算量小。而且具有良好的噪声抑制性能.  相似文献   

20.
加速度计动态模型参数辨识对提高振动与冲击动态测试和动态分析精度等具有重要作用.针对加速度计动态模型参数频域辨识方法中栅栏效应对参数辨识精度的影响,提出了一种基于离散频谱校正-最小二乘(DSC-LS)的加速度计动态模型参数辨识方法,该方法利用H1估计获得零频点坐标,并将FFT+FT离散频谱校正与LS方法相结合,高精度估计出谐振点坐标,然后通过特征点坐标计算加速度计动态模型参数.实验结果表明,该方法能够有效消除栅栏效应对加速度计动态模型参数辨识的影响,具有较高的加速度计动态模型参数辨识精度和抗低频窄带噪声干扰性能.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号