首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。  相似文献   

2.
对于电话手机语音的文本无关说话人确认,语音受到传输信道、话筒等的影响,失配问题尤为显著.为此提出一种GMM-UBM框架下基于失配信息子空间的说话人确认失配补偿方法,该方法利用失配信息子空间和基准信息模型获得训练和测试语音的相对失配信息,此失配信息是失配信息子空间中超矢量的一种线性组合,补偿更为准确,能够根据失配对不同语音类的不同影响,对不同的语音类进行相应的补偿.NIST06数据库上的实验表明,经过失配补偿的系统性能在EER和MinDCF有近50%的提高.  相似文献   

3.
针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高.  相似文献   

4.
本征音话者识别方法能够在一定程度上补偿因文本无关造成的语音类失配,但它并没有涉及另一个重要的失配因素——信道失配.本文提出了一种在本征音方法基础上补偿信道失配的方案.首先用本征音方法进行语音类失配补偿,然后采用WCCN(类内方差规整)进行信道失配补偿,从而得到经过语音类失配补偿和信道失配补偿的话者因子并将其作为话者模型,最后采用余弦评分方法进行性能评测.实验表明,本文方法在等误识率和最小检测代价函数上具有较好表现,同时本文方法对话者建模所需要空间较小.  相似文献   

5.
环境失配问题严重影响着说话人识别的性能,这一问题在非平稳噪音条件下表现得更为显著.为了增强说话人识别在环境失配条件下的鲁棒性,基于稀疏表示提出了一种高维鲁棒语音特征的生成方法,并针对上述高维语音特征的稀疏特性提出了一个说话人模型.在该说话人识别方法中,首先以优化的联合基作为稀疏表示的基,在此基础上对信号进行分解,用于从带噪语音中剥离噪音成分,并从中提取语音信号的内蕴时频结构;之后在此基础上提出了一种鲁棒的稀疏谱语音特征,并根据该特征的高维稀疏特性给出了基于混合k-means的说话人模型.实验结果显示,与基于梅尔倒谱系统特征的基线系统相比,提出的说话人识别方法在NIST SRE-2003语料库条件下的等错误率下降了28.16%,在Chinese-863语料库和不同信噪比(5dB和0dB)的非平稳汽车噪音环境下的等错误率分别下降了9.84%和14.21%.上述结果表明,在环境失配情况下,提出的说话人识别方法的性能明显优于基于梅尔倒谱系数特征的基线系统.  相似文献   

6.
近来出现的高质量低价格的录音及回放设备的高保真度使人耳也难以分辨出原始语音和回放语音,这使得录音回放攻击对说话人识别系统的安全造成了很大威胁.为此,文中提出了一种基于信道模式噪声的录音回放攻击检测方法.该方法根据原始语音与回放语音信道的差异,针对不同信道中的录音及回放设备引入不同的信道模式噪声,采用去噪滤波器和统计帧分...  相似文献   

7.
针对短电话语音条件下文本无关说话人确认问题中语音数据不充分和电话信道失配问题,利用说话人特征参数之间的互补性,提出了一种对多子系统输出评分采用多个网络的融合策略,提高了话者确认系统的整体性能.实验结果表明:与传统的所有话者共享一个输出评分融合网络相比,应用多个融合网络,在采用KLD和GLR模型相似性测度时,系统等误识率分别下降了12.7%和10.8%.  相似文献   

8.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

9.
高精度扩频测距系统中,信道设备间阻抗失配引入的测距误差是影响系统性能的重要因素.在互连信道设备阻抗失配对扩频测距影响的系统模型基础上,给出了信道设备阻抗失配对扩频测距影响的量化结果,深入分析了一种大型测距系统阻抗失配评估方法.研究成果可为提高高精度扩频测距系统测距精度以及系统性能评估提供支撑.  相似文献   

10.
防止假冒者闯入说话人识别系统   总被引:3,自引:0,他引:3  
如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40%左右.  相似文献   

11.
提出了一种适用于正交频分复用(OFDM)通信系统的信道估计盲算法,给出了该算法的理论基础和计算机仿真结果.该算法以子空间方法为基础,并利用了OFDM通信系统协议中的循环前缀信息.该算法还考虑了现有OFDM协议中的空闲子载波信息,并具有计算量相对较小、抗循环前缀长度不足和抗信道长度过估计等优点.  相似文献   

12.
基于调制域谱减法的鲁棒性说话人识别   总被引:1,自引:1,他引:0  
针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。  相似文献   

13.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

14.
以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(uni-versal background,UB)数...  相似文献   

15.
随着说话人识别技术的发展,实用有效的说话人识别系统越来越成为研究的重点。语音特征参数的鲁棒性直接影响一个说话人识别系统的具体性能,过去主要针对移动通信环境下存在信道失真的问题,研究差分倒谱的鲁棒性。文中则主要在加性白噪声环境下研究M el倒谱参数、M el差分倒谱参数的顽健性以及它们经过倒谱系数零均值化(CMN)处理后识别性能的改进。从仿真结果可以看出:在加性白噪声环境下,差分倒谱参数具有很好的鲁棒性;倒谱系数零均值化能有效的除去加性白噪声。  相似文献   

16.
提出一种采用超音段韵律特征和GMM-UBM模型结构的文本无关的说话人识别方法,用多尺度小波分析方法从短时倒谱参数MFCC和基频F0随时间变化的韵律中分别提取可用于文本无关说话人识别的超音段韵律特征参数PMFCC和PF0,并组成联合参数PMFCCF0.在NIST068side-1side复杂背景电话手机语音数据库上的说话人确认实验则表明,采用一阶小波分析方法提取的超音段韵律参数PMFCC的识别性能与短时MFCC相当,采用超音段韵律特征PMFCCF0的系统确认性能比采用短时MFCC系统有较大的提高.在微软数据库进行不同信噪比测试语音的说话人辨认实验表明,PMFCCF0有比短时MFCC更好的噪声鲁棒性.  相似文献   

17.
针对说话人识别的噪声鲁棒性问题,在对数谱最小均方差误差估计算法基础上,采用改进的最小值控制递归平均算法对语音帧信噪比进行估计,通过对前一帧的短时功率谱进行2次平滑和前向多帧最小值搜索,结合语音存在概率估计出当前帧的信噪比,并根据信噪比自适应调整增益因子的大小,对噪声进行消除。构建了一种改进的LSA语音增强方法,使用该方法可以使增强后的语音保持较高的自然度。实验结果表明,与MMSE-LSA算法比较,改进的LSA算法具有更好的语音增强效果,在5dB各类噪声环境下,其平均信噪比较MMSE-LSA算法提高1.36dB,主观语音质量评估平均提高8%。将该方法用于说话人识别系统,其检测代价较采用MMSE-LSA算法的系统平均降低3%。  相似文献   

18.
融合场景及交互性特征的多人行为识别   总被引:1,自引:0,他引:1  
人类的行为复杂多样,场景、外观、位置等信息均与行为息息相关.本文针对如何高效地综合利用这些信息的问题,提出了融合场景及交互性特征的多人行为识别方法,使用双通道的方式分别提取个体外观特征与场景特征.对于个体通道,采用注意力机制模块来关注与行为相关度更大的区域,并将提取的个体外观特征结合位置特征输入图卷积网络进行关系推理.其中,图卷积网络采用了余弦相似度的方法度量个体特征之间的相关性,并结合个体之间的位置特征进行关系推理;对于场景通道,使用在place365数据集上预训练的ResNet 50提取场景特征.最后,本文将个体以及场景通道所得的特征进行加权融合,得到群组以及所有个体的行为识别结果.在Collective Activity Dataset(CAD)数据集上的实验表明,该方法能提高行为识别的准确率,群组行为以及个体行为的准确率分别达到了92.29%与78.19%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号