期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于修正MFCC参数汉语耳语音的话者识别 总被引：12，自引：1，他引：12

林玮杨莉莉徐柏龄《南京大学学报(自然科学版)》2006,42(1):54-62

耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 相似文献

2.

超音段信息对文本无关话者识别的影响

下载免费PDF全文

汤霖尹俊勋《湖南科技大学学报(自然科学版)》2013,28(2):81-85

超音段信息主要由声调、语调和轻重缓急等信息组成,反映到特征参数就是基频及其时序信息、能量时序信息和音节长度等,这些信息是话者识别系统中的重要特征参数.在分析已有的提取这些特征参数的方法的基础上,提出了先进行语音切分,再提取声调、能量和音节长度等特征,并生成基于Bigram模型的超音段信息参数模型的方法.将此特征参数形成的模型作为使用MFCC为参数的话者识别主系统的辅助决策模型,实验结果表明：融合超音段信息模型的文本无关话者识别系统的EER相对下降10.5%. 相似文献

3.

声码器半解码参数用于说话人身份确认 总被引：2，自引：0，他引：2

李晓先戴蓓蒨李辉《中国科学技术大学学报》2005,35(4):523-529

面向通信领域广泛使用的线性预测声码器，设计了一种不经过“解码—特征提取”过程，而直接由传输码流截取说话人特征的方法，并针对宽带自适应多码率声码器（ANN-WB）建立了与文本无关的话者确认系统．系统采用基于概率统计模型的GMM-UBM结构，以LPC倒谱作为主要的话者特征矢量，并加入基音衍生参数以提高确认性能．实验表明，该系统在运算速度提高一个数量级的情况下，达到了与基于重建语音的话者确认系统相接近的性能，且对码率失配具有良好的鲁棒性．相似文献

4.

基于GMM统计参数和SVM的说话人辨认研究

贺志阳张玲华《南京邮电大学学报(自然科学版)》2006,26(3):78-82

支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。相似文献

5.

基于EMD法的语音信号特征提取方法研究

王彪《科学技术与工程》2012,12(10):2462-2464

为了提高语音信号的识别率,提出了一种基于经验模态分解(EMD)法的语音信号特征参数提取方法。该方法先对语音信号进行EMD分解,获得其内模函数;再进行FFT和DCT变换,得到特征分量,以此构成语音信号新特征参数。最后采用高斯混合模型(GMM)进行说话人语音识别,实验表明新特征参数取得了较好的识别率。相似文献

6.

音源特征用于提高话者确认系统的鲁棒性

吴礼福姚志强戴蓓缮李辉《中国科学技术大学学报》2006,36(5):476-480

给出了一种采用音源特征信息提高以声道倒谱参数为特征的话者确认系统噪声鲁棒性的方法,提取了两类音源特征参数：短时（单帧）特征参数和较长时（多帧）特征参数,并分别构建了两个利用音源特征参数的与文本无关的话者确认辅助子系统.采用线性加权对主、辅子系统的输出进行融合.在NIST＇03数据库上100个男性话者的对比实验表明,音源特征参数具有良好的噪声鲁棒性,声道特征与音源特征具有较强的互补性,尤其是在较强的噪声背景下,利用音源特征可以有效地提高以声道倒谱参数为特征的确认系统的鲁棒性. 相似文献

7.

基于LPCC的话者识别系统

余良俊张友纯《科技资讯》2007,(31):1-2

本文讨论话者识别系统的处理过程,从信号预处理开始(数字采样、预加重滤波、加窗分帧)开始,分别介绍了语音信号的端点检测、特征参数提取以及简单识别的方法,并对每个步骤可用的几种方法在实验的基础上进行了分析对比.最终,根据选择的LPCC特征参数和识别算法设计了基于LPCC的话者识别系统. 相似文献

8.

基于高维空间映射失配补偿方法的说话人确认

郭伟李辉许敏强刘青松《中国科学技术大学学报》2010,40(2)

针对电话手机语音的文本无关说话人确认中,训练集语音和测试集语音来自不同信道所产生失配而导致系统性能下降的问题,采用一种基于高维空间映射的方法对系统进行补偿.在分析了已有的说话人确认系统的基础上,提出了一种基于特征参数映射支持向量机模型(PSVM)的说话人确认系统.首先用大量已知信道类型的语音训练出信道空间及映射矩阵,然后训练语音和测试语音都通过映射,消除因信道不同而导致的失配影响.在NIST数据库上的实验结果表明,这种方法弥补了训练语音和测试语音的失配,说话人确认系统的性能有了明显的提高. 相似文献

9.

基于多约简α-GMM和SVM的说话人确认

《兰州理工大学学报》2015,(4)

针对说话人确认识别率低及鲁棒性差的问题,提出一种基于多约简α-GMM和支持向量机的说话人确认算法.该算法首先采用主成分分析方法对语音特征向量降维,在约简向量集上为话者建立α-GMM模型,并根据模型间的KL散度进行聚类,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果.仿真实验结果表明该算法具有良好的鲁棒性和较高的识别率. 相似文献

10.

基于话者聚类的多系统输出评分融合话者确认

上官葳戴蓓蒨《兰州大学学报(自然科学版)》2008,44(3)

针对短电话语音条件下文本无关说话人确认问题中语音数据不充分和电话信道失配问题,利用说话人特征参数之间的互补性,提出了一种对多子系统输出评分采用多个网络的融合策略,提高了话者确认系统的整体性能.实验结果表明:与传统的所有话者共享一个输出评分融合网络相比,应用多个融合网络,在采用KLD和GLR模型相似性测度时,系统等误识率分别下降了12.7%和10.8%. 相似文献

11.

一种量子神经网络说话人识别方法 总被引：2，自引：1，他引：1

下载免费PDF全文

王金明王耿郑国宏孙健《解放军理工大学学报(自然科学版)》2012,(3):242-246

针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。相似文献

12.

语音识别中基于支持向量机的声学模型研究

廖文婧《科技资讯》2009,(19):22-24

在语音识别中,声学模型常常采用聚类后的状态（senone）作为建模单元,其输出的分布大都采用高斯混合模型（GMM）,该模型采用多个高斯分布的加权和,描述复杂的概率分布。然而,由于该模型采用最大似然估计的方法,仅仅考虑了本类样本的概率最大化,而并没有考虑与其他类之间的关系。本文尝试对基于支持向量机的声学模型进行研究,支持向量机（Support Vector Machine,SVM）方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的机器学习方法在利用SVM判别senone类别时,本文对每个senone建立一个一对多模型。然后把SVM模型输出结果中的距离软化为得分,选取得分最高者判决为此senone所属的类别实验证明,利用SVM能够很好地判别senone,区分性要优于GMM。相似文献

13.

基于共振峰参数和分类线性加权的源-目标声音转换

王海祥戴蓓蒨陆伟张剑《中国科学技术大学学报》2006,36(11):1153-1159

源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.为了克服分类线性转换算法(CLT)中分类不准带来的误差,引入了分类线性加权转换的策略,给出了一种基于径向基函数神经网络的分类线性加权转换算法(WCLT).在微软汉语普通话语音数据库上对转换语音分别作了客观和主观评估,验证了分类数目和训练集对两种转换算法的影响.实验结果表明,WCLT算法的转换效果优于CLT算法,一定程度上克服了高斯混合模型的转换算法(GMM)转换语音时,频谱过分光滑的现象,并在只有较少训练集数据时也能得到较好的转换效果. 相似文献

14.

WCCN聚类序列核函数在话者识别中的应用

邢玉娟李恒杰胡建军王万军《云南大学学报(自然科学版)》2013,35(2):167-172

针对说话人确认系统中GMM超向量建模计算复杂度高以及易受信道干扰的问题,提出一种新型的基于Bhattacharyya距离聚类的WCCN序列核函数算法.首先计算话者GMM模型之间的Bhattacharyya距离,根据该Bhattacharyya距离对话者模型进行聚类,得到聚类中心模型;紧接着对聚类中心模型的均值向量进行MAP自适应,进而生成超向量序列核函数;最后采用WCCN平滑归一化技术对序列核函数进行信道补偿,抑制噪音和信道畸变对核函数的影响.将该Bhattacharyya聚类WCCN核函数应用到SVM说话人确认系统,仿真实验结果表明该核函数可以有效地提高系统的识别准确率和识别速度. 相似文献

15.

基于掌上电脑录音的说话人辨认

殷启新韩春光杨鉴《云南民族大学学报(自然科学版)》2003,12(4):251-254

说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认，而特征矢量的协方差矩阵取不同形式时，比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明，当特征矢量参数协方差矩阵为满矩阵时，EM算法能更有效估计GMM参数，有效提高识别率。相似文献

16.

基于LPC分析的语音特征参数研究及其在说话人识别中的应用 总被引：1，自引：0，他引：1

张玲华郑宝玉杨震《南京邮电大学学报(自然科学版)》2005,25(6):1-6

对LPC(线性预测系数)参数及其派生参数进行了研究,重点讨论了各参数的计算方法,在此基础上提出了一种由LPC参数和语音帧能量构成的组合参数。利用GMM对20个说话人进行了闭集文本无关说话人识别实验。结果表明,与LPC参数的派生参数相比,该组合参数可以以较少的运算量取得与LPC派生参数相当的识别效果;与直接使用LPC参数相比,该组合参数能够在运算量增加不明显的情况下改进系统的性能,特别是在测试音长度较短的情况下,对性能的改进尤为明显。相似文献

17.

基于CGRU多输入特征的地空通话自动切分

郭东岳林毅杨波《四川大学学报(自然科学版)》2020,57(5):887-893

自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98. 相似文献

18.

MLLR特征的SVM语种识别算法

钟山刘加《清华大学学报(自然科学版)》2009,(Z1)

为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。比较了均值方差和排序两种归一化方法,并将多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明:排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。相似文献