期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

殷启新韩春光杨鉴《云南民族大学学报(自然科学版)》2003,12(4):251-254

说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认，而特征矢量的协方差矩阵取不同形式时，比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明，当特征矢量参数协方差矩阵为满矩阵时，EM算法能更有效估计GMM参数，有效提高识别率。相似文献

2.

基于GMM全统计参数和SVM的文本无关话者确认 总被引：1，自引：0，他引：1

姚亮亮戴蓓蒨《中国科学技术大学学报》2008,38(12)

针对电话语音条件下的文本无关话者确认,提出了一种基于GMM(Gaussian mixturemodel)全统计参数和SVM(support vector machine)的话者确认方法,以克服语音特征参数直接建立SVM话者模型面临的困难.该方法使用由GM(general model)自适应均值得到的GMM提取统计参数,定义了一种合理利用全部统计参数的特征参数,并以此参数及线性核函数建立了具有良好性能的SVM话者模型.与GMM-UBM方法及另一种基于GMM统计参数和SVM的方法在NIST05SRE数据库中的实验比较,结果表明基于GMM全统计参数和SVM的话者确认方法拥有优异的性能. 相似文献

3.

与文本无关的说话人辨认系统中一种新的使用基音周期方法研究 总被引：4，自引：0，他引：4

段新黄新宇吴淑珍《北京大学学报(自然科学版)》2003,39(5):690-696

研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化（VQ）、高斯混合模型（GMM）分类器结合,使用升正弦窗函数加权的线性预测倒谱系数（LPCC）。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。相似文献

4.

一种模糊高斯混合说话人识别模型

王金明张雄伟《解放军理工大学学报(自然科学版)》2006,7(3):214-219

为了研究模糊聚类算法在高斯混合模型（GMM）参数获取方面的应用,采用模糊C均值算法（FCM）进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率. 相似文献

5.

一种简单有效的说话人身份认证方法

于哲舟周春光李佳慧杨佳东《吉林大学学报(信息科学版)》2003,(Z1)

采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。相似文献

6.

说话人辨认中基于进化策略的最大互信息训练方法

茅晓泉胡光锐唐斌《上海交通大学学报》2003,37(3):335-337

针对最大似然训练分辨能力的不足，把最大互信息训练方法引入到高斯混合模型（GMM）的训练中，并直接采用进化策略实现模型参数的全局训练，以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强，而且摆脱了局部搜索的缺陷。实验结果表明，这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法（EM）生成的系统。相似文献

7.

基于参考说话人模型和双层结构的说话人辨认

王刚邬晓钧郑方王琳琳张陈昊《清华大学学报(自然科学版)》2011,(9):1261-1266

为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。相似文献

8.

基于动态环境下的说话人识别

邱政权《科学技术与工程》2010,10(2)

为了解决动态环境下的说话人识别的辨认率问题,在识别阶段,把小生境粒子群算法应用于GMM之中。从实验得出,采用基于小生境粒子群的高斯混合模型提高了识别性能。相似文献

9.

基于混合Gauss归一化的语音转换方法

宋鹏王浩赵力《清华大学学报(自然科学版)》2013,(6):757-761

针对非对称语料库情况下的语音转换,提出了一种基于混合Gauss归一化的语音转换方法。通过背景说话人模型,分别自适应训练得到源说话人和目标说话人模型。利用训练得到的模型自适应参数,提出了基于Gauss归一化的特征映射方法,为了进一步提高转换效果,进而提出了混合Gauss归一化的方法。针对说话人模型中未被更新的参数,采用KL散度(Kullback-Leibler divergence)方法进行了优化。最后通过主客观实验对提出的算法的有效性进行了仿真和验证。实验结果表明:该文提出的基于混合Gauss归一化的语音转换方法,在倒谱失真度、转换语音的目标倾向度以及感知质量上,都获得了接近基于对称语音库的传统Gauss混合模型(Gaussian mixture model,GMM)方法的效果。相似文献

10.

一种稀少训练数据条件下的语音转换算法

徐宁杨震《南京邮电大学学报(自然科学版)》2010,30(5)

提出了一种新的语音说话人转换算法,利用变分贝叶斯方法估计高斯混合模型参数,进而将其应用于语音转换的声道谱参数映射过程,实现说话人身份转换.将变分贝叶斯算法用于模型参数的估计,一方面解决了训练数据量稀少情况下容易使模型产生"过拟合"的问题,另一方面通过将模型参数概率化,使得参数估计问题不再是"点估计",而成为了"全局估计",因此在一定程度上提高了模型的精度.主观和客观实验结果表明:将基于变分贝叶斯估计得到的统计模型用于语音声道谱参数的转换,明显提高了在训练数据稀少的情况下系统的鲁棒性,同时转换后语音的音质和说话人个性特征均优于经典的语音转换系统. 相似文献

11.

一种量子神经网络说话人识别方法 总被引：1，自引：1，他引：1

下载免费PDF全文

王金明王耿郑国宏孙健《解放军理工大学学报(自然科学版)》2012,(3):242-246

针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。相似文献

12.

说话人识别中SVM核函数参数优化研究 总被引：1，自引：0，他引：1

刘祥楼《科学技术与工程》2010,10(7)

在基于SVM的说话人识别系统研究中,如何获得理想的识别率是亟待解决的问题。SVM核函数是众多影响识别率因素中最明显的。该系统提高识别率的技术关键是SVM核函数的选取及其参数优化。为此,在对三种常用核函数的特点进行研究的基础上,利用网格搜索法来分别进行参数优选,通过实际语音的训练和识别验证识别效果。目前优选参数可以实现识别率≥99.9%且识别时间<0.1 s。相似文献

13.

基于组合核函数SVM的说话人识别方法

樊持杰司巧梅徐岩张丹蔡春华于旭《科技导报(北京)》2015,33(1):90-94

鉴于应用支持向量机进行说话人识别过度依赖于选择核函数的问题,提出一种基于组合核函数支持向量机(SVM)的说话人识别方法.对多项式核函数、径向基核函数进行线性加权,构建既具有全局核函数优点又具有局部核函数优点的组合核函数,并通过多重网格搜索调节权重系数使组合核函数适用于当前数据分布,确定组合核函数SVM 的最优参数,实现对说话人的有效识别.对TIMIT 数据集和含噪声数据集的仿真实验显示,基于组合核函数SVM 的说话人识别性能明显优于单一的多项式核函数、径向基核函数和线性核函数. 相似文献

14.

Advances in SVM-Based System Using GMM Super Vectors for Text-Independent Speaker Verification

赵剑 ;董远 ;赵贤宇 ;杨浩 ;陆亮 ;王海拉《清华大学学报》2008,13(4):522-527

For text-independent speaker verification, the Gaussian mixture model （GMM） using a universal background model strategy and the GMM using support vector machines are the two most commonly used methodologies. Recently, a new SVM-based speaker verification method using GMM super vectors has been proposed. This paper describes the construction of a new speaker verification system and investigates the use of nuisance attribute projection and test normalization to further enhance performance. Experiments were conducted on the core test of the 2006 NIST speaker recognition evaluation corpus. The experimental results indicate that an SVM-based speaker verification system using GMM super vectors can achieve appealing performance. With the use of nuisance attribute projection and test normalization, the system performance can be significantly improved, with improvements in the equal error rate from 7.78% to 4.92% and detection cost function from 0.0376 to 0.0251. 相似文献

15.

基于i-vector全局参数联合的说话人识别

杨明亮龙华邵玉斌杜庆治《重庆邮电大学学报(自然科学版)》2021,33(1):144-151

以高斯通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)和i-vector模型为主的说话人识别算法在实际应用中取得了不错的成绩,但i-vector说话人识别模型中存在没有充分考虑通用背景(uni-versal background,UB)数... 相似文献

16.

融合GMM及SVM的特定音频事件高精度识别方法

罗森林王坤谢尔曼潘丽敏李金玉《北京理工大学学报》2014,34(7):716-722

针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型（GMM）及支持向量机（SVM）的特定音频事件识别算法. 该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板. 实验结果表明,识别准确率达到92.71%. 该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率. 相似文献

17.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

18.

语音识别中基于支持向量机的声学模型研究

廖文婧《科技资讯》2009,(19):22-24

在语音识别中,声学模型常常采用聚类后的状态（senone）作为建模单元,其输出的分布大都采用高斯混合模型（GMM）,该模型采用多个高斯分布的加权和,描述复杂的概率分布。然而,由于该模型采用最大似然估计的方法,仅仅考虑了本类样本的概率最大化,而并没有考虑与其他类之间的关系。本文尝试对基于支持向量机的声学模型进行研究,支持向量机（Support Vector Machine,SVM）方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的机器学习方法在利用SVM判别senone类别时,本文对每个senone建立一个一对多模型。然后把SVM模型输出结果中的距离软化为得分,选取得分最高者判决为此senone所属的类别实验证明,利用SVM能够很好地判别senone,区分性要优于GMM。相似文献