期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周静芳陈一宁刘加刘润生《清华大学学报(自然科学版)》2004,44(7):942-945

在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。相似文献

2.

法庭语音证据评价的新范式

张翠玲《中国人民公安大学学报(自然科学版)》2018,(1)

随着法庭对证据技术的科学性要求的不断提高,国际上对于包括语音证据在内的法庭科学证据的检验与评价提出了新的范式,即基于似然比框架的证据评价。从国际上法庭采信证据的标准和要求出发,分析法庭证据评价范式转变的必要性,对法庭说话人识别技术的传统范式及发展现状进行评述,进而提出法庭语音证据评价的新范式,并对其基本内涵和核心要素进行解析,阐明其在法庭实践中的科学性、适用性及发展前景。相似文献

3.

基于SQLite技术的汉语语音识别数据库的建立 总被引：1，自引：1，他引：0

刘祥楼《科学技术与工程》2011,11(14)

建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明：一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。相似文献

4.

法庭说话人识别新范式实证研究

张翠玲 Geoffrey Stewart Morrison Ewald Enzinger 《中国人民公安大学学报(自然科学版)》2018,(3)

目的通过对一起法庭说话人识别案例的实证研究,表明法庭语音证据评价新范式的核心内容及其在司法实践中的具体应用。新范式通过相关数据、定量测量和统计建模计算似然比,量化评价证据价值,并在反映该案实际条件下进行系统的有效性和可靠性验证。方法该案中,检材语音来源于两名嫌疑人之一。采集二人的样本语音,每人5段录音。提取每段录音的美尔频率倒谱系数(MFCC),使用典型线性判别函数进行降维和失配补偿。结果分别使用单变量t分布和正则化逻辑回归方法计算似然比,并对两种方法进行交叉验证。前者似然比在数百到数万之间,后者似然比在数百之内,方向都始终正确。正则化逻辑回归基于训练数据较少的考虑,得到的证据强度更为保守。结论似然比框架可以用于法庭语音证据的评价,其结果也可以在反映案件实际条件下进行验证。相似文献

5.

含语音增强模块的i-向量说话人识别性能分析

李昕李为游寒旭朱杰《上海师范大学学报(自然科学版)》2016,45(2):237-242

为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势. 相似文献

6.

基于FPGA的说话人识别系统设计与实现

何伟胡又文张玲陈方泉《重庆大学学报(自然科学版)》2007,30(9):76-79

针对当前基于DSP等硬核处理器的嵌入式说话人识别系统存在训练和辨认时间较长的问题,提出一种基于FPGA平台与矢量量化原理的说话人识别系统实现方案.在采用遗传算法进行矢量量化的说话人识别的系统中,该方案实现的硬件并行运算结构可大大减少求适应度的耗时.经测试,该实现方案在保证识别率前提下,可有效提高训练与识别速度. 相似文献

7.

基于DSP开集说话人识别系统的实时实现

林琳王树勋王秀丽《吉林大学学报(信息科学版)》2006,24(3):252-258

为了给说话人识别系统的应用提供一个较为重要的技术途径,利用美国TI公司生产的TMS320VC5402DSP作为CPU开发的DSP(D igital S ignal Processor)系统,实时实现了一个基于说话人自适应的开集说话人识别系统。为了提高系统的处理速度和识别的准确性,系统采用少量的语音数据产生说话人模型,在改进的矢量量化方法的基础上,利用一种说话人自适应的阈值处理算法,有效地提高了系统的识别率。同时对降低算法的计算量、数据的存储量进行了较深入的研究。从说话人识别的响应时间、训练时间等综合方面考虑,使真正意义上的说话人识别系统在DSP芯片上实现成为可能。实验表明,该系统在普通机房条件下,可以取得较好的实验效果,系统识别时间小于1 s,完全满足实时性的要求。相似文献

8.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

9.

基于PCANN/PDP混合结构的噪声环境下说话人识别方法的研究

夏菽兰《盐城工学院学报(自然科学版)》2008,21(2):35-38,43

提出了一种基于PCANN／PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络（PCANN）。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。相似文献

10.

基于GA/VQ的说话人辨认的研究与实现 总被引：3，自引：0，他引：3

王金明李恩波《解放军理工大学学报(自然科学版)》2005,6(3):214-218

为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA／VQ说话人辨认系统,给出了一种GA／VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA／VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。相似文献

11.

说话人识别中的分数域语速归一化

艾斯卡尔·肉孜王东李蓝天郑方张晓东金磐石《清华大学学报(自然科学版)》2018,(4)

语速变化导致说话人识别系统性能显著下降。该文提出一种分数域语速归一化方法来降低语速变化对说话人识别系统的影响。由不同语速语音数据组成参考集(全局和局部),对每一个登入说话人估计其对参考集中每一类参考语音的分数分布,局部参考集通过按相对语速划分全局参考集而获得。基于该文录制的语速数据库在GMM-UBM(Gaussian mixture model-universal background model)框架下对测试语音进行分数归一化,并通过训练数据扩展有效解决了数据系数问题,最终等错误率相对下降33.33%。研究结果表明:全局和局部归一化方法都有效减少了语速变化对说话人识别系统的影响。相似文献

12.

改进i-向量说话人识别算法研究

邢玉娟潘颖曹晓丽《科学技术与工程》2014,14(34)

针对信道变化环境下说话人识别系统鲁棒性差及识别率低的问题,提出一种改进i-向量说话人确认算法。首先,利用系统注册说话人GMM-UBM提取话者i-向量;然后,采用加权线性判别分析对i-向量降维和信道补偿,提取更具判别性的特征向量;紧接着,结合类内协方差归一化技术和ZT-norm规整技术对余玄距离得分进行规整,进一步消除信道干扰;最后,构建高鲁棒性余玄距离分类器判定目标说话人。仿真实验结果表明该算法可以有效地提高系统性能。相似文献

13.

GMM-UBM和SVM说话人辨认系统及融合的分析 总被引：3，自引：0，他引：3

鲍焕军郑方《清华大学学报(自然科学版)》2008,48(Z1):693-698

在说话人辨认任务中,Gauss混合模型-通用背景模型(Gaussian mixture model-universal backgroundmodel,GMM-UBM)采用帧向量进行建模和识别,突出了说话人个性特征,但受信道影响较大;支持向量机(support vector machine,sVM)利用帧向量在空间中分布的Gauss混合的均值进行建模和识别,对信道的鲁棒性较好,但对说话人的个性体现不够.该文分析了这2种说话人识别系统的优缺点,并采用融合方法来提高系统的性能.在美国国家标准与技术研究所(NIST)评测数据集的实验中,融合系统的等错误率从GMM-UBM系统的9.30％和SVM系统的8.26％降低到7.34％,分别相对降低了21.08％和11.14％. 相似文献

14.

基于深度神经网络和Bottleneck特征的说话人识别系统

《清华大学学报(自然科学版)》2016,(11)

近来,一种结合语音识别中深度神经网络(deep neural network,DNN)模型和说话人识别中身份认证矢量(identity vector,i-vector)模型的方法被证明对说话人识别十分有效。为了进一步提升系统性能,该文提出使用基于说话人标签的DNN模型提取Bottleneck特征代替该模型中的短时频谱特征来计算充分统计量,从而使统计量中包含更多有利于说话人识别的信息。在美国国家标准与技术研究院说话人识别库2008年度女性电话对电话英语测试任务上进行的实验证明了该方法的有效性。相比原来的短时频谱特征,基于Bottleneck特征的说话人识别系统在等错误率和最小检测代价上相对减小了7.65%和5.71%。相似文献

15.

基于调制域谱减法的鲁棒性说话人识别 总被引：1，自引：1，他引：0

程小伟王健曾庆宁谢先明龙超《科学技术与工程》2017,17(3)

针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。相似文献

16.

论法庭证据评估及鉴定意见表述

《中国人民公安大学学报(自然科学版)》2017,(1)

法庭科学为查明案件事实提供了有力的技术支撑。然而,由于证据技术和评估方法本身的局限,检验鉴定时有时会出现意见表述不当、夸大证据价值、甚至鉴定错误等现象。这不仅会导致冤假错案的发生,还会引起公民对司法公正的质疑以及司法公信力的下降。本文从法庭科学技术的局限性、法庭证据的准确性和可靠性要求、法庭证据价值的评估方法和鉴定意见的表述形式等方面论述了科学评估证据价值和客观表述鉴定意见的重要性和必要性,并提出了相应的改进方法,包括采用更加客观透明的分析方法、以似然比作为法庭证据价值的量化评估指标以及进行案件条件下检验的准确性和可靠性测试等。相似文献

17.

基于小波变换的说话人识别技术

下载免费PDF全文

檀蕊莲柏鹏李哲姚战宏栾前进《空军工程大学学报(自然科学版)》2013,14(1):85-89

说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能. 相似文献

18.

防止假冒者闯入说话人识别系统 总被引：3，自引：0，他引：3

张利鹏曹犟徐明星郑方《清华大学学报(自然科学版)》2008,48(Z1):699-703

如何防止假冒者闯入,是说话人识别研究中的重要课题之一.回放高保真录音和模仿目标说话人声音是假冒者闯入说话人识别系统的2种常见方式.该文针对用高保真录音来闯入系统进行了初步探索.高保真录音设备是一个模数转换系统,语音通过它会发生一些特性变化.通过检测语音中是否存在高保真录音设备的特性,可以检测假冒者是否在使用回放高保真录音来闯入系统.以Gauss混合模型和通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)说话人识别系统为基础,用语音数据的静音段对信道进行建模,检测待识别语音与训练语音的信道是否相同,进而判断是否属于高保真录音闯入.实验表明,加入了基于静音段的信道检测后,说话人识别系统对含有假冒者闯入的测试数据的等错误率下降了40％左右. 相似文献

19.

说话人识别中的Mel特征频率倒谱系数

曹辉徐晨赵晓吴胜举《西北大学学报(自然科学版)》2013,(2):203-208

目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。相似文献

20.

基于因特网的说话人识别技术研究

叶蕾方鹏杨震《南京邮电大学学报(自然科学版)》2004,24(3):45-48

比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。相似文献