期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

檀蕊莲柏鹏李哲姚战宏栾前进《空军工程大学学报(自然科学版)》2013,14(1):85-89

说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能. 相似文献

2.

一种新型的与文本相关的说话人识别方法研究

下载免费PDF全文

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献

3.

基于SQLite技术的汉语语音识别数据库的建立 总被引：1，自引：1，他引：0

刘祥楼《科学技术与工程》2011,11(14)

建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明：一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。相似文献

4.

基于SVM的藏语说话人性别识别

于洪志何向真武光利马宁《西北民族学院学报》2011,(4):35-39

说话人性别识别是语音识别研究中的一个重要分支.通过说话人的语音识别作为说话人性别识别的预分类技术可以降低研究问题的复杂度,提高系统的准确率.文中首先从建立的藏语语音性别库入手,提取语音的特征参数MFCC,进而利用SVM进行训练和识别.实验结果表明:用于说话人识别的MFCC特征能有效地用于藏语说话人性别识别,且与SVM联... 相似文献

5.

变异特征加权的异常语音说话人识别算法 总被引：1，自引：1，他引：0

何俊李艳雄贺前华李威《华南理工大学学报(自然科学版)》2012,40(3):106-111

常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%. 相似文献

6.

基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引：1，自引：0，他引：1

曾毓敏吴镇扬《东南大学学报(自然科学版)》2008,38(6)

提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献

7.

基于Power builder的语音数据库设计与实现

李鑫《新疆师范大学学报(自然科学版)》2007,26(3):126-128

文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能. 相似文献

8.

基于概率修正PLDA的说话人识别系统

《天津大学学报(自然科学与工程技术版)》2015,(8)

为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度.为验证基于概率修正PLDA模型的有效性,进行了NIST SRE10 corecore测试集在3种不同时长的评测实验,以及NIST 2014 i-vector machine learning challenge测试任务.结果表明,相较于传统的PLDA训练模型,通过语音时长的约束提高了说话人识别性能. 相似文献

9.

说话人识别系统中特征提取的优化方法

李铮欧阳贝贝赵淼李琳洪青阳童峰《厦门大学学报(自然科学版)》2020,(6):995-1003

声学特征提取是语音信号处理,如语音识别、语音唤醒、说话人识别等的核心技术之一.围绕说话人识别任务详细介绍了其主流声学特征,以及采用这些声学特征后所产生的问题和改进方法.同时,基于说话人区分向量(x-vector)说话人识别架构提出了一种双声学特征整合的方法,以改善识别性能,并在公开的VoxCeleb1数据集上对比几种常用声学特征在x-vector框架下的说话人识别结果,进一步验证了所提出的双特征整合方法的有效性. 相似文献

10.

基于卷积神经网络的鲁棒性说话人识别方法

曾春艳马超峰王志锋孔祥斌《华中科技大学学报(自然科学版)》2020,48(6):39-44

为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法. 相似文献

11.

两级决策的开集说话人辨认方法 总被引：10，自引：0，他引：10

何致远胡起秀徐光祐《清华大学学报(自然科学版)》2003,43(4):516-520

为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。相似文献

12.

基于EMD技术的语音特征提取方法

牛科明宗容《科技信息》2008,(9):34-35

利用软件MATLAB仿真了语音信号的经验模态分解（EMD）特性,并与相关文献报导的其他分解方法进行了比较,结果表明：EMD法能达到更好的说话人识别效果。当不同的人发相同语音时,其频谱特性是不同的,把语音信号进行EMD分解后的IMF做频谱变换,便能得到一个特征向量,于是根据特征向量的不同而达到说话人识别的目的。以上实验结果有助于开辟说话人识别的新途径。相似文献

13.

基于神经网络的与文本相关说话人辨认系统

荣蓉《山东科学》2008,21(4):62-65

说话人识别是语音识别的一种特殊方式,对于各种领域的身份认证具有得天独厚的优势。以线性预测系数（Linear Predielion Coefficients,LPC）作为特征参数,采用多层感知器神经网络和BP算法建立了一个与文本相关的说话人辨认系统。实验结果表明,这种神经网络系统在说话人辨认中是有效的。相似文献

14.

A new frequency scale of Chinese whispered speech in the application of speaker identification 总被引：1，自引：0，他引：1

LIN Wei YANG Lili XU Boling 《自然科学进展(英文版)》2006,16(10):1072-1078

In this paper, the frequency characteristics of Chinese whispered speech were investigated by a filter bank analysis. It was shown that the first and the third formants were more important than the other formants in the speaker identification of Chinese whispered speech. The experiment showed that the 800?1200 Hz and 2800?3200 Hz ranges were the most significant frequency ranges in discriminating the speaker. Based on this result, a new feature scale named whisper sensitive scale (WSS) was proposed to replace the common scale, Mel scale, and to extract the cepstral coefficient from whispered speech signal. Furthermore, a speaker identification system in whispered speech was presented based on the modified Hidden Markov Models integrating advantages of WSCC (the whisper sensitive cepstral coefficient) and LPCC. And the new system performed better in solving the problem of speaker identification of Chinese whispered speech than the traditional method. 相似文献

15.

用 TMS320C31 实时实现电话语音识别系统 总被引：3，自引：0，他引：3

刘加潘胜昔江金涛胡凯军王作英《清华大学学报(自然科学版)》1998,(9)

描述了一个新型实时声控用户交换机语音接口的设计和实现。该系统使用数字信号处理器ＴＭＳ３２０Ｃ３１开发板在ＰＣ机ＷＩＮＤＯＷ平台下实现了与人无关连续命令语音识别,完成拨号、进行电话交换。系统使用少量控制词加上连续数字串构成了电话用户交换系统的常用命令语句,并生成相应识别文法网络（语言模型）。识别采用改进的令牌传递式Ｖｉｔｅｒｂｉ算法。研究中还开发识别系统拒识算法,在无拒识情况下命令语句中数字识别率为９８％以上,数字串（串长＜４）识别率达到９１％以上,通过加入拒识算法,字符串识别率可达９５％以上。相似文献

16.

基于HHT的语音特征参数提取及其在说话人识别中的应用

刘丽伟张瑶赵孔新钱锋《吉林工学院学报》2009,30(6):696-701

阐述了分析非线性、非平稳信号的Hilbert—Huang变换（HHT）算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。相似文献

17.

基于BP神经网络的非特定人语音识别算法研究

戚龙赵丹《科学技术与工程》2017,17(31)

当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。相似文献

18.

基于GA/VQ的说话人辨认的研究与实现 总被引：3，自引：0，他引：3

王金明李恩波《解放军理工大学学报(自然科学版)》2005,6(3):214-218

为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA／VQ说话人辨认系统,给出了一种GA／VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA／VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。相似文献

19.

听觉掩蔽门限在说话者识别中的应用 总被引：2，自引：0，他引：2

韦晓东胡光锐任晓林《上海交通大学学报》1999,33(12):1521-1524

语音信息在人的听觉系统中的表示具有一定的冗余性．利用这一特性把丢失数据技术应用于噪声环境下说话者识别系统的性能改进．听觉掩蔽效应这一听觉现象被用来检测语音信号频谱中被噪声严重干扰的“丢失成分”．经过丢失数据补偿技术结合语音增强处理,说话者识别系统在不利环境下的准确率得到了提高．通过对宽带噪声－白噪声和一种特殊噪声——汽车噪声干扰下语音的说话者辨认实验,发现这种方法优于单独使用语音增强方法．相似文献