期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王洋潘平田庚《科学技术与工程》2015,15(1)

说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向. 相似文献

2.

一种新的说话人识别序列特征提取方法

邢玉娟谭萍李明《兰州理工大学学报》2009,35(4)

针对支持向量机不能直接处理动态时间序列的语音数据问题,提出一种基于PCS-PCA分类器和AOI-Fisher分值(add original information fisher score)法的序列特征提取方法.首先利用PCA对每位注册说话人的特征向量进行维数约简,由转换矩阵得到每位说话人的主成分空间(principal component space,PCS),在此空间上快速判断出可能的R个说话人;然后在R个可能说话人的约简向量集上建立高斯混合模型;最后利用AOI-Fisher分值法进行向量定长转换的同时,为每位说话人的特征向量添加一维原始分类信息log P(X|θ).仿真实验结果表明,将该序列特征提取方法应用于SVM说话人确认系统,在不影响系统识别速度的情况下,具有较高的识别性能. 相似文献

3.

噪声环境下话者识别系统的特征提取

王蕾孟慧杰《科技信息》2010,(33):48-49

说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语音信号的特征提取。应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括LPCC、MEL倒谱系数、线性预测倒谱系数等,对这些参数进行分析和比较,以达到话者识别的目的。相似文献

4.

基于深层说话人矢量的说话人检索

李威杨继臣贺前华李艳雄《华中科技大学学报(自然科学版)》2015,(7)

为了解决浅层特征不能有效刻画说话人特征,导致说话人检索率不高的问题,提出了一种基于深层说话人矢量的说话人检索方法.使用受限波尔兹曼机逐层构建一个多层的深层特征提取器用以提取说话人深层特征.为说话人构建基于深层特征的深层说话人矢量.通过计算要检索的说话人的深层说话人矢量和检索库中的说话人深层特征之间的最小距离,对目标说话人进行检索.实验结果表明:在深层特征下,使用深层说话人矢量可以检索到绝大部分的目标说话人;随着深度层数的增加,检索率先增后减,检索率最高对应的深度层数是7;随着深度层数的增加,检索时间非线性增加. 相似文献

5.

说话人识别综述

《科技资讯》2017,(25)

生物识别,是通过生物信息来识别人身份的技术,说话人识别是一种通过人的声音来识别人身份的技术。说话人识别是生物识别领域的重要研究课题之一。本文首先介绍说话人识别的背景和研究意义;其次介绍目前在说话人特征提取方面所采用的方法;再次介绍说话人识别方面所采用的方法研究;最后分析说话人识别的研究困难和未来发展趋势。相似文献

6.

基于非线性共振的说话人特征提取研究与仿真 总被引：1，自引：1，他引：0

何朝霞潘平《科学技术与工程》2012,12(25):6507-6510

针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。相似文献

7.

说话人识别算法鲁棒性研究

《南京工程学院学报(自然科学版)》2017,(3)

由于噪声干扰问题,说话人识别算法的效率受到很大影响.为此,在美尔倒谱系数特征提取的基础上,采用半升正弦函数对特征进行修正.采用特征规整、特征弯折和特征映射三种方法对特征进行校对.为提高说话人识别率以及模型的鲁棒性,提出混合BP神经网络与混合高斯模型的方法,将高斯混合模型的概率输出作为神经网络输入,从而获取说话人间的交互信息.试验结果显示,算法的识别率高,抗噪性好. 相似文献

8.

基于一种新的特征提取的语音辨识

刘嘉骆瑞玲李明《科学技术与工程》2009,9(2)

提出了一种新的二次特征提取的方法应用于说话人语音辨识.首先,通过基于熵的特征筛选方法,有效地剔除不重要或者噪声特征,消除语音特征的冗余,并获得其重要性排序,减少语音特征矢量的维数.然后,采用Fisher准则进一步进行参数选择,按 Fisher 比的大小选择特征向量作为投影轴,将高维空间中的特征矢量映射到低维的特征判别空间,然后以SVM作为分类器实现说话人辨识系统.实验结果表明,本文提出的方法在不影响识别率的情况下可以对输入数据有效降维,在噪音环境下取得了较好的识别效果,增加了系统的鲁棒性. 相似文献

9.

基于多窗频谱估计和平滑幅度谱包络的MFCC改进算法 总被引：1，自引：0，他引：1

张怡然白静王力《科学技术与工程》2014,14(19)

语音的特征提取是说话人识别系统中的关键问题。本文在传统的MFCC参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

10.

基于语音识别的课堂签到器

朱泰管震臻李新战韩雪白玉帅《科技资讯》2018,(10)

采集大量不同说话人的语音信息,将音频信号转换成电信号,然后把说话人话音中的个人特征提取出来,利用sql server 2012软件建立一个学生信息数据库,用于存储待签到的学生信息,最后基于高斯混合模型(GMM),把待说话人的语音与保留在数据库中的语音进行匹配判决,再通过比对数据库中的信息,以此找出待识别的人,从而达到签到的目的。相似文献

11.

基于多窗频谱估计和平滑幅度谱包络的Mel频率倒谱系数(MFCC)改进算法

张怡然白静王力《科学技术与工程》2014,(19)

语音的特征提取是说话人识别系统中的关键问题。在传统的Mel频率倒谱系数(MFCC)参数的基础上,提出一种改进的MFCC特征提取算法。该算法着眼于语音的前端处理,在预处理阶段,利用SWCE窗函数,对信号进行多窗频谱估计。并对得到的频谱进行平滑处理,得到信号的谱包络。然后对信号的谱包络进行计算,得到改进的MFCC参数。实验表明,在不同噪声环境下,与传统的MFCC算法相比,改进的算法识别率提高四个百分点以上。相似文献

12.

一种基于LBP和DLDA的人耳特征提取方法

闫晓东王志秦张建《河北理工大学学报(自然科学版)》2010,32(1):39-42,47

本文提出了一种新的基于局部二值模式（LBP）和直接线性判别（DLDA）的人耳特征提取方法。LBP对局部纹理信息特征的提取性能和与灰度整体变换的无关性,使得其在人耳特征提取方面具有很强的优越性。采用LBP算法与直接线性判别分析算法相结合的人耳特征提取方法在识别率方面与原始图像特征提取方法相比有明显提升。相似文献

13.

矢量量化动态规划的说话人证实

王金芳陈锡先尹建琪《吉林大学学报(信息科学版)》1998,(3)

讨论了以单一矢量量化和基于矢量量化动态规划两种算法为基础的说话人证实方案,简明介绍了语音特征提取,叙述了矢量量化动态规划基本算法。计算机仿真结果表明,通过对每个人的个人性语音信息的分析,矢量量化动态规划算法不但能相当准确地证实一个人的身份,而且能识别出冒名顶替者;此算法在ＤＳＰ（数字信号处理）上所实现的实时说话人证实系统的证实错误率已达到实际应用水准。相似文献

14.

一种基于改进的矢量量化算法的说话人识别方法

张云雁张建军赵风光吴龙梅《上海大学学报(自然科学版)》2005,11(4):368-371

该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法. 相似文献

15.

B/S模式下嵌入式说话人身份认证系统

陶佰睿苗凤娟万丽娟张景林《西北大学学报(自然科学版)》2008,38(1):40-42

目的研究设计基于B/S模式的与文本相关嵌入式说话人语音身份认证系统.方法针对网络数据传输的噪声环境、语音识别算法的复杂度和大量用户远程实时认证的需求等问题,首次利用了MPC850微控制器和EP2C35 FPGA芯片,采用2代小波降噪,语音增强,声谱中主要参数分布估计,加权MFCC语音特征提取,与指定文本相关的混合HMM辨识等技术完成设计要求.结果给出了系统SOC实现方法 ,讨论了语音特征提取算法的原理及改进措施.结论该系统能有效地完成基于B/S模式远程说话人身份认证,具有较高的实践应用价值. 相似文献

16.

基于MFCC和SVM的说话人性别识别

下载免费PDF全文

肖汉光何为《重庆大学学报(自然科学版)》2009,32(7):770-774

建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。相似文献

17.

数据挖掘技术在语音识别中的应用

下载免费PDF全文

许元洪郭琼《上海应用技术学院学报：自然科学版》2019,19(1):84-87

通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。相似文献

18.

基于调制域谱减法的鲁棒性说话人识别 总被引：1，自引：1，他引：0

程小伟王健曾庆宁谢先明龙超《科学技术与工程》2017,17(3)

针对说话人识别性能在噪声环境下急剧下降的问题,提出了基于调制域谱减法的鲁棒性说话人识别方法。首先在说话人识别前端通过调制域谱减法对含噪语音进行增强处理,然后通过Gammatone滤波器组提取对噪声具有抑制作用的特征,最后与说话人模型进行匹配识别。仿真结果表明,运用此方法能显著抑制噪声对说话人识别系统的影响,提高系统的识别率。相似文献

19.

论普通话水平测试中“说话”的应试策略

杨焰《咸宁学院学报》2011,31(7):63-64,67

普通话水平测试中"说话"是对应试人在没有文字凭借的情况下运用普通话能力的综合检测,其成绩直接影响着应试人的等级评定。本文就"说话"测试中存在问题及原因进行分析,并提出解决这些问题的策略与方法。相似文献

20.

基于D-S证据理论的说话人识别方法

罗来香林家骏《华东理工大学学报(自然科学版)》2004,30(4):437-441

提出一种新的说话人识别方法,即将D-S证据理论应用于说话人识别中。该方法通过抽取说话人特征,用D-S证据理论对语音特征矢量的各个分量进行数据融合,重新分配基本概率赋值,并依此得出证据可信度,从而达到识别说话人身份的目的。仿真实验证明使用D-S证据理论对说话人的识别比使用矢量量化有更好的识别效果。相似文献