共查询到20条相似文献,搜索用时 15 毫秒
1.
说话人特征提取是说话人识别系统中的关键环节,优良的特征提取算法既能有效反映说话人的基本特征,又能为识别的有效性提供保证.根据量子势阱理论,论文以透射系数、能量和频率的对应关系为切入点,构造出使频率和势阱一一对应的势阱组.针对语音信号的特点,将一帧语音信号视为一个量子态,利用势阱分离能量的特性,通过势阱组提取出信号的能量谱特征,并以此作为特征参数,探索了一种基于量子势垒组的说话人特征提取方法.仿真结果表明,在相同条件下,该方法可以降低算法的复杂性并能够有效的提取说话人特征,为说话人特征提取提供了新的研究方向. 相似文献
2.
针对支持向量机不能直接处理动态时间序列的语音数据问题,提出一种基于PCS-PCA分类器和AOI-Fisher分值(add original information fisher score)法的序列特征提取方法.首先利用PCA对每位注册说话人的特征向量进行维数约简,由转换矩阵得到每位说话人的主成分空间(principal component space,PCS),在此空间上快速判断出可能的R个说话人;然后在R个可能说话人的约简向量集上建立高斯混合模型;最后利用AOI-Fisher分值法进行向量定长转换的同时,为每位说话人的特征向量添加一维原始分类信息log P(X|θ).仿真实验结果表明,将该序列特征提取方法应用于SVM说话人确认系统,在不影响系统识别速度的情况下,具有较高的识别性能. 相似文献
3.
说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语音信号的特征提取。应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括LPCC、MEL倒谱系数、线性预测倒谱系数等,对这些参数进行分析和比较,以达到话者识别的目的。 相似文献
4.
为了解决浅层特征不能有效刻画说话人特征,导致说话人检索率不高的问题,提出了一种基于深层说话人矢量的说话人检索方法.使用受限波尔兹曼机逐层构建一个多层的深层特征提取器用以提取说话人深层特征.为说话人构建基于深层特征的深层说话人矢量.通过计算要检索的说话人的深层说话人矢量和检索库中的说话人深层特征之间的最小距离,对目标说话人进行检索.实验结果表明:在深层特征下,使用深层说话人矢量可以检索到绝大部分的目标说话人;随着深度层数的增加,检索率先增后减,检索率最高对应的深度层数是7;随着深度层数的增加,检索时间非线性增加. 相似文献
5.
6.
基于非线性共振的说话人特征提取研究与仿真 总被引:1,自引:1,他引:0
针对人发声系统的非线性特性和语音信号的类混沌特性,提出了一种基于非线性共振Duffing模型的说话人语音信号的特征提取方法。实验结果表明:采用非线性共振Duffing模型的特征提取方法,较基于非线性动力学提取广义维数特征具有较高的识别率。同时,同一语音信号在相同的识别系统中,与经典的MFCC特征相比,也具有较高的识别率。 相似文献
7.
《南京工程学院学报(自然科学版)》2017,(3)
由于噪声干扰问题,说话人识别算法的效率受到很大影响.为此,在美尔倒谱系数特征提取的基础上,采用半升正弦函数对特征进行修正.采用特征规整、特征弯折和特征映射三种方法对特征进行校对.为提高说话人识别率以及模型的鲁棒性,提出混合BP神经网络与混合高斯模型的方法,将高斯混合模型的概率输出作为神经网络输入,从而获取说话人间的交互信息.试验结果显示,算法的识别率高,抗噪性好. 相似文献
8.
9.
10.
11.
12.
本文提出了一种新的基于局部二值模式(LBP)和直接线性判别(DLDA)的人耳特征提取方法。LBP对局部纹理信息特征的提取性能和与灰度整体变换的无关性,使得其在人耳特征提取方面具有很强的优越性。采用LBP算法与直接线性判别分析算法相结合的人耳特征提取方法在识别率方面与原始图像特征提取方法相比有明显提升。 相似文献
13.
讨论了以单一矢量量化和基于矢量量化动态规划两种算法为基础的说话人证实方案,简明介绍了语音特征提取,叙述了矢量量化动态规划基本算法。计算机仿真结果表明,通过对每个人的个人性语音信息的分析,矢量量化动态规划算法不但能相当准确地证实一个人的身份,而且能识别出冒名顶替者;此算法在DSP(数字信号处理)上所实现的实时说话人证实系统的证实错误率已达到实际应用水准。 相似文献
14.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法. 相似文献
15.
目的 研究设计基于B/S模式的与文本相关嵌入式说话人语音身份认证系统.方法 针对网络数据传输的噪声环境、语音识别算法的复杂度和大量用户远程实时认证的需求等问题,首次利用了MPC850微控制器和EP2C35 FPGA芯片,采用2代小波降噪,语音增强,声谱中主要参数分布估计,加权MFCC语音特征提取,与指定文本相关的混合HMM辨识等技术完成设计要求.结果 给出了系统SOC实现方法 ,讨论了语音特征提取算法的原理及改进措施.结论 该系统能有效地完成基于B/S模式远程说话人身份认证,具有较高的实践应用价值. 相似文献
16.
建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。 相似文献
17.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。 相似文献
18.
19.
普通话水平测试中"说话"是对应试人在没有文字凭借的情况下运用普通话能力的综合检测,其成绩直接影响着应试人的等级评定。本文就"说话"测试中存在问题及原因进行分析,并提出解决这些问题的策略与方法。 相似文献
20.
提出一种新的说话人识别方法,即将D-S证据理论应用于说话人识别中。该方法通过抽取说话人特征,用D-S证据理论对语音特征矢量的各个分量进行数据融合,重新分配基本概率赋值,并依此得出证据可信度,从而达到识别说话人身份的目的。仿真实验证明使用D-S证据理论对说话人的识别比使用矢量量化有更好的识别效果。 相似文献