共查询到15条相似文献,搜索用时 46 毫秒
1.
针对MFCC特征补偿技术在低信噪比时性能不高的缺点,提出了基于PLAR鲁棒特征的模型补偿方法进行抗噪声说话人识别.PLAR特征从人类听觉感知机理出发,运用听觉心理学概念表征说话人个性特征,具有雏数低,运舅速度快,抗噪性能强等特点,是一种稳健的特征.模型补偿则通过分析被测语音帧的整体分布,对高斯混合模型似然概率进行某种程度的补偿,降低噪声的影响,改善系统的性能,进一步增强系统的鲁棒性.理论分析和实验结果表明,在平稳和非平稳背景噪声环境下,当信噪比大大降低时,此方法比MFCC-GMM方法的识别率平均提高了12.2和14.9个百分点. 相似文献
2.
3.
基于神经网络集成的说话人识别算法仿真研究 总被引:2,自引:0,他引:2
说话人识别研究中采用的语音信号特征同时包含了语义信息和话者信息,二者相互影响,给识别带来了很大的困难。为解决这个问题,我们将集成思想应用于说话人识别中,针对每个汉语单韵音的特征空间训练一个神经网络实现说话人分类,并使用另一个神经网络对多个单韵音神经网络识别器的识别结果进行结合。该方法可以有效地避免语义信息对说话人识别的干扰,提高识别精度。不仅如此,神经网络集成的识别结果还可以同时给出该帧语音所属的单韵音类型。仿真实验结果表明,集成系统的识别精度高于单一神经网络,并且在与多种算法的对比中也展示了良好的性能,更重要的是,该方法给出了一种从语音特征中分离语义信息和说话人信息的新思路。 相似文献
4.
短语音说话人识别新方法的研究 总被引:1,自引:0,他引:1
提出了一种较短训练语音的说话人识别新方法。利用模糊核聚类算法设计矢量量化器,对说话人的语音特征进行训练。模糊核矢量量化器将原始空间通过非线性映射到高维特征空间,在高维特征空间中对说话人的训练语音特征进行模糊聚类分析,将得到的每个类中心作为说话人的语音模型。识别时将识别矢量映射到高维空间进行匹配决策。由于核方法的引入,使得原来没有显现的特征突现出来,增加了说话人之间的可区分性。实验表明,该方法对于较短的训练语音,其识别效果优于高斯混合模型和模糊矢量量化。 相似文献
5.
基于模糊核熵的短语音说话人识别 总被引:1,自引:0,他引:1
为了解决由于模糊加权指数选取不当而导致系统性能下降的问题,将熵函数引入到核映射的特征空间中,提出了一种基于模糊核熵的短语音说话人识别新方法.通过定义特征空间中的模糊核熵目标函数,设计了模糊核熵矢量量化器,在高维特征空间中对说话人的语音进行训练和识别匹配.引入熵的算法具有更加清晰简洁的数学形式和物理含义.为了进一步提高系统性能,利用模拟退火法对熵函数中的模糊熵度进行全局优化,提出了一种基于模拟退火的模糊熵度更新方法.实验表明,该方法对于较短的训练语音,其识别效果优于高斯混合模型和模糊核矢量量化. 相似文献
6.
基于遗传-模糊聚类的说话人识别方法及其仿真研究 总被引:5,自引:4,他引:5
利用遗传算法的全局收敛性及模糊C-均值(FCM)聚类强大的局部寻优能力,提出了一种基于遗传-模糊聚类的说话人识别方法。对说话人的训练语音数据进行遗传-模糊的软聚类分析,从而得到分类中心的全局最优解,作为每个说话人的语音模型,最后利用最大总平均隶属度函数准则对待识别语音进行模糊聚类识别.除此之外,使用自适应参数增加遗传算法的局部搜索能力。实验结果表明,这种算法克服了传统硬聚类的缺点,避免了FCM对初值敏感及容易陷入最小值的缺陷,使聚类更加合理,更好地描述了说话人的语音特征。 相似文献
7.
仿生模式识别方法模仿了人类进行事物分辨过程中的行为特征,强调了类内事物的相关性,利用"熟识"程度代替"分类".与传统模式识别方法注重发掘类间特征差异性相比,给出了一种新的思路.仿生模式识别方法的难点在于针对同一类事物的有限个样本在特征空间中建立有效的连续覆盖.提出了一种利用改进的最近邻方法产生类覆盖区的新算法,该算法认为同一类中任意两个样本间的特征是渐变的,从而生成更多虚拟的样本点,并根据两个样本特征点之间的距离确定虚拟样本点的覆盖范围.利用该算法实现了说话人识别系统,实验表明该方法能够有效地排除冒充者话音的干扰,在有大量冒充说话人的实验环境下,能够大大提高系统的识别率. 相似文献
8.
基于2D Log-Gabor滤波器的虹膜识别研究 总被引:1,自引:0,他引:1
Log-Gabor滤波器无直流分量,带宽不受限制,比Gabor滤波器更适于提取虹膜纹理特征.提出了基于2D Log-Gabor滤波器的虹膜识别方法.通过多通道2D Log-Gabor滤波器提取虹膜纹理特征并进行相位编码,运用加权海明距离匹配,匹配时借助噪声屏蔽码去除眼睑遮挡干扰.在CASIA和UBIRIS虹膜库进行了测试,与传统方法相比,可取得更小的等错误率和相同错误接收率下更小的错误拒绝率. 相似文献
9.
针对高分辨雷达距离像的方位敏感性问题,将应用于语音处理的动态时间弯折技术引入高分辨距离像雷达目标识别领域,提出了一种动态方位弯折技术,该技术通过将测试数据与模板特征序列进行非线性伸缩(弯折),获得测试帧与模板之间最小匹配距离对应的最佳匹配路径,实现对测试数据的目标识别。对ISAR实测飞机数据的分类实验及与模板匹配法和RBF识别方法的比较,获得了良好的识别结果,表明了该方法的可行性和有效性。 相似文献
10.
针对杂波功率依距离缓变的非均匀环境,提出了基于相对距离准则的加权协方差矩阵估计算法。通过对加权最大似然估计概念的描述和原始问题的公式化,在相对距离准则下设计加权函数,使得在样本矩阵求逆(SMI)检测器的条件下,检测算法的相对距离达到最大,并给出了实用的近似加权系数求解方法。通过性能分析可知,在相对距离最大条件下估计的协方差矩阵的条件信杂噪比损失同时达到最大。最后的仿真分析也验证了该算法的正确性和有效性。 相似文献
11.
给出了 DISOPE算法收敛速度指标的定义 ,提出了基于算法参数、模型与模型参数优选的智能 DISOPE方法 ,有效地改善了 DISOPE算法的收敛性能和实用性 .仿真表明了该方法的可靠性和有效性 . 相似文献
12.
13.
生物特征识别方法正逐渐成为近年来的研究热点,而人耳图像的识别更是其中一个新兴的研究方向.研究了小波变换模极大值、小波不变矩的原理及特点,提出了基于小波模极大值与改进小波矩不变量的特征提取方法,并将其应用于人耳图像的自动识别.识别过程中先对采集到的人耳图像进行小波模极大值去噪处理与边缘提取,再对处理后的图像求小波矩不变量,将其作为人耳识别特征量.通过这种方法提取的特征量不仅可以解决光照不均、光照变化、噪声干扰的问题,而且还有平移、旋转缩放不变性.将本文得到的特征量使用误差处理方法进行加权并利用BP神经网络方法进行分类,实验结果表明,这些特征量适合于人耳图像的分类,其识别率达到了97%以上. 相似文献
14.
针对已有混合信号识别方法存在智能化程度低、适应性差等问题,提出了一种基于循环谱截面和深度学习相结合的智能识别方法。理论推导分析了常见混合通信信号的循环谱零谱频率截面特征;利用提出的非线性分段映射和指向性伪聚类新方法对上述截面图进行预处理特征增强,提高了截面特征的适应性和一致性;并将预处理后的特征图与经典残差网络相结合,利用深度学习网络对特征图中调制信息的深层次细节挖掘分析能力,实现了混合信号的有效识别。仿真结果表明,该方法对噪声不敏感,当信噪比不低于-2 dB时,平均识别率大于90%;且该方法对信号参数及信号间能量比变化有较好的适应能力。 相似文献
15.
针对反潜直升机空中辐射噪声信号的特点,分析了选取Marr小波函数的理论原因,详细描述了采用连续小波变换实现反潜直升机目标信号特征提取的方法;并结合模糊识别技术,成功地实现了复杂信号的特征分离,准确地识别出反潜直升机独特的目标特性,为研制反击反潜直升机武器提供了重要理论基础和实践工具。 相似文献