首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 343 毫秒
1.
随着待识别人数的增加,文本无关的说话人识别准确率下降明显. 针对这一问题提出了一种高准确率大规模说话人识别方法,该方法采用多个连续音频帧的声学帧特征构成声学特征图,进而获得高维度的2D-Haar声学特征,为训练出性能更优的分类器提供可能;再利用AdaBoost.MH算法筛选出具有较好区分度的2D-Haar声学特征组合进行分类器训练. 实验结果表明,600人规模下的正确识别率为89.5%,100~600人规模下的平均准确率为91.3%. 该方法适用于大规模说话人的识别,引入的2D-Haar声学特征有效,识别准确率高. 此外,该方法还具有较低的算法复杂度和较高的时间效率.   相似文献   

2.
针对单一声学特征和k-means算法在说话人聚类技术中的局限性,为了更好地表达说话人的个性信息并提高说话人聚类的准确率,将特征融合和AE-SOM神经网络应用于说话人聚类中,提出一种改进的说话人聚类算法.该算法通过对语音信号特征分析,将MFCC特征参数和LPCC特征参数相结合,从而完善说话人的个性信息.并在k-means的基础上增加AE-SOM神经网络,利用该网络实现输入特征的降维、说话人数的判定和聚类中心的选取,从而弥补k-means算法的缺陷.仿真实验表明两种声学特征融合之后,改进的聚类算法可有效地提高说话人聚类的准确率.  相似文献   

3.
在阿尔茨海默病(Alzheimer′s disease,AD)诊断方法中,通过对脑图像分析已成为准确诊断的一种重要手段.针对从单一脑图像模态磁共振图像(MRI)中提取的特征,提出了一种基于主成分分析(PCA)和线性鉴别分析(LDA)融合的AD分类识别算法.该方法首先对从MRI中获取的特征进行PCA,对低维的特征进行LDA获取组合特征向量,并采用最邻近算法,利用获取的组合特征向量对未知状态类型进行分类识别.实验表明,该算法与其他相关算法相比,具有较高的识别准确率、敏感性、特异性,这说明了算法的有效性.  相似文献   

4.
针对人脸性别识别中单一特征描述子对人脸信息表达的不足,提出一种方向梯度直方图(histogram of oriented gradient,HOG)和多尺度局部二值模式(local binary patterns,LBP)多特征融合的人脸性别识别算法.首先,对输入图像进行裁剪和缩放得到多个分辨率的人脸图像,再分别提取LBP统计直方图并合成一个特征向量;然后,提取目标图像头肩模型的HOG特征得到HOG特征向量;最后,将LBP特征向量与HOG特征向量合成一个新的特征向量,应用支持向量机(support vector machine,SVM)进行训练.在自建的人脸库中采用10折交叉法测试该算法的准确性,准确率可达93.0%,结果表明该算法对人脸性别识别的准确率优于其他单一的特征提取算法.  相似文献   

5.
基于Bandelet变换的手背静脉识别算法   总被引:1,自引:0,他引:1  
提出一种基于Bandelet变换的手背静脉识别算法, 该算法利用Bandelet变换对静脉图像进行特征点提取, 通过提取的特征点构造了表征静脉纹理特征的特征向量, 通过计算待识别样本特征向量与目标样本特征向量的相关系数得出其相似度, 并在利用自制采集设备采集的样本库上对算法进行测试, 给出了实验结果.  相似文献   

6.
融合多尺度多特征的人脸识别方法   总被引:1,自引:1,他引:0  
为降低光照、噪音、姿态等变化的影响,减少有效局部信息的损失,提出了使用图像的变换特征,及多尺度分块线性鉴别分析的算法.将图像进行多尺度划分,对划分后的每个子图像分别抽取其低频部分或奇异值,组合起来作为该图像的特征向量,进行线性鉴别分析.针对单一特征表示图像时的局限性,又提出了融合多尺度低频特征和多尺度奇异值特征进行人脸识别的方法.在ORL和Yale人脸库上的实验结果显示,所提出的算法识别精度明显提高,泛化能力较强.  相似文献   

7.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

8.
针对说话人确认识别率低及鲁棒性差的问题,提出一种基于多约简α-GMM和支持向量机的说话人确认算法.该算法首先采用主成分分析方法对语音特征向量降维,在约简向量集上为话者建立α-GMM模型,并根据模型间的KL散度进行聚类,得到各个类的聚类中心模型,将其作为SVM的输入得出最终识别结果.仿真实验结果表明该算法具有良好的鲁棒性和较高的识别率.  相似文献   

9.
基于足迹压力数据提出一种基于多模特征足迹识别算法.该算法采用连通区域滤波法实现足迹压力数据的去噪,对去噪后的数据提取足迹图像的形态特征、压力特征及卷积特征,并基于各特征权重实现足迹多特征的优化融合,最后采用支持向量机(SVM)分类器进行分类识别.实验结果表明:在50人的足迹压力数据上,三类不同模态足迹的识别准确率分别达到了100%,99.925%和94.445%,相较于仅采用形态特征和压力特征的识别,所提出算法的平均识别率提高了10.285%,表明该识别算法能够有效进行足迹识别.  相似文献   

10.
针对人脸识别中单一特征难以取得理想效果的问题,提出了基于MBC和POEM特征融合的人脸识别方法.首先,在归一化的人脸图像上提取MBC编码图和POEM编码图,在每个编码图块上生成特征向量,应用线性判别分析对特征向量进行低维映射,并对其进行赋权相加得到最终相似度.所提算法在FERET的Dup1,Dup2,Fb和Fc 4个测试库上取得了较高的识别率,分别为93.77%,90.60%,99.58%和99.49%;在误识率为0.1%的条件下,在4个测试库上的认证率分别为95.70%,92.31%,99.75%和100%,进一步验证了该方法的有效性.  相似文献   

11.
在说话人识别系统中,提高反映说话人个性的语音信号特征参数的有效性和实时性是问题之一.本文在使用线性预测系数倒谱(LPCC)和美尔倒谱系数(MFCC)计算特征参数的基础上利用Fisher准则,构造了一种新的混合特征参数.这种新的参数在不增加系统计算量的同时,结合了LPCC和MFCC各自的优点,具有更好地表征说话人特征的能力,并在一定程度上消除特征的信息冗余,有利于信息的实时处理.  相似文献   

12.
针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升.   相似文献   

13.
针对采用梅尔频率倒谱系数(mel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法。语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量。这些获取的身份认证向量经过线性判别性分析实现降维并存储。最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别。以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低。  相似文献   

14.
为了改进基于震动信号的地面运动目标识别算法,提出了一种基于主成分分析(PCA)的2次特征提取算法.首先对地面运动目标引起的震动信号进行目标特性分析,提取多维的特征值;然后利用主成分分析方法对众多的特征值进行分析,去除特征值之间的相关性,提取综合特征值并应用于分类器,得到目标识别结果.基于实地采集的地面运动目标的震动信号进行实验,结果表明:该方法有效地减少了特征值的维数和相关性,降低了分类器训练的难度和训练时间,同时提高了目标的正确识别率.  相似文献   

15.
为了保持步态识别的优势,克服单一生物特征识别的不足,提高远距离的身份识别率,提出了一种步态与侧面人脸在特征层上融合识别方法.首先利用二向图像矩阵主成分分析,对步态能量图和侧面人脸图分别进行特征提取与降维处理,得到初始特征矩阵,并将得到的初始特征矩阵进行矢量化、特征组合,获得组合特征向量.然后利用多重判别分析法对组合特征向量进行特征融合,获得步态与人脸的融合特征向量,最后采用最近邻法进行身份识别.利用CASIA Dataset B步态数据库对上述方法进行了验证.结果表明,该方法提高了身份识别的正确率,验证了该方法的有效性,为多生物特征识别提供了一种新的方法.  相似文献   

16.
针对在人脸图像高维数据降维时单纯使用主成分分析(PCA)算法的提取精度和速度受限问题,  提出一种基于小波变换和改进PCA的混合特征提取算法. 该方法首先对人脸图像进行小波分解, 选取低频分量对人脸图像进行特征提取;然后利用改进的PCA算法进行主成分提取, 获得代表人脸特征的特征向量; 最后将该算法应用于Olivetti Faces人脸库数据集的图像分类. 实验结果表明, 经过该混合算法处理后的图像特征数据, 由卷积神经网络(CNN)算法分类识别时准确率提升10%, 识别速度提高约37%.  相似文献   

17.
为克服现有基于线性变换特征提取方法中基向量非动态和参数需指定的缺陷,分析了虹膜的几何特征和识别原理,提出用独立成分分析ICA(Independent Component Analysis)方法进行虹膜特征提取,最大限度地去了除虹膜特征空间的冗余,克服了传统线性变换特征基向量非动态的缺陷;用BP(Back Propagation)神经网络进行虹膜分类,实现特征的降维和有效表示,并在自主研制的JLU-IRIS虹膜图像库中进行小样本空间实验。结果通过三种不同的识别率100%,96.5%和92.5%,表明了该算法的正确性和有效性。  相似文献   

18.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号