首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
顾明亮 《广西科学》2007,14(4):423-425
将声学特征与韵律特征相结合,提出一种新的混合区间特征,并将该特征和常见的美尔倒谱系数(MFCC)特征与线性预测倒谱系数(LPCC)特征进行对比,通过符号化语言辨识方法对北方方言、吴方言、粤方言和闽方言进行辨识,以验证混合区间特征的有效性。结果表明,混合区间特征比MFCC特征和LPCC特征具有更好的方言辨识效果,对4种汉语方言15s语音片段的方言辨识率可以达到92%。4种方言中,混合区间特征对闽方言和粤方言的识别率最高,分别达到了96%和95%。  相似文献   

2.
为找到一种基于匀速直线运动模糊的单帧图像,准确辨识成像点扩散函数中模糊参数的方法,对现有文献提出的倒谱、Radon变换、图像微分、图像自相关性以及检测函数等算法进行了仿真和比较.仿真结果表明,倒频谱算法能够更准确地辨识精度运动方向;像素相关性方法能够更准确地辨识模糊长度.对匀速直线运动模糊的单帧图像进行模糊参数辨识时,结合倒谱辨识运动方向和像素相关性辨识模糊长度的算法,能得到更高精度的辨识结果,利于更好地复原图像的质量.  相似文献   

3.
为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。  相似文献   

4.
在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.  相似文献   

5.
该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法.该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;最后根据倒谱的特征求得浊音语音的基音周期.仿真检测结果表明:该算法无论对纯净语音,还是对不同加噪情况下的含噪语音,其基音检测结果都明显优于传统倒谱基音检测算法,并且也明显优于基于平均幅度差函数的基音检测算法,而略优于基于自相关函数的基音检测算法.  相似文献   

6.
在对非负矩阵和Z-矩阵研究时,必要的方法是对它们进行变换、简化,同时这些变换常常要求必须保持矩阵一些性质(如矩阵谱迹等)不变.文[1][2]研究了非负矩阵上的线性变换,研究了Z-矩阵上的线性变换,得出了保持某些性质不变的线性变换的具体形式:广义置换相似变换,对角变换.  相似文献   

7.
运动模糊是导致图像降质的最常见因素之一,估计运动模糊的点扩散函数是运动模糊复原的前提和关键.分析运动模糊图像频谱和倒谱的特征,提出在倒谱域估计点扩散函数的方法,利用倒谱中2个负峰值点坐标估算模糊尺度,对倒谱取绝对值后用Radon变换检测模糊方向,对运动模糊图像的参数进行估计.实验表明该方法是有效的.  相似文献   

8.
基于多特征融合的SVM声学场景分类算法研究   总被引:1,自引:0,他引:1  
针对DCASE2017挑战赛的声场环境数据集,提取梅尔频率倒谱系数(MFCC)、短时能量(SE)、声学事件似然特征(AELF)、静音时间(MT)特征,组成多特征融合矩阵,通过对比多种核函数和寻优算法,最终选取高斯径向基核函数(RK)建立支持向量机(SVM)模型,采用交叉验证(CV)方法进行SVM参数寻优,对15种声学场景进行分类.实验结果表明,杂货店、办公室的分类准确性达到了90%以上,平均分类准确性达到71.11%,远高于挑战赛的基线系统61%的平均分类准确性.   相似文献   

9.
提出一种基于特征融合矩阵的语音音色的厚薄度客观评价方法.提取最符合人耳听觉特性的梅尔频率倒谱系数(MFCC)和线性预测系数(LPC)作为语音特征参数,同时提取了3种非语音参数特征,包括共鸣因子指数、身高质量指数和肺活量体重指数,将这些特征进行融合即可形成特征融合矩阵,采用softmax分类器对语音音色中的厚薄度进行分级.实验结果表明,该方法可以获得较高的分级准确率.   相似文献   

10.
为了提高说话人识别系统的性能,该文在传统特征的基础上提出利用相位特征对听觉倒谱特征进行补偿的方法。该方法利用Teager能量算子(Teager energy operator,TEO)能够真实反映气流在通过声道系统呈现的涡流非线性作用的模型,再利用希尔伯特变换从TEO导出分析信号的瞬时相位信息,结合耳蜗倒谱系数(Cochlear filter cepstral coefficients,CFCC)得到融合特征参数。实现了对特征参数的补偿,提高了说话人识别系统的识别率。使用NIST-2002说话者识别评估(Speakers recognition evaluation,SRE)数据库,在高斯混合模型-通用背景模型(Gaussian mixture model-universal background model,GMM-UBM)的说话人识别系统上进行实验。实验结果表明TEO相位与CFCC的结合比单独CFCC更好,其识别精度比现有的CFCC特征和线性预测梅尔频率倒谱系数(Linear prediction Meyer frequency cepstral coefficient,LPMFCC)分别提高了8.32%和3.15%。这表明TEO相位包含与CFCC特征互补的信息,且具有较高的识别率。  相似文献   

11.
自动讲话人辨认   总被引:12,自引:0,他引:12  
针对非限定文本的自动讲话人辨认问题,对提取有效的识别特征进行了理论和实验分析,使用语音信号LPC倒谱的瞬时谱和过渡谱的特征参量作为识别特征,运用矢量量化技术,设计并建立了19人组成的ASI系统,为每人分别建立了“动态”和“静态”倒谱系数的两种码本,在连续语音完全不限文本的情况下进行系统的识别实验,得到了较理想的结果。实验表明,上述两种特征矢量均为非常有效的识别特征且可互补结合运用于识别,使性能进一步提高。本文同时还对简单信道变化情况予以初步考察,得到一些有意义的结果。  相似文献   

12.
在说话人识别系统中,提高反映说话人个性的语音信号特征参数的有效性和实时性是问题之一.本文在使用线性预测系数倒谱(LPCC)和美尔倒谱系数(MFCC)计算特征参数的基础上利用Fisher准则,构造了一种新的混合特征参数.这种新的参数在不增加系统计算量的同时,结合了LPCC和MFCC各自的优点,具有更好地表征说话人特征的能力,并在一定程度上消除特征的信息冗余,有利于信息的实时处理.  相似文献   

13.
为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反置等响度曲线模拟人耳对信号不同频率成分的主观响度感受。在基本听感知特征的基础上,还提出了一、二阶差分特征和偏移差分特征用于语种识别。对比实验表明,该文所提的听感知特征性能均优于目前普遍使用的Mel频率倒谱系数(MFCC)特征及其衍生特征。  相似文献   

14.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

15.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

16.
应用倒谱特征的带噪语音端点检测方法   总被引:7,自引:0,他引:7  
传统的语音端点检测方法以信号的短时能量、过零率等简单特征为判决特征参数。这些方法在实际应用中,尤其当信号噪比比较低时,无法满足系统的需要。文中利用语音信号的倒谱特征作为判决抽样信号帧是否为语音信号的依据,并提出了倒谱距离测量法和循环神经网络法,通过对宽带噪声-白噪声干扰情况和一种特殊噪声-汽车噪声情况的实验,发现倒谱特征参数的语音信号端点检测方法在噪声环境下具有传统的能量方法无法比拟的优越性,更适  相似文献   

17.
车辆音频信号具有复杂的特征,单一特征提取方法不能全面反应该特点。为了使提取的音频信号特征能更好地反映车辆原始信号,本文提出了将已有的短时能量(ENERGY)、短时傅里叶变换(STFT)及梅尔倒谱系数(MFCC)特征提取方法进行融合的方法,依据支持向量机(SVM)的分类识别算法,达到车辆识别的目的。实验表明,提出的组合方法优于单一提取方法,实现了提高识别率的目标,其中,ENERGY+MFCC组合方式效果最好。  相似文献   

18.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

19.
中医代脉谱分析研究   总被引:2,自引:0,他引:2  
通过对56例代脉声信号进行谱分析,获得了其自功率谱、倒谱和倒滤波谱特征参数值.实验表明,代脉在倒谱域上特征表现明显.  相似文献   

20.
基于传统特征的行车声音端点检测法存在重叠有车段识别率低、双门限阈值较难确定的问题,针对这两个问题,探索性地将梅尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)倒谱距离特征和短时能量特征进行了融合并应用于交通量检测。首先选取了周围环境较为安静的一个双车道路段,并采集了该路段上包含重叠有车段的行车声音;其次提取了行车声音的短时能量特征和MFCC倒谱距离特征,并对它们在端点检测中的优劣进行了分析对比;再次提出了一种融合短时能量特征和MFCC倒谱距离特征的新特征,并基于新特征将传统的双门限判决思路改进成了单门限判决思路;最后利用新特征对有车段进行端点检测并统计交通量。实验结果表明:基于融合特征的端点检测方法能有效解决重叠有车段识别率低和双门限阈值较难确定的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号