期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

茹婷婷谢湘《清华大学学报(自然科学版)》2008,48(Z1):725-729

;耳语音是一种常见的语言交流方式,在医学、公安、司法等领域都发挥了重要的作用,耳语语音库的建立对于研究耳语音的识别是极其重要的.该文介绍了耳语音的特点和现有的耳语音语音库.建立了一个包含同语料耳语音和正常音的语音库,语料主要由数字串构成,同时包括少量连续语句,发音人为10个男生,10个女生.详细介绍了发音人注意事项、语料的选择、系统的构建和语音库的标注等几个问题.后利用采集到的语音库分析验证了耳语音的声学特性. 相似文献

2.

基于修正MFCC参数汉语耳语音的话者识别 总被引：12，自引：1，他引：12

林玮杨莉莉徐柏龄《南京大学学报(自然科学版)》2006,42(1):54-62

耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率. 相似文献

3.

一种基于MFCC与PCA的改进型语音识别算法

《南阳理工学院学报》2015,(6):56-60

Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。相似文献

4.

基于高斯小波滤波器的语音识别特征提取方法

孙颖张雪英《太原理工大学学报》2007,38(2):146-149

把小波理论应用于抗噪语音识别特征提取,提出了基于高斯小波滤波器的语音识别特征提取方法,通过对人耳听觉特性的研究,按照人耳临界带宽设计了一组高斯小波带通滤波器。详细讨论了高斯小波滤波器的尺度参数选择方法。使用RBF识别网络,仿真实现了使用新特征与原特征的识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。相似文献

5.

基于主成分分析和球结构支持向量机的人耳识别方法

谌昌强《西南师范大学学报(自然科学版)》2013,38(8):136-140

提出一种基于主成分分析和球结构支持向量机的人耳识别方法.首先将人耳从侧面人脸中提取出来,然后采用主成分分析方法对人耳图像进行特征提取,最后采用球结构支持向量及对人耳图像进行训练和识别.与传统的多分类方法相比,该分类方法识别性能更高,这为非打扰式生物特征识别提供了一条有效途径. 相似文献

6.

一种改进的基于LP倒谱特征的孤立词语音识别方法

侯雪梅张雪英赵高峰《太原理工大学学报》2006,37(5):508-510

阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。相似文献

7.

基于加权组合过零峰值幅度特征的抗噪语音识别

梁五洲张雪英《太原理工大学学报》2006,37(1):84-86

基于人耳听觉特性提出一种新的抗噪音识别特征:加权组合过零峰值幅度特征,是对过零峰值幅度特征的一种改进。加权组合过零峰值幅度特征以语音数据和差分语音数据作为处理对象,通过计算它们的上升过零率获得频率信息,经幅度非线性压缩获得密度信息,并根据人耳对声音的感知特点对其进行加权,形成最终的输出特征,识别网络使用HMM。仿真实现了使用新特征与原特征的算法识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。相似文献

8.

浴室噪声环境下小词汇量语音识别系统研究

童强黄剑王永骥《华中科技大学学报(自然科学版)》2011,39(Z2):309-311

根据实际应用的需求,设计了一种在浴室噪声环境中的小词汇量的语音识别系统.针对特定的浴室噪声进行分析,引入一种语音增强算法来降低噪声对识别的影响.使用基于人耳听力模型的mel频率倒谱特征参数作为语音特征参数,并结合其一阶差分参数描述语音信号特征的动态特性.针对小词汇量的实际应用需求,选用基于动态时间规整的模板匹配方法来识别.该方法可以用于其他相似的噪声环境中,通过实验验证了该方法的可行性. 相似文献

9.

说话人识别中改进的MFCC参数提取方法 总被引：1，自引：0，他引：1

何朝霞《科学技术与工程》2011,18(18):4215-4218,4227

在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。相似文献

10.

用Gammatone滤波器组仿真人耳基底膜的特性 总被引：2，自引：0，他引：2

陈世雄宫琴金慧君《清华大学学报(自然科学版)》2008,48(6)

为了更好地理解人耳蜗的工作机制,提出了一种利用Gammatone滤波器组对基底膜进行仿真的方法.根据Gammatone滤波器组与人耳基底膜两者在冲激响应、幅频特性等方面的相似性,采用一组中心频率呈对数均匀分布的Gammatone滤波器组来模拟基底膜.采用多种信号作为输入,对该方法进行仿真测试.仿真结果表明:在纯音、混合音和语音等输入情况下,该方法能仿真人耳基底膜的动态响应过程、频率选择特性和频谱分析特性等重要特征,对于语音压缩、语音识别和人工耳蜗等听觉应用领域有参考价值. 相似文献

11.

动态阈值谱法语音增强 总被引：2，自引：0，他引：2

陆生礼余崇智《南京大学学报(自然科学版)》1996,32(2):218-223

根据人耳能从噪声中提取有用信息的听觉特征，并结合语音信号的基本特征，提出并研究了一个适合于语音增强的听党内模型；实验结果表明，这个方法不仅在提高语音信噪比方面，而且在减小语音失真度方面均有较好的改善。相似文献

12.

基于MFCC等组合特征的说话人识别模型

朱建伟孙水发刘晓丽《三峡大学学报(自然科学版)》2009,31(6):77-79,93

为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数：基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明：本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献

13.

基于单片机的语音识别控制电压播报仪 总被引：1，自引：0，他引：1

郭光真李辉《厦门大学学报(自然科学版)》2005,44(5):650-653

为实现利用人的语言和听觉来完成一系列双手工作的目的，我们借助于单片机对语音进行识别处理．语音识别控制电压播报仪是基于SPCE061A单片机开发出来的语音识别控制和播报系统．它的硬件部分主要由外部降压电路、MIC输入电路、SPCE061A单片机、音频放大设备等组成，软件部分则由语音识别训练模块、语音识别模块、模数转换模块、数据处理模块、语音播报模块组成，通过对系统的初始化和识别训练使之能够对所训练的语音进行识别，进而触发一系列过程：模数转换→数据处理→语音播报电压．实验结果表明，这个系统能够准确地识别语音命令，得到测量结果．相似文献

14.

基于2DLDA与FSVM的人耳识别 总被引：1，自引：0，他引：1

吕秀丽《科学技术与工程》2012,12(12):2852-2855

针对人耳图像特征提取和识别方面存在的问题,提出一种将二维线性鉴别分析(2DLDA)和模糊支持向量机(FSVM)相结合的人耳图像识别方法.利用2DLDA将人耳图像直接投影,提取的人耳特征,可以保留人耳图像样本的大量类内和类间信息.同时,FSVM在支持向量机(SVM)的基础上引入隶属度参数,更加适合多类问题.实验结果表明,该方法与2DLDA相比具有更高的识别率. 相似文献

15.

基于DSP的电子耳蜗语音处理器的研制

沈滔周耀华刘召伟《复旦学报(自然科学版)》2002,41(2):182-186,191

电子耳蜗是一项正在迅速发展的聋人康复新技术，其关键是要研制出可靠、灵活、价格低廉的产品。首先介绍电子耳蜗的原理及其进展，然后介绍基于TMS320VC5402 DSP处理器的电子耳蜗语音处理器。实验证明：基于DSP的电子耳蜗系统可以按照患者的实际情况灵活选择各种语音处理方案，并能方便实现语音预处理、噪声抑制和对应各电极的频谱阈值调整，是一种比较好的系统结构。相似文献

16.

基于Gamma tone滤波和PCNN的说话人识别

金银燕《科学技术与工程》2010,10(30)

为了更好地提取说话人的特征,对语音进行滤波的预处理。Gamma tone滤波器可以很好模拟基底膜滤波器的形状,因此本文采用作为标准耳蜗听觉滤波器的Gamma tone滤波器对语谱图进行滤波,再通过脉冲耦合神经网络来提取说话人特征进行分析。仿真结果表明,由该方法得到的说话人的熵序列与自身熵序列的欧氏距离较未经过Gamma tone滤波的小,提高了识别率。相似文献

17.

一种模块化神经网络的人耳识别方法

田莹李林玲《辽宁科技大学学报》2016,39(3):216-222

提出了一种基于模块化神经网络的人耳识别方法。对人耳图像进行一系列的预处理后,采用PCA方法对图像进行特征提取。构建了模块化神经网络模型,并用分层遗传算法对该模型进行优化,选择训练阶段样本和测试阶段样本对人耳图像进行训练和测试,得出识别率。实验结果表明,基于模块化神经网络的人耳识别相对于传统的神经网络优化了设计参数,得到最优体系结构,提高了人耳识别率。相似文献

18.

基于CT图像构建听骨链三维有限元模型

史长征吕长生李恒国《暨南大学学报(自然科学与医学版)》2011,32(2)

目的:初步探讨中耳听骨链传声机制的力学特点。方法:采用1例听力正常者CT图像,建立中耳的三维有限元模型,进行中耳力学分析,观察不同频率下中耳主应变、主应力和位移的变化。结果:低频和中频中耳主应变、主应力变化较大,而在高频阶段变化并不明显,其中200 Hz和在1 000~2 000 Hz阶段变化最为明显,中耳主应力与主应变变化趋势相一致。当刺激音高于2 000 Hz时,中耳听骨链没有位移产生。结论:通过中耳有限元模型可以无创性地研究听骨链传声机制,有利于术前及术后对听骨链进行临床评估。相似文献

19.

小波变换在语音去噪中的应用 总被引：2，自引：0，他引：2

马建芬《太原理工大学学报》2001,32(3):238-239

提出一种新的基于小波变换的语音去噪算法。利用此特性对信号进行小波域波滤,可从加噪的语音中提取人耳所能接受的频率成份,是一种简单有效的语音去噪算法。相似文献

20.

基于独立感知理论的鲁棒语音识别算法

孙暐吴镇扬《东南大学学报(自然科学版)》2005,35(4):506-509

为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性. 相似文献