首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 501 毫秒
1.
防城区粤语属于粤方言钦廉片,无舌尖韵母()和撮口呼韵母y;古全浊声母字今读塞音塞擦音时平声读送气音,仄声字绝大部分读为不送气音,少量仄声字读为送气音;存在边擦音和舌面前浊鼻声母;入声分为三类。  相似文献   

2.
基于HMM的孤立字识别   总被引:1,自引:0,他引:1  
本文以HMM(隐马尔可夫模型)为基础研究孤立字的汉语语音识别。孤立字的汉语语音样本首先经过人工切分去除寂静段,然后进行分帧处理;对每一帧语音进行频域预加重和时域汉明窗加权处理后,提取该帧的39维的MFCC混合参数(Mel频率倒谱参数);把该字所有帧的MFCC混合参数作为该字HMM模型的观察序列对其进行训练。通过在小人群范围内对0-9这十个孤立数码语音的大量实验,得到了很好的识别效果。  相似文献   

3.
文章采用语音空气动力学PAS6600,对所提取生理学参数进行分析,从生理上说明汉语普通话辅音中不送气/送气音在发音过程中的生理变化:汉语普通话不送气音与之相对应的送气音,在发音时发音部位并不是完全相同的;塞音在发音时,辅音收紧点越靠后,在听感上越响亮.这主要是由于声门下压力的影响.  相似文献   

4.
为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能.  相似文献   

5.
越南留学生习得普通话塞音和塞擦音实验研究   总被引:1,自引:0,他引:1  
越南留学生在习得汉语普通话塞音、塞擦音时总是存在一些突出问题.通过统计对比发现,越南留学生的送气音和不送气音的VOT和送气时长大多都比汉语母语发音人短,不送气音和送气音区分度不高,在声韵格局上也不太合理.针对学习者存在的偏误,建议教师采取紧抓音素教学不放松、让学习者对母语与普通话音系进行比较、语音教学坚持"输入""输出"同步、重点强调"送气""不送气"的对立、提高学生语速等方法,以有效提高越南留学生汉语普通话学习效果.  相似文献   

6.
目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。  相似文献   

7.
语音控制作为一种新型的人机交互手段,给用户带来更多的操作体验,在很多特定场景中具有必要性。本文将梅尔倒谱系数(MFCC)作为语音特征参数,采用动态时间规整算法(DTW)进行模式识别和分类,实现了小样本孤立词汇的实时识别,具有高识别率。在基本算法的基础上进行了边界条件改进,克服了端点检测缺陷。在语音特征提取上,分析比较了线性预测系数(LPC)和梅尔倒谱系数(MFCC)作为特征参数的优缺点,最后选定基于人耳听觉特性的MFCC作为语音特征参数。语音信号采用NI公司USB-6218采集卡将数据直接传输至MATLAB开发平台,在MATLAB集成环境下实现了语音识别程序。实验结果表明,系统可以实现6个特定的孤立词识别,满足实时性和准确性要求。  相似文献   

8.
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。  相似文献   

9.
Mel频率倒谱系数(MFCC)是语音特征提取的一种常用方法。因其能够充分模拟人耳的听觉系统,具有较高的识别精度,所以在语音识别中得到了广泛的应用。本文针对MFCC在语音识别中对中高频区域识别精度不高的固有缺陷,通过将MFCC、Mid MFCC、IMFCC与主成分分析(PCA)相结合,提出了一种在全频域实现精确且快速的识别方法,并进行了仿真实验验证。  相似文献   

10.
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。  相似文献   

11.
说话人识别中改进的MFCC参数提取方法   总被引:1,自引:0,他引:1  
何朝霞 《科学技术与工程》2011,18(18):4215-4218,4227
在说话人识别技术中,特征参数的提取对语音训练和识别有着非常重要的作用。而Mel频标倒谱系数MFCC是一种常用的特征,它能对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。同时由于语音信号具有时变和混沌特性,以非线性随机共振理论和人类对听觉的理解为基础,提出了一种基于随机共振的MFCC特征参数提取方法。通过实验比较两种方法的结果,论证了改进方法的可行性以及优越性,为说话人识别技术中特征参数提取提供了一条新的研究方向。  相似文献   

12.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。  相似文献   

13.
随着自动驾驶汽车研究的不断深入,对其环境感知系统提出了更高的要求。为了使自动驾驶汽车适应更复杂的交通环境,本文研究了低信噪比声学环境感知技术,提出改进的小波包去噪方法;采用经验模态分解(EMD)的方法改进梅尔频率倒谱系数(MFCC)的提取;采用支持向量机(SVM)识别模型完成低信噪比交通环境声音识别。实验结果表明,本文提取的去噪方法提高声音事件信噪比的同时保持声音特征,且对噪声有自适应性;改进的MFCC提取方法一定程度上提高了特征参数的抗噪性能。通过对低信噪比交通环境声音去噪和特征参数优化后,其平均识别率比优化前提高了33.34%,并改变了识别率骤降的趋势。  相似文献   

14.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

15.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

16.
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%.  相似文献   

17.
分析了目前各种语音质量的客观评价方法,提出了一种改进的基于动态分帧技术并与MFCC(Mel Frequency Cepstral Coefficient)参数结合的谱失真参数MDCD(Mean Dynamic Mel-cepstrum Distance)来映射主观语音的MOS分.实验表明,采用新参数的主客观曲线拟合效果优于传统参数CD(Cepstrum Distance).文中最后用MDCD参数来重新评价某些信息隐藏算法的透明性.  相似文献   

18.
高性能汉语数码语音识别算法   总被引:13,自引:0,他引:13  
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .  相似文献   

19.
基于MFCC的语音情感识别   总被引:4,自引:0,他引:4  
情感语音中携带着丰富的信息,在人机交互领域有着广阔的应用.Mel频率是基于人耳听觉特性提出来的.它与Hz频率成非线性对应关系.Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域.由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降.因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC.针对该问题进行了研究,修正了Hz-Mel非线性对应关系,提升了中高频系数的计算精度,并将其作为低频MFCC的补充,应用到语音情感识别中.实验证明,改进之后的算法与经典算法比较,在不同的特征组合上识别率都有不同程度的提高,从而证明了Mid MFCC特征计算方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号