首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
语音情感识别是人工智能领域的研究热点.对不同的特征参数提取直接影响了语音情感识别的效果.通过提取基频、共振峰和Mel频率倒谱系数三个能够充分反映语音情感的特征,采取支持向量机的方法对样本进行分类学习.实验结果表明这三种特征参数能够有效识别语音情感.  相似文献   

2.
提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性.  相似文献   

3.
目前的提取语音共振峰的方法比较多,常用的方法有倒谱法、LPC谱估计法、LPC倒谱法,但没有一种方法是十分完美的,为了系统的深入的研究共振峰的提取,本文对同一帧语音信号进行了不同方法的共振峰提取实验仿真,给出了具体的共振峰频率数据,同时对不同方法的优缺点进行了科学的、深入的研究分析,用Matlab对算法进行仿真实现,实验结果表明共振峰的提取方案中LPCC倒谱法避免了一般同态处理中对复对数的麻烦,可以较为理想的实现对共振峰的提取。  相似文献   

4.
为提高说话人识别系统的性能,结合离散小波变换与RBF神经网络提出一种说话人识别新方法。把小波变换与美尔频率倒谱系数提取相结合,使用离散小波变换代替美尔频率倒谱系数中的离散余弦变换,提取变换谱振幅作为特征参数。使用逼近能力、分类能力和学习速度均更优的RBF神经网络取代常用的BP网络,采用与输入样本相关的方法优化RBF网络初始权值选取。不同语音长度和信噪比的实验表明,系统识别率和鲁棒性均得到了提高。  相似文献   

5.
人类语音中的共振峰特征作为语音信号处理系统中具有较高稳定性的频域参数,携带着众多有用的信息。本文结合实际教学情况和实验需求,针对语音信号处理中提取共振峰容易出现的困扰,根据语音信号共振峰的特点,通过MATLAB编写了基于倒谱法和线性预测法的共振峰检测函数,并实现了对指定语音信号的共振峰估计的仿真与验证。  相似文献   

6.
中国民族乐器的共振特性很大程度上反映了其独特的音色,但一直缺乏较系统的相关研究.本文录制了4种中国弹拨乐器的常用单音作为分析的声音样本,利用基频与迭代的倒谱分析方法,提出了一种估计乐器共振频段的算法,并在西方弹拨乐器上验证了其有效性.该算法采用改进的倒谱法估计单音共振峰,然后针对估计结果,设计了共振谱法和频带法进行后处理,从而得到乐器的有效共振频段.文中估计了录制的4种中国弹拨乐器的共振频段,并对其描述的乐器共振模式进行分析,为中国弹拨乐器尖锐的合奏听感提供了一种客观依据.  相似文献   

7.
提出一种基于MFCC和共振峰频率特征的汉语普通话口音识别方法.该方法首先提取Mel频率倒谱系数(MFCC)和共振峰频率特征作为混合高斯模型(GMM)的输入,然后采用期望最大化(EM)算法训练模型,对两种特征分别建模,最后采用基于最大似然准则(ML)的信息融合策略进行口音判别.实验数据库为7个地区的语音数据.经过交叉验证,该方法对于中国典型地区普通话口音的识别率达到85.61%,比单一使用MFCC特征或共振峰频率特征分别提高了6.62%和32.90%.  相似文献   

8.
基于变分模态分解算法实现对语音共振峰的提取,针对其存在共振峰合并和虚假峰值2个主要问题,通过对分解模态数、平衡约束参数的分析,提出了自适应变分模态分解法.并从的正交性、能量保存度2个方面证明了该方法的可行性;最后,利用该方法实现对佤语共振峰的估计.实验结果表明,基于自适应变分模态分解对佤语孤立词的共振峰估计平均正确率可达85.50%.  相似文献   

9.
文章采用实验语音学研究方法,把两首不同题材的蒙古长调作为研究对象,通过对长调歌唱语音信号的采集,分别提取基频、能量、共振峰和时长等参数,对两首长调进行声学参数层面的对比分析.不同题材长调在歌唱时声学参数存在差异,主要表现在能量和基频参数方面,牧歌能量和基频均大于赞歌,从而表现出牧歌悠扬嘹亮的声学特质,充分说明了共振峰参数反映歌手的歌唱水平,而题材差异集中在能量和基频方面.  相似文献   

10.
在虚拟仪器平台上,通过微型麦克与计算机声卡对语音信号进行实时采集,并进行消噪处理和端点检测,以美尔频率倒谱系数及其差分作为特征参数提取方法,应用改进的矢量量化一隐马尔可夫识别算法,设计了与文本无关的说话人识别系统。系统运行结果表明,本文实现的系统运算速度快,且具有较高的识别率。  相似文献   

11.
针对现有的铁路语音记录系统缓充池容量小、存储时间短的现状,采用FPGA器件构造双缓冲池,改进了传统语音存储在线缓冲技术.实验结果表明,本研究所设计的基于FPGA的铁路语音记录系统较以往类似的语音记录系统在存储容量上有很大提高,在线播放功能较传统的单缓冲池语音记录系统也有很大改善.  相似文献   

12.
通过对多种电话录音系统的深入研究,提出了一种对模拟语音信号进行数字化录音的方法,并将其应用于电话录音系统中,电话录音系统经过实际运行、测试,结果表明,该系统具有录音时间长、音质好及使用方便等优点,本文介绍了数字电话录音系统的设计思想、技术现实、实现步骤及主要功能。  相似文献   

13.
郭蕾  杨阳蕊  廖艳莎 《科技信息》2009,(23):I0126-I0127
本文拟以东乡县锁南坝镇为代表,采用田野调查法收集录制东乡县的汉语方言语料,实地访查锁南坝、那勒寺等地并且辅以临夏县、东乡等地县有文献。其次用实验语音学的方法对收集录制的语料进行切分标注,并和听、记音的结果进行比较、分析,进而总结出东乡汉语方言的音调特点以作为了解各种语言接触现象中的一种情形。供作语言接触研究的参考。  相似文献   

14.
介绍一种基于SPCE061A的语音系统的开发,包含录音语音播报等功能。完成作品为小型语音控制模组,可以通过程序的不同录入完成录音、复读、语音播报等功能。  相似文献   

15.
语噪分离技术综合算法及其应用   总被引:2,自引:2,他引:0  
目前,话音记录领域对采集到的音频信号仅仅做到了将静音与非静时分离,而未进一步处理非静音。作者针对这一情况,提出一种综合算法:在静音与非静音分离的 基础上,综合应用语噪识别技术,对前一步分离出来的非静音,进行二次处理,即进行语噪分离和音频信号分类处理。实践证明,该算法切实可行,大大降低了噪声环境下记录系统需要存储的数据量。  相似文献   

16.
用最新的语音数字信号处理器、常用单片机、大容量快速闪烁存储卡和编解码器,设计了一个数字语音记录设备。它记录时间长、话音 自然度和可懂度好,具有较高的性能价格比。  相似文献   

17.
通过分析分子营销语音监控的现状,设计一种基于信息网的集群录音系统,并介绍了该系统的架构和具体软硬件配置,以及它的经济和社会效益.集群录音系统实现了对营销客服电话的统一监控和管理.  相似文献   

18.
针对当前CTI领域数字话机记录的难点,提出一种直接记录数字话机数据的方案.截取并解码数字电话线上传输的2B+D通道数据,由B通道得到双向话音数据流,由D通道捕获CallerID,DNIS,自动号码识别、中继号码、坐席按键等信息.采用简洁高效的语音压缩与识别处理机制,让数字话机记录方案比起其它记录系统更县优势.该方案已在国内某机场指挥调度中心获得成功应用.  相似文献   

19.
佤语是云南省西南部的一种跨境语言,构建佤语语音识别系统对国家安全、跨境文化交流和经济贸易都有着重要的意义.基于HTK平台,针对1 860个佤语常用词进行特定人孤立词语音识别.语音语料来源为录音棚和田野录音,语音规模录音棚男性2人、女性2人,田野录音男性3人、女性2人,每人每个词发音5遍,总的语料数量为83 700条.实验结果表明,对于上述的语料,进行的基于HTK的佤语特定人孤立词语音识别正确率在92%以上.  相似文献   

20.
目的 利用Cool Edit软件采集、编辑、保存方言语音,使得方言语音研究更加标准化,规范化.以克服传统的方言语音采集手段导致有些语音不清楚、语音保存格式不标准、占用空间大、不利于语音数字化研究的缺陷.方法 利用Cool Edit软件采集陕西关中语音方言信息,然后进行格式转换、降噪处理等,最后以mp3格式保存起来,其研究方法技术比较新颖.结果 利用Cool Edit进行语音研究,最终获得一套陕西关中方言语音信息数字化数据库.结论 这种研究方法为方言语音研究提出了一个新的研究方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号