首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于语音编码系统的语音识别,由于受编码的影响其识别效果在编码速率下降时显著降低。传统的识别方法从重构语音波形中提取特征参数,并针对该特征参数进行训练和识别。比较了基于编码语音的识别准确率和基于编码参数的识别准确率,并研究了编码参数对识别准确率的影响。在此基础上,通过选择受编码影响较小的编码参数,直接将LPC参数和残差信号参数组合起来构成特征参数进行语音识别。实验结果表明,采用这种方法的AMR语音识别系统,其识别效果接近于基于原始语音的识别效果。  相似文献   

2.
随着信息化时代的快速到来以及计算机技术的不断完善发展,语音识别在众多领域都得到了应用,同时语音识别有着广阔的发展前景。当下,在对语音识别的研究方面,研究人员大多以线性系统理论为基础,采用隐马尔可夫模型(HMM)、动态时间规整(DTW)、矢量量化(VQ)等技术。随着研究的深入,发现以线性系统理论为基础的方法和语音的非线性过程特性不能很好的融合,采用非线性理论研究成为了语音识别的重要突破口。人工神经网络(ANN)等非线性理论成为了研究语音识别的热点。采用Python语言进行深度学习与语音识别相结合的方法进行研究,希望能够使语音识别在速度、准确度等方面得到较好的效果。介绍了Python在深度学习语音识别中的使用。通过实验结果可以看出,DNN-HMM方法在准确率方面比GMM-HMM方法有所提高。  相似文献   

3.
为了提高系统的鲁棒性,联合二代小波和TEO一起对语音进行去噪.为了解决动态环境下的说话人识别的误识率问题,在识别阶段,把小生境粒子群算法应用于GMM之中.从实验得出,采用本文提出的参数对于说话人识别的效果较好.采用基于小生境粒子群的高斯混合模型进一步提高了识别性能.  相似文献   

4.
结合动态谱特性的语音识别研究,阐述了一种有限状态矢量量化(FSVQ)方法。FSVQ利用了过去的信息来选择合适的码本进行编码,对于语音识别更为有效。改进了所使用的语音特征参量,除了LPC倒谱系数外,结合使用了动态谱特征和能量的对数值,并根据汉语发音特征对语音信号端点进行一种加权处理。实验结果表明:与说话人有关的孤立词识别率达到98%。  相似文献   

5.
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率.  相似文献   

6.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

7.
语音信号时间动态规正新方法   总被引:5,自引:0,他引:5  
利用函数逼近原理,提出了一种语音信号时间动态规正的新方法,并由此导出了可用于神经网络语音识别的新特征。重点讨论了时间动态规正的原理、新特征的提取方法和性质。实验及理论分析表明,新特征对于神经网络语音识别及语音压缩具有很好的效果。  相似文献   

8.
一种基于自适应模糊滤波的语音增强方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在语音识别和语者识别中,通常需要先将输入的语音信号进行去噪处理,这样可使识别的正确率大大提高,通常采用基于LMS算法和RLS算法的自适应线性滤波器来进行去噪。提出了一种基于自适应模糊滤波器的语音增强方法,该模糊滤波器是一种非线性滤波器,它在语音信号的特征域空间采用参数映射的方式来滤除噪声,并能够进行自适应结构调整和参数更新。实验结果表明,采用自适应模糊滤波器来滤除噪声比线性滤波器具有更好的效果。  相似文献   

9.
针对语音情感线性参数在刻画不同情感类型特征上的不足,将多重分形理论引人语音情感识别中.通过分析不同语音情感状态下的多重分形特征,提取多重分形谱参数和广义hurst指数作为新的语音情感特征参数,并结合传统语音声学特征,采用支持向量机SVM对其进行语音情感识别.试验结果表明,该方法可使系统的准确率和稳定性得到有效提高.非线...  相似文献   

10.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

11.
徐云乾  王宽仁  吴金涛 《科学技术与工程》2012,12(23):5775-5777,5783
针对AMBE系列芯片无法实现数据全双工读写模式的弊端,提出了基于DSP的嵌入式AMBE算法实现的硬件平台。该平台以芯片TMS320VC6713和AIC23为主要器件。实验表明,该语音算法在TMS320VC6713上得到了很好的实时实现。  相似文献   

12.
采用线性预测倒谱系数(linear prediction cepstrum coefficient, LPCC)作为语音的特征参数,矢量量化(vector quantity,VQ)方法进行模式匹配,探讨声纹识别以实现身份认证,并对此识别方法进行了相关的实验.通过验证,这种方法可以区分不同的说话人,并且在做说话人辨认实验时可达到较高的识别率.  相似文献   

13.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

14.
介绍了STRAIGHT算法的原理,并选择STRAIGTH谱作为语音识别的特征参数.采用对应点映射方法以提高同一发音不同样本参数间的匹配效果,在特征匹配的方法上选择差别子空间法,将二者结合应用于非特定人汉语数字0~9的语音识别,实验结果表明.基于STRAIGHT谱的非特定人数字语音识别可以达到97%的识别率.  相似文献   

15.
提出了一种基于PCANN/PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络(PCANN)。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。  相似文献   

16.
Spark SDK是L&H公司推出的可进行二次开发的语音识别软件 ,它提供了一种快速简便的方法 ,使开发人员可以将语音部分识别功能添加到他们的应用程序中。在雷达情报口报录取器中 ,利用Spark SDK实现连接数字语音识别 ,并通过编写识别专业词汇的函数以及修改Spark SDK的语法规则等方法提高了语音识别软件的识别率。  相似文献   

17.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。  相似文献   

18.
肖薇  李奇  冯南 《科学技术与工程》2004,4(12):1016-10181023
采用分布武语音识别(DSR)模式来设计和实现手机的语音拨号系统:在手机端进行特征参数的提取,然后通过无线信道传输到服务器端进行识别与训练,最后把结果送回到手机端。通过试验发现,该语音拨号系统识别率在90%以上,并且大大提高了语音质量和识别的速度。  相似文献   

19.
语音端点检测是语音识别预处理的一个重要环节,语音端点判断正确与否直接影响到语音识别的效果。短时能量法与过零率方法是语音端点检测的两类主要方法,融合这两类算法,并结合短时频谱峰值,归纳总结了4条语音端点检测的融合检测准则。在语音分段时提出自适应逐级分段计算,寻找满足误差要求的语音起始和终止端点。语音实验验证了本文所提语音自适应分段融合检测方法的有效性,同时,该方法没有增加语音端点检测的额外计算量。  相似文献   

20.
双中 《贵州科学》2002,20(4):118-120
本文对比介绍了几款语音识别集成芯片的功能特性和应用情况,并通过一个实例简要说明了用语音识别芯片构造一个系统的应用方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号