首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求取语音波形的分维值轨迹可把人的发音分割成句子、词、甚至音素.实验证明,该方法在语音分割中取得了很好的效果.  相似文献   

2.
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。  相似文献   

3.
音素HMM语音识别是当前语音识别领域的一个热点。本文在简单介绍音素识别的相关理论后,着重讨论了一种新的极低速率语音编解码器的原理、方法和其在音素识别上的应用。最后给出相关的实验结果。  相似文献   

4.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。  相似文献   

5.
在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。  相似文献   

6.
研究一种中文语音信息编码技术.通过采用语音小波分析识别处理和语音信息特征编码,包括中文语音小波包分解、语音音素和音节声调识别、口音特征参数提取、语音信息和特征参数组合编码,这种低比特率编码技术理论上可将传输效率提高1倍.  相似文献   

7.
汉语语音识别研究中,识别单元的选取是很重要的。该文提出一种基于声韵母分割的,以韵母为基本识别单元的大词汇量孤立词的语音识别方法,并与以汉语词为基本识别单元的语音识别方法进行比较识别实验。结果表明,基于韵母为基本识别单元的语音识别性能优于以汉语词为基本识别单元的语音识别方法。  相似文献   

8.
强噪声环境下汉语语音识别的模糊分类算法   总被引:2,自引:0,他引:2  
论述了强背景噪声环境下利用模糊分类算法对大词汇量的汉语语音进行了分类识别,根据噪声的汉语语音特点,采用有边界的交叉分类和无边界的模糊分类相结合的措施,较成功地解决了强噪声环境下的汉语语音分类。  相似文献   

9.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

10.
一种基于段间距离测度的语言自动分割方法   总被引:5,自引:0,他引:5  
根据连续语音中不同类语音段之间内在的相异性,提出了段间距离的概念,并基于特征矢量距离给出了段间距离的一种测度。在此基础上,提出一种新的语音自动分割方法,它根据语音段间距离曲线的峰值点对语音音素进行分割,而不需要关于语音单元的先验知识或参考模型,在该方法中,语音特征矢量按帧计算,通过采用适当的帧重迭度,可以使语音分割具有较高的时间分辨率,实验结果表明,该方法具有较高的分割精度和速度。  相似文献   

11.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

12.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

13.
语音信号非线性特征的研究   总被引:4,自引:0,他引:4       下载免费PDF全文
随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Lyapunov指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计  相似文献   

14.
对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率.  相似文献   

15.
一种基于小波系数方差的语音端点检测方法   总被引:4,自引:1,他引:4  
首先分析讨论了小波变换的原理,在此基础上提出了一种利用小波系数方差识别含噪语音信号中静音与语音的新算法。算法首先对含噪语音进行小波分解,观察各层小波系数的统计特性,提取它们的方差作为检测特征,从而进行语音端点检测。对该算法进行了仿真实验,并与传统的基于能量与过零率的端点检测算法进行了比较。实验结果表明:该算法在低信噪比条件下也能够有效分割语音。  相似文献   

16.
基于小波变换的汉语三字词语音基音频率提取   总被引:2,自引:0,他引:2  
声调是基音频率的轮廓,为准确提取基音频率,进行具有汉语特色的连续语音识别,提出了具有汉语特色的清浊音切分方法.与常用的阈值法相比,该方法能更好地找到清浊音的切分点,尤其是在字与字连接紧密时更有效(在这种情况下阈值法往往失效).在此基础上,利用小波变换的多分辨分析特性进行了汉语三字词语音基音频率的提取.实验结果显示,该算法能有效地将三字词语音分开,且得到的基音频率曲线符合汉语三字词语音的声调模式.  相似文献   

17.
语音增强用于抗噪声语音识别   总被引:12,自引:1,他引:11  
语音识别系统通常是将在安静的环境下训练得到的参数应用于实际环境中。如果实际环境也是安静的 ,则语音识别系统可以令人满意地工作。然而 ,当实际环境中有噪声存在时 ,语音识别系统性能急剧下降。为了让语音识别系统在安静的环境和有噪声的环境中都获得令人满意的工作性能 ,研究了一个将语音增强器和语音识别器级连起来的系统。该系统中 ,语音增强作为前端处理用于提高识别器输入端信号的信噪比。通过 3种不同的增强算法用于纯净语音和3种类型带噪语音的实验结果分析比较表明 ,这一方法对纯净语音的识别精度几乎没有任何改变而大大提高了系统的抗噪声性能  相似文献   

18.
汉语孤立词声韵分割算法的研究   总被引:2,自引:0,他引:2  
文章从汉语语音评价系统设计的需要出发,针对DTW算法和汉语音节的特点,研究并实现了汉语音节中声母和韵母分割的两种算法,算法依据的基础都是依据不同类语音段数据相异的原理.在实际系统测试中,发现基于段间距离的分割算法取得了良好的实验结果,可以作为汉语语音评价系统中的声韵分割算法.  相似文献   

19.
采用STC11L08XE单片机作为主控制器,以LD3320芯片作为外扩语音控制器件,实现语音辨识功能和对空调运行状态的控制,如启动、停止、功能转换、温度调节、定时开关等.该语音控制系统由语音辨识模块、红外线传输模块、LED指示灯模块及按键触发模块组成.根据非特定人声语音辨识方案,设计相应的语音识别程序,并将语音控制系统模块集成到具有红外传输功能的空调遥控器电路中.实验结果表明,根据初始设定的语音命令可实现系统对空调的语音控制,该系统在一定距离范围内具有较高的识别率.  相似文献   

20.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号