首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
设计了一个小车自动行驶控制系统.该系统以一个基于流水线结构CORDIC算法设计的双核FFT处理器为基础,实现语音信号的频谱分析,并通过提取MFCC语音特征,与模板库中数据指令进行对比,进而产生控制信号,最终由FPGA控制的无线通讯模块来实现对小车常用基本操作的语音控制.系统在DE2实验开发平台上进行下载测试,结果表明该系统可实时地完成对语音指令的响应,同时系统具有硬件结构简单、实时性好、可靠性高等特点,可广泛应用于语音识别控制领域.  相似文献   

2.
管制指令特征参数提取研究   总被引:2,自引:1,他引:1  
在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。  相似文献   

3.
藏语数字语音识别是藏语语音识别中的基础环节。文章以藏语数字语音信号产生的数学模型为研究对象,从频域、时域、倒谱域出发,对藏语数字语音识别进行了分析,重点论述了藏语数字语音识别的原理、仿真实验及测试方法。以藏语数字语音库为数据资源,对藏语数字语音建立了训练模型并从中提取语音特征,通过模板匹配算法,获取录音数据中待识别语音的模板。实验证明已建立语音库的识别率达100%,随机录音的识别率则达90%。  相似文献   

4.
藏语孤立词语音识别系统研究   总被引:3,自引:0,他引:3  
藏语语音研究相当滞后,文章结合语音识别知识和藏语特点,尝试性地研究了藏语孤立词语音识别研究.首先提取MFCC参数作为语音特征参数,形成语音模板库,采用DTW模型实现了语音识别系统,并且针对藏语孤立词多音节的特点,改进了传统的基于短时能量和短时过零率双门限检测法,即加入了音节间静音段时长门限,提高了孤立词语音信号检测的准确性和识别率.  相似文献   

5.
设计一种以TM S320VC5402为核心,外围扩展语音编解码器、程序存储器、语音存储器等集成电路,基于定点数字信号处理器的实时说话人身份识别的系统.通过为每个语音命令设置3个模板的预留空间,使每个语音命令可以有3个模板参与识别,避免说话人语气和语调的变化产生的影响.在比较嘈杂的环境下,系统的正确识别率超过87%.处理器VC5402从识别中断并响应中断到CPU进入中断服务程序的第1条指令,需要20个时钟周期,系统的平均处理时间小于0.2 s.  相似文献   

6.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

7.
基于语音识别的说话人身份辨识系统   总被引:2,自引:0,他引:2  
提出一种在小字库孤立语音条件下,集成语音识别与说话人的识别技术,并进行说话人身份代码(密码)识别、认证.利用语音信号的短时分析技术进行孤立词的单元分割,采用临界带特征矢量作为语音信号特征,分析了经典语音识别算法——动态时间规整算法,提出了对语音模板各帧加权的改进方法.为提高识别响应速度,研究了多门限多轮次的判决方法,在增加多套模板、提高识别率的情况下,降低了系统的响应时间.  相似文献   

8.
计算机语音信号处理与语音识别系统   总被引:1,自引:0,他引:1  
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达986%,说话人识别率达到922%。  相似文献   

9.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

10.
随着科学技术尤其是计算机技术的不断发展,语音识别被广泛应用到各个领域.针对方向指令的语音,使用梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)作为特征参数,连续马尔科夫模型(Continuous Hidden Markov Model,CHMM)作为识别模型,对语音信号进行识别处理.实验结果显示,此方法在方向指令语音识别中取得了良好的结果,有较高的识别准确率.  相似文献   

11.
利用基音特征参数和共振峰特征参数提取方法,分析研究了不同情感状态的语音信号,并应用模板匹配方法对语音信号进行识别,其原理和实现方法通俗易懂,便于理解,为语音信号的情感识别技术提供一定的判断指标。  相似文献   

12.
以模糊集理论为基础,提出了一种汉语指令识别的模糊语音描述和模糊匹配算法,在语音信号的时间规整中,使用一种改进的非线性帧数规整算法,在40条指令的识别实验中,正确率达93%以上。  相似文献   

13.
说话人性别识别是语音识别研究中的一个重要分支.通过说话人的语音识别作为说话人性别识别的预分类技术可以降低研究问题的复杂度,提高系统的准确率.文中首先从建立的藏语语音性别库入手,提取语音的特征参数MFCC,进而利用SVM进行训练和识别.实验结果表明:用于说话人识别的MFCC特征能有效地用于藏语说话人性别识别,且与SVM联...  相似文献   

14.
使用录音设备对1 605个常用汉字进行录音,得到920个孤立字发音、3 680个非特定人的语音样本库.采用语音语谱图作为汉语单字语音识别的特征,构建了6层卷积神经网络应用于模型库的语音识别.通过深度学习方法对语音样本进行了训练和识别.实验结果表明,所构造的20-40-3500结构的卷积神经网络模型对语音样本库具有最好的识别效果,对测试样本的识别率达到97.87%,对全部样本的识别率达到99.32%.  相似文献   

15.
提出并实现了利用微软的语音识别引擎,通过受限的汉语语法分析和概念/关系分析,最终形成驱动指令,实现世博虚拟游历游戏的受限汉语语音识别及驱动技术。使用键盘及鼠标等输入设备有困难人群也可以无障碍的虚拟游历2010年世博园。  相似文献   

16.
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用动态时间规整(DTW)方法,可以利用使用过程中的数据不断修正原模板,使模板逐次趋于完善。本文研究了说话人识别的相关技术,提出并设计了一个基于DTW的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

17.
为了合成能够模拟表达说话人的情感状态的语音,提出一种基于情感基音模板的情感语音合成方法.该方法分别建立高兴、愤怒、悲伤和中立4种不同情感下的韵母基音模板库,建立4种声调模型,统计分析语音库中情感语音的韵律特征参数,运用基音同步叠加算法(PSOLA)合成含情感色彩的语音.实验以音节为合成单位,根据情感特征参数的统计分析结果调节合成语音的韵律特征,合成各种情感的语音.仿真实验结果表明:用情感基音模板合成的目标情感语音具有目标情感的音质色彩,再通过韵律参数调节,可合成较理想的情感语音.该方法可用于增加语音合成系统的智能化,提高人机交互的能力.  相似文献   

18.
为了简化家庭照明设施的控制,提出了一种基于语音控制的家庭照明方案。采用语音交互的方式,采集用户的语音作为指令。语音芯片对系统接收到的语音指令作出识别。根据识别结果,微处理器将指令下达给Zigbee网络的协调器,经由ZigBee网络发送至指定的终端节点,进而控制照明设备的动作。通过完成对整个系统的软硬件设计、调试表明,该系统具有结构简单、节点灵活等优点,可以实现简化家庭照明控制的要求。  相似文献   

19.
语音识别是当今信息领域标志性技术,是最具发展前景的综合性学科之一。该文用语音识别系统模式匹配原理,对比分析了模板匹配算法DTW与人工神经网络中的ANN算法在语音识别据识中的应用;提出了一种基于单个神经元的拒识算法,实验结果表明该算法能达到较高的拒识率。  相似文献   

20.
本文首先对声音的预处理及其信号特征的提取过程进行了简要介绍,然后提出了在孤立字词语音识别的一个新的算法,即新型的识别算法。通过此算法,系统可以在不降低系统识别精度的前提下,大大精简运算量,因此提高了识别系统整体的识别效率。实验证明,这种识别算法在基于模板的孤立字词语音识别中可以达到100%的识别精度,在基于非模板的孤立字词的语音识别中,其识别精度也可以达到90%以上,并且与传统的识别方法相比,缩短了训练时间,提高了识别速度。在孤立字词的语音识别中具有自己独到的优势。然后,枸建一个使用方便的语音识别系统,将本算法应用到实践当中来解决人们现实生活中遇到的各种问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号