首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对农业智能装备工作环境复杂、操作不便捷与作业效率低的问题,对语音技术在农业智能化中应用的前景进行了展望,并提出农业装备中语音系统软硬件整体架构,把语音技术分为语音提示、语音报警、语音控制、视觉语音4部分.在ROS开发环境中,运用python编译语言建立控制软件系统框架,将成套控制软件分为农作物信息检测单元、作业信息检测单元、接收语音信号单元、作业命令控制单元、语音播报-报警单元,把各功能单元进行模块化编程,实现整套系统的多功能同步协调运行.以葡萄采摘机器人为例,分别实现采摘机器人作业信息语音提示功能、语音控制采摘机器人运动功能、田间葡萄品种与成熟度信息识别储存并语音播报功能,对推进语音技术在农业智能化中的应用具有一定价值.  相似文献   

2.
语音识别、语音合成技术实现了人和机器人之间的接口。语音识别芯片AP7003完成语音识别和语音合成的应用使智能机器人的智能化程度显著提高。  相似文献   

3.
鲁棒语音识别技术综述   总被引:1,自引:0,他引:1  
鲁棒语音识别是为了解决噪声环境所引起的语音识别系统识别和训练不匹配的情况.依据噪声对语音识别系统的影响,从信号空间、特征空间及模型空间3个层面上分别对语音增强技术、特征增强技术及语音模型补偿、增强技术进行了总结,并分析了不同方法的特点、实现及应用.  相似文献   

4.
由于噪声信号的干扰,导致机器人难以实现对微弱信号的远距离语音识别,影响最终的识别效果.为此,本文提出基于微信号增强的机器人远距离语音识别仿真研究.首先采用谱减法对微信号进行增强处理,由于语音信号中噪声功率谱具有一定的稳态属性,可估算出噪声的功率谱,再利用谱减计算求出纯净语音的功率谱,对傅里叶变换后的各个相位信号进行差异化赋权后,再对去噪功率谱进行拟合,完成对信号相位的恢复.在语音识别阶段,将增强后的原始语音信号分解为若干个独立的语音帧,在梅尔三角滤波器组中提取语音信号的Mel频谱参数,将其与语音频率之间的关系作为识别特征参数,最后利用梯度下降算法,在损失函数的约束下匹配与识别特征拟合度最高的内容,实现语音识别.仿真测试结果表明,本文提出的设计方法在噪声、不同信噪比、不同测试距离下对语音的识别率均达到了95.00%以上,与对照组相比具有更好的识别效果.  相似文献   

5.
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。  相似文献   

6.
本文设计了一种基于LIN总线的语音控制智能家居系统,该系统采取分布式控制方式,以凌阳SPCE061A作为中央处理器,AT89S52单片机作为从机.由凌阳SPCE061A对语音命令进行识别,识别结果通过LIN总线传给特定的从机,再由从机执行对家电的控制.语音识别部分采用特定人识别和命令分层技术,系统对家庭的各个成员语音命令进行采样.存储,从而实现家庭各个成员的语音识别.  相似文献   

7.
利用基音特征参数和共振峰特征参数提取方法,分析研究了不同情感状态的语音信号,并应用模板匹配方法对语音信号进行识别,其原理和实现方法通俗易懂,便于理解,为语音信号的情感识别技术提供一定的判断指标。  相似文献   

8.
根据语音发声过程中的混沌特性,应用非线性动力学模型分析情感语音信号,提取了该模型下情感语音信号的非线性特征以及常用的声学特征(韵律特征和MFCC).设计情感语音识别对比实验,将非线性特征与不同声学特征融合并验证了该组合下的情感识别性能,研究了语音信号混沌特性对情感语音识别性能的影响.实验选用德国柏林语音库4种情感(高兴、愤怒、悲伤和中性)作为语料来源,支持向量机网络用于情感识别.结果表明,非线性特征有效表征了情感语音信号的混沌特性,与传统声学特征结合后,情感语音识别性能得到了显著提高.  相似文献   

9.
为了提高学校导游车辆的智能化、信息化和人性化水平,在分析导游车应用功能的基础上,首先对液晶显示、语音模块、超声波避障、景点检测等6个模块设计,其次对智能校园导游车的硬件及软件流程图进行设计,实现对导游车的智能化识别的定位、管理.  相似文献   

10.
本设计运用单片机,结合语音识别芯片LD3320,利用语音输入完成控制信号输入,通过语音、数码管、继电器和传感器的反馈完成输出。该设计的语音命令平均正确识别率可达90%。在智能汽车领域,性能良好且成本低廉的语音识别系统将具有广阔的应用前景。  相似文献   

11.
通过对语音识别技术的原理进行分析,结合特定人语音识别技术在门禁系统中的具体应用,从语音信号的预处理、信号端点检测、特征信号的提取到识别策略的算法等关键技术上进行研究,从技术角度阐明了该系统在理论上的合理性和可行性,并通过实验说明系统在噪声干扰的情况下性能没有明显的下降.  相似文献   

12.
该文介绍了语音识别技术的基本原理,以现代智能家居为背景,将非特定语音识别技术应用于智能家居控制系统中。通过非特定人语音识别技术,该系统能够正确地识别出人的语音控制命令,进行家电设备的智能语音控制,实现家电设备控制的智能化、便捷化。  相似文献   

13.
管制指令特征参数提取研究   总被引:2,自引:1,他引:1  
在管制指令语音识别系统的研究中,语音的特征参数提取方法是影响系统识别率的关键因素之一。在Matlab平台上基于MATLAB GUI技术,设计完成HMM语音训练识别模型的用户操作界面,实现特征参数提取方法的选择、语音信号的训练、识别操作及结果输出和波形显示。通过实例对比分析,特定人和非特定人情况下,LPCC和MFCC两种特征参数提取方法在训练、识别时间和识别率上的差异。结果表明,特定人时LPCC参数的识别优势明显;非特定人时,MFCC参数的识别效果和效率更好。  相似文献   

14.
红外线人体感应控制语音系统的研究   总被引:1,自引:0,他引:1  
红外线人体感应单片机控制语音留言系统是由红外线人体感应模块、单片机控制系统及语音模块三部分组成.它主要是解决了对感应信号方向的识别,并对信号进行分析和处理,最终控制语音模块实现其功能.该系统的设计目的就是能够起到给人们语音提醒的作用,这一功能的实现类似于人们常见的电话留言装置.  相似文献   

15.
为了识别一组非特定人、不连续的数字语音信号,本文提出了一种基于支持向量机理论的语音信号识别算法.具体过程主要包括训练过程和识别过程.其中训练过程为:先使用预先建立起来的语音库对选定的支持向量机进行训练,得到一组与该语音信号相关的支持向量;在识别过程中,首先获取被测语音信号,并根据MFFC理论提取特征向量,然后使用训练后的支持向量机进行识别.此外,还提出使用短时区域能量谱的方法对语音信号进行端点检测.结果表明,与目前流行的隐马尔可夫算法比较,本文算法具有识别速度快、准确率高等优点.  相似文献   

16.
采用云计算的方法将汉字的笔画引入汽车车牌识别系统中,通过提取运动汽车的车牌图像,对车牌字符进行准确识别与输出.该识别系统识别准确、效率高,不仅可以准确有效识别汽车车牌,而且可以通过云计算进行数据的后期处理并实现输出结果资源共享,为实现交通智能化管理提供帮助.  相似文献   

17.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

18.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

19.
基于径向基神经网络的数字"0"~"9"语音识别   总被引:1,自引:0,他引:1  
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上.  相似文献   

20.
根据语音信号偏离高斯分布程度大而背景噪声信号偏离高斯分布程度小这一特征,提出一种改进的以语音短时幅度谱偏度为特征参数区分语音段和噪声段的语音激活检测算法,并应用到2.4 kbit/s混合激励线性预测(mixed excitation linear prediction,MELP)声码器中.通过与自适应多速率(adaptive multi-rate,AMR)语音编码标准中的语音激活检测算法相比较,该算法复杂度较小,且对背景噪声服从高斯分布的语音信号具有更好的端点检测性能.实现了可变速率MELP声码器的平均输出码率下降为1.9 kbit/s,通过非连续传输后合成的语音具有良好的舒适性和连续性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号