首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

2.
介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人的语音对话和语音控制。  相似文献   

3.
为了增强室内移动机器人的障碍物检测能力和降低系统成本,提出了一种基于深度图像的单一Kinect传感器的室内移动机器人避障系统.该系统将Kinect传感器竖直放置,并对深度图像进行了几何变换,提供了更加适合探测地面和空中障碍物的视角.对深度图像进行中值滤波以消除图像噪声,并采用统计平均的背景减除法去除无障碍背景,提取障碍物的深度图像,然后对障碍物的大小、位置与数量进行检测,最后根据检测的结果,并利用人工视场与Kinect摄像头对位置环境局部最小值场景的检测相结合进行避障路径的选择.结果表明:局部最小值场景检测方法能够高效检测出环境中存在局部最小值的缺陷,沿墙行走模式也大大减少无效路径,解决了狭窄通道内震荡的问题,有效地实现了室内机器人在动态环境下的避障.  相似文献   

4.
设计并实现了一个基于LabVIEW与ZigBee无线通信模块的语音遥控机器人系统.操作者通过话筒将语音指令传入到上位PC机,利用Lab VIEW编程实现语音识别及串口通信控制指令发送.机器人端利用基于CC2530的Zigbee无线通信模块的控制与通信功能,根据接收到的指令,驱动电机,完成运动控制,同时可以利用红外传感器实现自主避障功能.  相似文献   

5.
本文介绍了一种以AVR单片机为控制平台的廉价,快速,简洁的基于CMOS图像传感器的机器人寻线控制系统。系统通过CMOS传感器对地面的深绿色和白色图像信号进行采集和二值化处理,得到的信号通过AVR单片机后输出PWM波和D/A信号去驱动行走机构。实行了对机器人的寻线行走控制准确定位。为提高机器人的自主性和智能性,本系统在设计中还使用了红外遥控实现机器人的无线启动功能和使用超声波模块实现机器人的避障检测功能。  相似文献   

6.
大数据时代为深度学习在语音识别中的应用提供了良好的平台.本文介绍了用于语音识别的深度学习模型及用于语音识别的深度学习的学习过程.语音识别技术中特征提取、模式匹配和模型训练都离不开大量训练数据的积累和匹配,而数据的可靠和有效依赖于算法的可行性.在大数据基础上,深度学习用于语音识别大大提高了识别率.  相似文献   

7.
文章从图像处理的角度,介绍了目前国内对语音生理研究在图像处理的主要方法.通过对发声动力器官、嗓音声源、声道以及唇形研究四个部分,阐述了语音生理研究过程中所采用到的图像处理方法.  相似文献   

8.
在线识别是现今使用率最高的语音识别方式,只占用小小的存储空间,就能实现大数据的语音识别功能。本文借助微信公众平台的语音识别引擎设计并制作了一款语音机器人,经验证具有良好的性能,如能实现产品化,将具有重大的市场价值。  相似文献   

9.
王腾  李长江 《科学技术与工程》2011,11(5):979-982,1011
从人工智能的角度上说,机器人足球比赛主要研究了多智能体系统要解决的分布的多机器人在复杂的动态环境下,如何通过相互协商完成某一复杂任务。全自主机器人足球是机器人足球发展的一个趋势,在完全未知的环境中,通过自身学习来了解和积累外部信息。对于传统强化学习,存在容易出现死锁,学习速度慢,要求外部条件是静态等缺陷。提出了一种基于蚁群算法的强化学习模型,即蚁群算法与Q学习相结合的思想。随着赛场上态势的渐趋复杂,传统的Q学习速度会变得很慢且交互困难。通过对新算法的分析,实验数据显示:新算法不仅提高了Q学习的学习速率,在解决状态空间维数的灾难问题上,也是可行的。  相似文献   

10.
从人工智能的角度上说,机器人足球比赛主要研究了多智能体系统要解决的分布的多机器人在复杂的动态环境下,如何通过相互协商完成某一复杂任务。全自主机器人足球是机器人足球发展的一个趋势,在完全未知的环境中,通过自身学习来了解和积累外部信息,对于传统强化学习,存在容易出现死锁,学习速度慢,要求外部条件是静态等缺陷。本文提出了一种基于蚁群算法的强化学习模型,即蚁群算法与Q学习相结合的思想。随着赛场上态势的渐趋复杂,传统的Q学习速度会变得很慢且交互困难。通过对新算法的分析,实验数据显示:新算法不仅提高了Q学习的学习速率,在解决状态空间维数的灾难问题上,也是可行的。  相似文献   

11.
为了辅助公安人员更好地完成排爆工作,设计和开发了一个带双目立体视觉系统的排爆机器人。给出了一个切实可行的视频图像处理系统,包括设计原理、系统结构、硬件选型、视频捕获的软件实现等。该机器人视觉系统成功地通过抓取实验,表明了它在精度上能够满足排爆机器人的项目要求。  相似文献   

12.
为了降低机器人编程学习的难度,提高学习效率,同时拓宽学习机器人编程的学龄范围,利用语音识别和自动化技术,设计了基于教育机器人的语音控制自动化编程系统。测试结果表明,语音识别的准确率在93%以上,系统运行成功率在80%以上。与图形化编程和文本编程相比,语音控制编程更加智能化、易操作、易学习,达到了寓教于乐的编程学习目的。  相似文献   

13.
基于广义混沌同步系统(GS)和广义离散Sinai映射,提出了具有非对称密钥的数字图像安全通讯方案.方案能通过一个常规的语音信号隐藏几乎所有计算机所能识别的图像文件,以实现信息的伪装与隐藏,且含有24个密钥数并能无损恢复隐藏图像,密钥空间可达到10360.该方案能使接收方利用非对称密钥对收到的密文进行数据源真伪性认证和解密,适用于网络数字通讯语音伪装中的图像传输.对密钥空间、密钥参数敏感性和加密图像的相关性等分析表明该方案具有较高的安全性.  相似文献   

14.
智能机器人中基于知识学习的图像理解系统   总被引:1,自引:1,他引:0  
图像理解系统是智能机器人做出正确决策或完成一些控制系统的主要环节,也是计算机视觉研究的一个重要分支,如何构建一个合理完善的图像理解系统已成为当今智能机器人研究领域的热点问题。图像理解系统所研究的问题是:为了完成某一任务,需要从图像中获取哪些信息,以及如何利用这些信息获得必要的解释。图像理解的研究要涉及或包含研究获取图像的方法、装置和具体应用的实现。该论文主要论述了智能机器人中基于知识学习的图像理解系统的基本框架结构以及图像理解中框架知识的表示、推理和学习,对智能机器人中图像理解系统的一些关键技术进行了探索性的研究,最后对智能机器人图像理解系统的应用前景做了概括性的总结。  相似文献   

15.
本文提出了一种在语言学习系统中运用,能适合微电脑控制的语音信号切换开关阵列。介绍了满足语言学习系统要求的语音放大器的设计。同时解决了模拟开关应用于控制较大幅度无直流成分信号存在的问题。  相似文献   

16.
介绍了基于图像的机器人视觉伺服原理和基本实现方法,详细阐述了图像特征提取和视觉伺服控制器设计中所面临的问题及其解决办法,并展望了未来的发展方向。  相似文献   

17.
提出一种基于图像的运动序列生成技术 ,此项技术不需要已知目标物体及所在背景的 CAD模型 ,也不需要对摄像机进行标定。在样本图集的基础上 ,通过 Karhunen- L o-eve(K- L)变换得到图像的特征表示。建立了机器人关节角与图像特征之间的非线性关系。在机器人关节空间进行轨迹规划 ,最后生成关于机器人虚拟运动的图像序列。以 UP6机器人为目标物体 ,进行虚拟运动实验 ,得到 UP6机器人的虚拟运动 ,结果表明该技术方便有效  相似文献   

18.
提出了一种利用离散余弦变换(Discrete Cosine Transform,DCT)系数和混沌系统的可用于检测图像篡改定位的脆弱性数字水印算法.首先将图像进行不重叠的分块,分块后的图像经过DCT变化后,利用中频系数产生水印.同时利用混沌系统构成图像块间信息嵌入和提取的对应关系,并将水印嵌入到相关块的最低有效位.图像篡改检测过程为:将提取的水印和生成的水印进行比较,通过差异的位置对其进行定位.实验结果显示,该算法具有良好的定位精度,混沌系统的采用,使算法具有较高的安全性.  相似文献   

19.
该虚拟实验平台的设计采用MATLAB软件,实现多媒体通信技术基本功能的仿真演示与分析。图形界面设计分为图像处理和语音处理两部分。使用GUI设计交互式的操作界面,调用函数实现语音信号的频率、幅度的各种变化,如傅立叶变换、多媒体图像边缘提取与滤波、图像增强、直方图处理等,程序界面简洁、操作简单,具有一定的实用意义。该设计具有良好的交互性和可扩展性,可以帮助用户掌握数字图像处理和语音信号处理等多媒体技术的基本理论和方法。  相似文献   

20.
由于背景噪声、混响以及人声干扰等因素,远场语音识别任务一直充满挑战性。该文针对远场语音识别任务,提出基于注意力机制和多任务学习框架的长短时记忆递归神经网络(long short-term memory,LSTM)声学模型。模型中嵌入的注意力机制使其自动学习调整对扩展上下文特征输入的关注度,显著提升了模型对远场语音的建模能力。为进一步提高模型的鲁棒性,引入多任务学习框架,使其联合预测声学状态和干净特征。AMI数据集上的实验结果表明:与基线模型相比,引入注意力机制和多任务学习框架的LSTM模型获得了1.5%的绝对词错误率下降。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号