首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

2.
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据.  相似文献   

3.
设想一套汉语方言语音识别系统。该系统将具有声、韵、调自动识别,中古声母、韵母、声调以及声母开齐合撮检索,同音和有音无字词检索,轻声、连读变调识别和文白异读识别等5个功能,汉语方言识别系统的构建将提高汉语方言研究的工作效率。  相似文献   

4.
提出一种以词片为识别基元的特定位置后验概率网格方法,解决了语音检索中的集外词处理问题,实现开集语音文档检索。通过引入前端查询扩展技术生成多个候选查询以补偿语音识别过程带来的误差及用户输入误差。在检索过程中引入编辑距离权重来实现模糊查询,提高系统的查全率并增强系统鲁棒性。实验表明该方法在集外词处理和系统鲁棒性等方面优于传统方法。  相似文献   

5.
为了实现基于内容的语音全文检索,提高语音检索性能,以及保障云端语音数据的隐私安全,提出了一种基于声母和深度哈希的密文语音全文检索方法.该方法将提出的基于汉语声母和元音的双向循环递归神经网络(RNN)-长短时记忆(LSTM)深度学习模型与语音感知哈希相结合,分别将加密语音和生成的哈希码上传至云端密文语音库和全文哈希索引表,并建立一一映射关系.查询时提取待查询语音的哈希码,并与云端的全文哈希索引表进行阶段式匹配检索.实验结果表明:该方法既能保障语音隐私安全,又能获得较高的检索精确度与可观的召回率(当精确度为97.68%时召回率可达47.60%),并在一定程度上减弱了说话人声音特征对全文检索的不利影响.  相似文献   

6.
建立中国少数民族濒危语言语音语料库的目的在于使濒于消失的少数民族语言的声音永久而系统地保存下来,并能使国内外语言学习、研究者方便地进行大规模语音资料的查询、检索和统计。语料库的特点和作用、工作步骤及建库过程中遇到的难点与汉语或非濒危语言语音数据库有所不同。  相似文献   

7.
语音增强是语音识别的重要组成部分,它是将尽可能纯净的原始语音从嘈杂的语音中提取出来。其目的是提高语音质量,从而提高语音识别的准确率。笔者在总结近年来的语音增强的相关算法的基础上,将这些算法进行分类,分为基于数字信号处理的方法和机器学习的方法。本文介绍了基于数字信号处理和基于机器学习的语音增强算法,并总结了几种常用语音增强算法的优缺点,最后提出了语音增强算法进一步研究方向。  相似文献   

8.
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能.  相似文献   

9.
本文从实践角度出发以芯片的存贮方式和语音合成方式为依据分析了一些主流语音合成芯片的特征,提出了选择芯片的原则和方法。分析了语音作为控制信号的特点,并就语音控制脉冲的取得、电路的消抖、语音和语音控制信号的分配问题提出解决措施。另外还分析了影响音质量的几个主要方面:滤波、功放电路、录音期间的回授等并就这几方面提出改善语音质量的措施。  相似文献   

10.
VoiceXML语音应用程序使人们可以通过电话查询网络上的信息和服务,实现了语音网络和数据网络的融合,是电子商务今后发展的一个方向。本详细地介绍了VoiceXML语音应用程序的开发过程,并给出了一个语音购物网站的具体实现方法。  相似文献   

11.
语音增强是解决噪声污染的有效方法,它的首要目标是在接收端尽可能从带噪语音中恢复纯净的语音信号.讨论强背景噪声下的基于模糊系统的语音增强方法,并与减谱法语音增强算法进行比较.计算机仿真结果表明,该方法在大大消除背景噪声的同时,消除了音乐噪声,同时保持语音信号较好的可懂度.  相似文献   

12.
为了对音视频内容进行更加有效地分析,将信息可视化方法引入数字媒体信息处理领域。设计并实现了集多媒体信号采集、大词表连续语音识别、文本检索和音频检索为一身的多媒体内容可视化分析平台,取得了较理想的效果,充实了信息可视化理论并对其具体应用进行了有益尝试。  相似文献   

13.
本文介绍一种用于话音内插系统(Speech Interpolation System)的高灵敏度话音检测器,并用该检测器进行了各种话音瞬态参数的统计分析。该话音检测器通过分析输入信号的短时能量和零交叉率等检测话音信号,采用自适应电平门限和释放延迟等措施提高了话音检测器的灵敏度和可靠性。同时,这种方案对于线路中的信令信息有较强的识别能力。采用本话音检测器对话音信号所做的统计分析不仅得到了具有一定价值的汉语活动规律,而且进一步完善了检测方案。同时,通过汉语和英语话音活动规律的比较表明汉语应用话音内插技术的效果要优于英语。  相似文献   

14.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

15.
分析了语音信号的非线性特征,用傅里叶谱、吸引子、分维数、李亚普诺夫指数等非线性动力学行为的数值特征表征了语音信号的非线性特征。采用时延语音序列重构语音吸引子,用计盒分维数计算语音波形的分维数。实验结果显示语音波形具有分形特征,语音中存在混沌。  相似文献   

16.
语音信息的采集过程中难免会有各种噪声的干扰,噪声降低了语音的可懂度及清晰度,甚至严重影响语音处理的准确性和可靠性。谱减法是语音减噪中最常用的方法,该方法基于人的感觉特性,对语音短时幅度谱进行估计,适用于受加性噪声污染的语音。本文通过统计分析谱减法的增益补偿因子和过减因子参数,研究基于谱减法的藏语语音减噪处理,并取得较为理想的实验结果。  相似文献   

17.
语音信号非线性特征的研究   总被引:4,自引:0,他引:4       下载免费PDF全文
随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Lyapunov指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计  相似文献   

18.
为了对高速列车车内强噪声环境下的语言清晰度进行定量分析,利用最新语言传输指数间接测量方法及其与汉语语言清晰度的关系,得到不同运行速度和语音声级下车内不同位置的语言清晰度.结果表明,受电弓下部车内位置语言清晰度状况最差;该位置的语言清晰度随速度呈线性规律变化,随语音声级呈二次非线性规律变化.采用多元非线性回归分析,建立以语音声级和列车运行速度为自变量的车内语言清晰度的关系式.试验测试结果与计算结果的标准差为1.75%,拟合优度为0.963,表明该关系式可以较好地模拟三者之间的相关关系.与基于语言清晰度指数的评价方法相比较,该评价方法所需的客观参量测量更简单,更具应用价值.  相似文献   

19.
语音信号特征的提取是语音识别的基础,目前使用的特征提取方法要将语音信息经多次复杂变换后提取特性。这样,往往满足不了实时性要求。该文对原始语音信号做简单处理,的实验,证明了经简单处理后语间信号波形比原始波形简单,直观,计算频域特征和自相关特征等简单方便,实时性好,并有望从中进一步发现新的语音特征提取方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号