首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
语音识别中基于两层词法树的跨词搜索算法   总被引:1,自引:0,他引:1  
为了在连续语音识别过程中充分并且高效地使用上下文相关声学模型,提出了一种新颖的基于两层词法树的跨词搜索算法.采用两层词法树来表示搜索空间,解决了现有单层词法树的规模爆炸问题,使其有能力在词边界搜索中高效地使用上下文相关声学模型进行匹配,充分发挥上下文相关声学模型较好地描述协同发音现象的能力.实验结果表明,与词内搜索算法相比误识率平均下降60%,搜索时间达到实时,证明基于两层词法树的跨词搜索算法具有很好的识别性能.  相似文献   

2.
在大词表孤立词语音识别中,Viterbi搜索是时间消耗的主要因素。为改善基线系统性能,根据汉语孤立词识别的特点,提出了一种基于音节切分的束搜索算法,在音节层和词条层进行剪枝。该算法不增加内存开销。实验结果表明:在词表规模为10 000时,该算法以0.23%的识别率下降率为代价,将Viterbi搜索的时间消耗降低为基线系统的26.73%;相对于小词表,该算法在大词表情况下对系统性能的改善尤为明显。  相似文献   

3.
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。  相似文献   

4.
基于属性相关性分析的子空间搜索算法   总被引:1,自引:0,他引:1  
在高维子空间聚类算法中,子空间识别质量有助于改善算法性能.提出了基于属性相关性分析的子空间搜索算法,利用相对熵去除冗余属性,根据联合基尼值判断两两非冗余属性之间的相关性,形成属性关系图,并在此属性关系图上搜索相似兴趣子空间.实验结果表明算法参数容易设置,有较好的子空间识别能力.  相似文献   

5.
在语音识别应用中,如何提高识别的效率是一个重要的研究方向,尤其在大词表的识别中,巨大的搜索空间带来了很大的计算代价。先介绍了语音识别系统的三个组成部分即特征提取、声音模型及语言模型;然后重点讨论了语音识别中几种常用的搜索策略,最后指出了搜索策略进一步研究的方向。  相似文献   

6.
为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜索算法。实验结果表明,尽管单步搜索的替代错误率高于双步搜索,但单步搜索的插入和删除错误率都比双步搜索要低,总体性能上单步搜索要好于双步搜索。同时,DDBHMM能较准确地利用了语音信号中的状态段长信息,采用DDBHMM的LVCSR系统比采用经典的齐次HMM的系统有更好的识别性能。  相似文献   

7.
自主足球机器人视觉系统结构及关键技术   总被引:1,自引:0,他引:1  
提出了自主足球机器人嵌入式多处理器体系结构以及视觉系统的构成框架.对单目视觉系统所涉及的关键技术进行了详细的分析和研究,其中包括图像分割、目标搜索算法、目标定位和机器人自定位技术.基于YUV颜色空间,对目标进行分割,并通过连通区合并来快速搜索目标,同时根据摄像机模型来确定目标的空间位置.实验表明分布式视觉体现结构能够实时准确地完成视觉处理任务.以上新算法可以快速鲁棒地搜索图像目标,并能较精确地确定目标的位置信息和机器人的自定位信息.  相似文献   

8.
针对低资源环境下由于标注训练数据不足、造成语音识别系统识别率急剧下降的问题,提出一种采用长短时记忆网络的低资源语音识别(LSTM-LRASR)方法。该方法采用长短时记忆网络构建声学模型,从特征提取、数据扩展及模型优化3个方面提高低资源语音识别性能。在特征提取方面,提取语言无关的高层稳健特征参数,降低声学模型对训练数据的依赖;在数据扩展方面,对已有标注数据进行语速扰动,对无标注数据进行自动识别,从而自动获取更多标注数据;在模型优化方面,通过序贯区分性训练技术提高模型对易混淆音素的区分能力,利用最小风险贝叶斯解码对多个系统进行融合,进一步提高识别性能。对OpenKWS16评测数据的实验结果表明,采用LSTMLRASR方法搭建的低资源语音识别系统的词错率相对基线系统下降了29.9%,所有查询词的查询项权重代价提升了60.3%。  相似文献   

9.
在高维子空间聚类算法中,子空间识别质量有助于改善算法性能。提出了基于属性相关性分析的子空间搜索算法,利用相对熵去除冗余属性,根据联合基尼值判断两两非冗余属性之间的相关性,形成属性关系图,并在此属性关系图上搜索相似兴趣子空间。实验结果表明算法参数容易设置,有较好的子空间识别能力。  相似文献   

10.
树-串句法统计翻译模型的正向解码算法   总被引:1,自引:0,他引:1  
针对树-串句法统计翻译模型提出了基于对数线性模型的正向解码算法.该解码算法直接对句法树进行操作,能够简单有效地利用句法信息.在对数线性模型中定义了翻译模型概率、语言模型概率和空译文罚分3个特征函数.采用集束搜索算法搜索假设空间,采用多栈存储假设,依据启发式策略进行假设打分.研究了假设的扩展方法,特别是树节点上不同操作对位置有效性的影响.在IWSLT2004数据集上进行了对比实验.实验结果表明正向解码算法译文的BLEU评分高于传统解码算法,说明正向解码算法能够克服传统解码算法的不足,有效利用句法结构信息,比传统解码算法更适合于树-串统计翻译模型.  相似文献   

11.
张剑  袁华强 《科学技术与工程》2013,13(19):5661-5663,5723
首次研究对使用非语言特征进行普通话广播新闻摘要的建模方法。评估语音特征、语言特征、结构特征等对抽取摘要的贡献。结果表明,仅用语音特征和结构特征这两大类与语言特征无关的特征,所建立的摘要模型,其摘要抽取性能良好,F-measure达到了0.565。此外,还发现,结构特征要优于语言特征;单独使用声学特征所训练出来的摘要模型,性能也达到了平均F-measure0.391。这些发现使得语音摘要的抽取性能在一定程度上不受语音识别准确率的限制。  相似文献   

12.
给出一种用于连续语音识别的词汇树搜索算法.这种方法基于启发搜索,分为音节层—树搜索、词层—树搜索两个过程.为在提高识别速度的同时不牺牲识别率,上述两个过程采用的是“有限宽度树搜索”.在音节层—树搜索中,根据Nbest算法确定允许扩展的有限个音节串.而在词层—树搜索中,根据已得到的允许扩展的音节串确定不同长度的“退回词路径”.这样,每一时刻的最大似然词串可由这些“退回词路径”来确定.这种算法的优点是在搜索不同长度的多音节词的同时,可以减少搜索计算开销和降低对存储空间的需求.  相似文献   

13.
生成过程中利用词汇特征(包含n-gram和词性信息)识别更多重点词汇内容,进一步提高摘要生成质量,提出了一种基于sequence-to-sequence(Seq2Seq)结构和attention机制的、融合了词汇特征的生成式摘要算法。算法的输入层将词性向量与词向量合并后作为编码器层的输入,编码器层由双向LSTM组成,上下文向量由编码器的输出和卷积神经网络提取的词汇特征向量构成。模型中的卷积神经网络层控制词汇信息,双向LSTM控制句子信息,解码器层使用单向LSTM为上下文向量解码并生成摘要。实验结果显示,在公开数据集和自采数据集上,融合词汇特征的摘要生成模型性能优于对比模型,在公开数据集上的ROUGE-1,ROUGE-2,ROUGE-L分数分别提升了0.024,0.033,0.030。因此,摘要的生成不仅与文章的语义、主题等特征相关,也与词汇特征相关,所提出的模型在融合关键信息的生成式摘要研究中具有一定的参考价值。  相似文献   

14.
复杂边坡非圆弧滑动面求解的类电磁机制算法   总被引:1,自引:0,他引:1  
针对复杂边坡非圆弧滑动面求解,结合双层搜索机制,将类电磁机制算法作为第1层搜索方法,将粒子数较少的类电磁机制算法或复合形法作为第2层搜索方法。研究结果表明:本文的2种算法与其他算法相比所得结果都比较接近,证明本文方法的有效性;左右交点位置对安全系数影响的敏感度于滑动面其他节点的低;复合形法作为第2层搜索方法,其计算精度比采用类电磁机制算法的略高,但迭代次数成倍增加;算例中可能存在若干条滑动面,安全系数相差很小,但滑动面位置有差别。  相似文献   

15.
激励轨迹的选取和优化是机器人动力学参数辨识的重要基础。为了提高机器人动力学参数的辨识精度,以SCARA机器人为研究对象,设计了基于双层自适应遗传算法的机器人激励轨迹优化方案。运用Newton-Euler法建立了机器人的动力学模型,并对机器人的动力学模型进行线性分离,得到了机器人的最小惯性参数集和对应的观测矩阵。分析机器人的参数辨识方程,确定了观测矩阵条件数最小的优化目标。针对传统遗传算法进行改进,提出了双层自适应机制,提升了算法的全局搜索能力和搜索效率。最后利用MATLAB和ADAMS进行联合仿真实验,使用递推最小二乘法计算机器人的最小惯性参数集。实验结果表明,使用改进的双层自适应遗传算法得到的激励轨迹可以保证机器人动力学参数的辨识精度。  相似文献   

16.
深度神经网络技术在汉语语音识别声学建模中的优化策略   总被引:1,自引:1,他引:0  
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。  相似文献   

17.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

18.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

19.
对规划识别中各种事件之间的关系进行了详尽的分析,根据分析结果,给出了具有预测功能的规划识别算法的知识图和规划识别算法,新的规划识别算法采用了自下而上和自上而下相结合生成解图的方法,对Kautz方法、基于规划知识图的方法和具有预测功能的规划识别算法在知识表示结构、搜索方法、冲突解决和求解结果等方面进行了对比和讨论.最后给出了实验结果,结果显示随着领域知识的增加识别算法所需的时间线性增加.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号