首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
针对汉语语音文档检索中最优识别单元和检索单元不一致的问题,提出一种基于子词(position specific posterior lattices, PSPL)的语音文档索引方法;该方法以词为识别单元对语音文档进行解码,得到PSPL;然后对PSPL进行子词切分,并根据子词弧与原始词弧的后验概率关系,将PSPL转换为相应的子词PSPL,以子词PSPL为索引进行查询项检索. 实验结果表明,所提出的方法在利用丰富语言信息的同时,解决了词解码器存在的边界分割不正确的问题,检索性能明显优于目前普遍使用的识别单元和检索单元均为词的PSPL索引方法.  相似文献   

2.
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检...  相似文献   

3.
隐马氏模型在语音识别和生物信息学中有重要的应用. 本文研究二阶隐马氏模型(HMM2)的基本算法,利用归一化和递推原理,改进模型的前向-后向算法及Baum-Welch训练算法并给予证明,使得该算法更容易理解和机器实现,并保证数值稳定性. 将HMM2应用到miRNA靶基因预测的后期过滤处理中取得了较好的结果.  相似文献   

4.
对生活中涌现的海量语音数据需要进行快速而准确的检索. 提出一种基于动态匹配词格检索的关键词检测方法,应用TRAP 特征和多层感知器创建更为精准的音素Lattice. 在索引阶段执行一个改进的维特比算法遍历Lattice 来创建一个固定长度的音素序列数据库,在检索阶段应用最小编辑距离作为置信度来实现关键词的检
出. 实验结果表明,该方法相比应用MFCC 和PLP 特征的基线系统具有一定的优势,召回率可提升5% 左右.  相似文献   

5.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法.  相似文献   

6.
自组织特征映射神经网络用于语音识别的研究   总被引:4,自引:0,他引:4  
该文提出了一种优化的自组织学习算法。基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法,组成了一种新的语音识别系统,该系统采用SOM网络作为矢量量化器。SOM网络经过优化的自组织学习算法训练后,再用K均值聚类算法对其进行调整。实验结果表明,该文提出的语音识别方法确实能提高系统的识别率。  相似文献   

7.
上下文相关汉语自动分词及词法预处理算法   总被引:8,自引:0,他引:8  
提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧,使自动分词的准确率达到了99%以上.同时,该算法还对汉语中意义冗余的重叠词和可以与中心词离合的虚词等进行了词法预处理,从而一方面可以减少系统词典的收词量,另一方面方便于对句子的分析处理.  相似文献   

8.
研究和推导了二阶隐马尔可夫模型(HMM2)的学习算法,其中包括前向、后向变量的定义与计算,Viter-bi算法,以及Baum-Welch算法.同时还研究了HMM2与一阶隐马尔可夫模型(HMM1)之间的关系,发现对任给的HMM2,总存在一个HMM1与之等价,提出了HMM2与HMM1的等价性定理,并给出了定理的证明.  相似文献   

9.
阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性.  相似文献   

10.
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键词识别率.  相似文献   

11.
图像分割技术在PCB自动光学检测中应用广泛。 K-means聚类算法简单有效,能实现PCB灰度图像的自动分割。然而,随机选取的初始聚类中心易导致K-means算法最终找到的是局部最优值,对PCB图像分割效果有一定影响。引入PSO算法的群智能搜索策略,提出一种新的寻找聚类中心的算法。实验表明,在PCB图像分割中使用该算法可防止陷入局部最优值。  相似文献   

12.
一种改进的K means聚类彩色图像分割方法   总被引:1,自引:1,他引:0  
图像分割是从图像处理到图像分析的关键步骤.图像分割的目的是将图像分割为多个互不重叠且又各具特性的区域,主要应用于图像压缩、目标提取、模式识别等.以往的图像分割技术主要应用于灰度图像,随着计算机技术的进步,彩色图像分割逐渐受到关注.该文在前人对彩色图像分割问题的大量研究成果基础上,提出了一种将K-means聚类、蚁群算法以及分水岭算法相结合的分割方法.本方法有效的克服了聚类数目必须依据先验知识提前设定、最初的聚类中心是随机选取的、聚类的效果好坏依赖于距离判定公式的缺陷.  相似文献   

13.
为了增强图像分割技术的准确性并优化图像分割技术的细节分割效果,提出了一种基于属性加权朴素贝叶斯算法的OTSU图像分割方法。将OTSU算法中依据图像灰度特征选取的图像中的前景和背景通过属性加权朴素贝叶斯算法进行分类处理,计算图像中前景和背景的概率,训练该模型以获得最佳阈值进行图像分割处理,优化图像分割的效果。利用无人机航拍采集的图像数据进行实验,结果显示基于属性加权朴素贝叶斯算法的OTSU图像分割方法优化了图像的分割效果,较完整地展示了分割后的图像细节,具有较好的应用价值。  相似文献   

14.
运动目标分割是交通事件检测的基础,分割的质量直接影响道路事件检测的准确性.依次研究了平均法、连续帧差法、混合高斯建模及阴影消除等算法,并综合应用于道路监控视频的运动目标分割的各阶段.针对连续帧差法和混合高斯建模算法进行了仿真实验,结果表明,混合高斯建模算法更适合做运动目标的分割,但由此得到的前景运动目标常受到阴影干扰,所以在混合高斯建模算法中,加入了消除运动目标阴影的算法.通过实验仿真表明,优化的该算法能够更加清晰地分割出前景运动目标图像.  相似文献   

15.
浮选中泡沫图像的分割算法   总被引:1,自引:0,他引:1  
描述了浮选中泡沫图像的分割算法,根据测定泡沫的尺寸、形状和纹理分割泡沫图像。因这些泡沫图像的图案和性质千差万别,用现有的分割算法是很困难的,我们修改并结合不同的现有图像分割算法,形成了一种分割泡沫图像的新算法。在这种算法中,使用并修改了阈值算法,自动地检测泡沫的种子点或种子区域,然后使用形态学技术产生泡沫区域。最后,基于泡沫形状分析,合并过于分割的泡沫部分为一泡沫。文中列举了分割三个泡沫图像的结果,它表明这种分割泡沫图像的方法是合理的。  相似文献   

16.
针对飞机驾驶舱话音记录器(CVR)中存在轻微时变特性和信号有大量近零值的情况,提出一种基于信号样本动态分段的在线盲分离算法.应用独立分量分析的在线算法对CVR混合信号进行动态分段处理,再通过快速的FastICA算法进行精确化求解.为了使估计器获得最佳性能,适当调整分离矩阵各行权值.仿真结果表明,该算法可有效地将CVR混合信号中独立的声音信号分离出来,分离效果优良.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号