首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 250 毫秒
1.
话者识别系统中语音特征参数的研究与仿真   总被引:18,自引:0,他引:18  
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一.研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响.通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。  相似文献   

2.
提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能.实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。  相似文献   

3.
从雷达目标识别系统的实际需求和研制特点出发,借鉴模块化系统设计思想的优点,提出了以层为基础的分析方法,设计了识别系统软件的层式结构。基于该软件结构成功研制了适应于不同雷达的目标识别系统,并投入使用。理论分析和实际应用表明,层式结构可以合理组织不同的数据处理方法,适合于目标识别系统的研制开发,为创建通用的识别系统开发、测试及应用平台提供了体系结构和实现途径。  相似文献   

4.
文本无关说话人识别的一个关键问题是寻求一种有效的说话人个性特征量.利用模糊向量内积理论,提出了一种新的物理量:连续特征矢量模糊相关度(CFVFC),以反映相邻特征矢量问的相关性,进而突出说话人的个性特征,并在此基础上研究了新的矢量量化(VQ)说话人识别方法.实验表明CFVFC是一种有效的识别信息,对于干净语音的说话人辨认,可以提高识别系统的识别率;在加噪声情况下,能增强识别系统的鲁棒性.  相似文献   

5.
提出了一种用于语音识别的鲁棒特征提取算法,这种算法基于最小方差无失真响应(MVDR)谱估计技术,它在Mel频率尺度上估计MVDR谱,并对得到的MVDR谱进行调制谱滤波,然后提取其倒谱系数作为特征参数。使用这种算法设计了一个抗噪孤立词语音识别系统,在汽车噪声,人群噪声和高斯白噪声三种噪声环境下,与传统算法按多种信噪比做了对比实验。实验结果表明该系统在这三种噪声环境下的识别率均得到了不同程度的提高。  相似文献   

6.
研究了用C语言对孤立词语音识别算法进行了仿真,对每个算法的效率、时间复杂性、空间复杂性进行深入的讨论和分析,对语音识别算法FPGA的实现以及语音识别SoC的研究和设计提供了一个C语言行为级仿真设计原型。  相似文献   

7.
将语音技术应用于虚拟环境中,实现了一种基于语音交互的虚拟场景漫游系统,该系统创建了基于语音交互通道,允许用户使用语音命令控制场景漫游,可快速实现自然的人机交互.实验结果表明:该系统方便了人机交互,给用户带来了更加真实的体验.  相似文献   

8.
基于HMM和小波网络模型的抗噪语音识别方法   总被引:6,自引:1,他引:6  
提出一种隐马尔可夫模型(HMM)和小波神经网络(WNN)混合模型的抗噪语音识别方法。该方法首先利用HMM对语音信号进行时序建模,并计算出待识语音对HMM的输出概率评分,再将此概率评分作为小波神经网络的输入,获取分类识别信息,最后根据混合模型的识别算法作出识别决策。实验结果表明,在噪声环境下,由于HMM的强时序建模能力和小波神经网络的强模式分类能力,该混合模型比单纯HMM具有更强的噪声鲁棒性,明显改善了语音识别系统的性能。  相似文献   

9.
本文设计了一种混合神经网络矢量量化编码方法,利用Kohonen网络的自组织聚类功能设计矢量量化器码书,实现矢量量化,用三层BP网络完成码字的信道符号编码.该神经网络矢量量化编码器能够并行处理输入矢量,速度快,效率高,适用于语音和图像数据压缩.  相似文献   

10.
基于神经网络的辐射源识别系统设计   总被引:7,自引:1,他引:7  
针对当前辐射源识别系统中存在的问题,提出了一种结合神经网络技术的辐射源识别新方法。该方法可以快速高效的识别各类辐射源,既有基于统计分析的辐射源识别系统的快速性,又有基于专家系统的辐射源识别系统的自适应性和准确性。实际仿真结果表明该方法是有效的,尤其对于参数不全、参数畸变的雷达辐射源,其识别率和识别置信度都有较大提高。在本文方法的基础上,设计出一种结构简单、快速有效的辐射源识别系统,具有一定的推广价值。  相似文献   

11.
三字词声调的模糊识别方法   总被引:3,自引:0,他引:3  
汉语是音节声调语言,在连续语音合成和识别中加入声调信息有重要意义。对三字词声调按首字、中字和尾字音节进行特征提取,并结合声调的特点选取相应的隶属函数进行模糊化处理,综合运用了决策树分类、模糊决策和基于知识的规则推理等技术,提出了一种模糊决策树声调识别方法,具有简便、实时性、顽健性和识别率高等特点。此方法对孤立字和二字词同样有效,并可应用于汉语连续语音。  相似文献   

12.
本文介绍一种直接使用微机上的扬声器而不需任何D/A转换器的汉语语音合成系统。该系统采用波形编辑合成方式,在普通的微机上无需添加或改动任何硬件即可合成出可懂度和清晰度都较好的汉语语音。  相似文献   

13.
针对情绪机器人的自动语音情感识别在不同类型人群之间的语音特征差异,提出了一种用于语音情感识别的随机森林,结合卷积特征学习对情绪化社交机器人系统进行了初步的仿真实验,结果表明情绪机器人能够实时跟踪兴奋、愤怒、哀伤、高兴、惊讶、恐惧、中性7种基本情绪。通过采用非个性化的语音情感特征,补充了原始的个性化语音情感特征,实现了对通用性情感和特殊性情感的提取,对于情感机器人来说,利用这些指标在模拟实验和应用实验中都具有一定的应用前景。  相似文献   

14.
通过对hiddenmarkovmodel(HMM)和segmentmodel(SM)模型的简要分析,指出了它们的某些缺陷,提出了一种新的基于汉字音节整体的Melfrequencycepstrumcoefficients(MFCC)向量模型。该模型能够根据各个音节的持续时间动态地调整帧长,进而比较完整地表现了语音时频信息的演化过程。实验数据显示,在同样的测试条件下,对于上下文相同的同性语音,帧数固定比帧长固定的识别率改善3.0%以上。还分析了几个主要影响汉字语音识别率的参数。研究表明,参数设置是否得当对于识别率有一定的影响。  相似文献   

15.
林遂芳  张海英  潘永湘 《系统仿真学报》2005,17(8):1959-1961,1965
提出一种基于动态时间规整(DTW)和学习矢量量化(LVQ)神经网络的语音识别方法。该方法用动态时间规整算法先对语音信号进行时间规整,然后通过学习矢量量化神经网络进行语音的分类识别。首先介绍利用动态时间规整和学习矢量量化进行语音识别的基本方法,然后给出DTW/LVQ混合模型的系统结构和学习算法,最后给出三种语音识别算法的实验结果。大量实验表明,混合模型的识别率,皆明显高于单一的动态时间规整和学习矢量量化的识别率。  相似文献   

16.
汉语自动分词的研究现状与困难   总被引:31,自引:0,他引:31  
张春霞  郝天永 《系统仿真学报》2005,17(1):138-143,147
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词仍然是中文信息处理的瓶颈问题。基于对汉语自动分词研究的现状分析,构建了自动分词的形式化模型,论述了影响分词的诸多因素,分析了分词中存在的两个最大困难及其解决方法。最后指出了目前分词研究中尤其是在分词评测方面存在的问题以及未来的研究工作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号