首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 828 毫秒
1.
文章研究了两种不同语音识别算法—动态时间伸缩算法(DTW)和隐马尔可夫模型(HMM),并在模式匹配原理的基础上,设计、实现了在Matlab环境中,应用DTW识别法及HMM识别法的孤立字语音识别实验平台。  相似文献   

2.
基于人工神经网络的多媒体语音特征挖掘   总被引:1,自引:0,他引:1  
提出了一种基于人工神经网络的聋儿语音训练识别的多媒体特征挖掘技术,构造了邻域三层神经元合作竞争的动态运行为神经元模型,实验选取了动态递减函数、动态最小覆盖矩阵和动态确定阈值形成的SOLA挖掘算法,以及聚类分布的网络图技术,解决了聋语音训练系统中基本语音识别的难题。  相似文献   

3.
基于离散隐马尔科夫模型的语音识别技术   总被引:1,自引:0,他引:1  
概述语音识别技术的基本原理,对当前三种主要识别技术--动态时间规整技术、隐含马尔科夫模型技术及人工神经网络技术进行比较,重点介绍基于离散隐马尔科夫模型(DHMM)的语音识别系统的实现.  相似文献   

4.
提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子进行线性伸缩匹配,同时在句子层次进行动态规划获得最优路径。该算法更有效地利用了哼唱语音的分段特性并克服了动态规划在长路径搜索时可能丢失全局最优路径的缺点。在含5 223首M ID I的数据库上同等条件下该算法正确率分别比线性伸缩、动态规划及递归匹配方法提高10.5%、6.0%和2.8%。该算法具有更高的准确率和更小的时间复杂度,是一种更有效的精确匹配算法。  相似文献   

5.
语音识别是当今信息领域标志性技术,是最具发展前景的综合性学科之一。该文用语音识别系统模式匹配原理,对比分析了模板匹配算法DTW与人工神经网络中的ANN算法在语音识别据识中的应用;提出了一种基于单个神经元的拒识算法,实验结果表明该算法能达到较高的拒识率。  相似文献   

6.
一种改进的DTW语音识别系统   总被引:1,自引:0,他引:1  
苏昊  王民  李宝 《中国西部科技》2011,10(1):38-39,94
动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。  相似文献   

7.
本文对基于人工神经网络的语音识别技术进行了详细分析、讨论,阐述了人工神经网络对语音识别技术的推动作用。  相似文献   

8.
通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。  相似文献   

9.
面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。  相似文献   

10.
改进了传统的动态时间弯曲算法结构,将其应用到实时语音辨识系统中,并在计算机上进行了仿真。实验结果表明采用改进后的DTW算法有效地降低了待处理数据量和识别时间,提高了系统的运行速度。随着待识别语音信号数量的增多,该算法优势更加明显。  相似文献   

11.
本文从最大后验概率估值的角度讨论了语音信号识别中的时间规整问题,讨论了由此导出的方法与常用的动态时间规整方法之间的关系,并对这一方法的普遍意义及其在语音识别中的应用提出了看法。  相似文献   

12.
一种时间规整算法在神经网络语音识别中的应用   总被引:6,自引:0,他引:6  
提出一种新的网络结构,这种网络能够很好地解决神经网络语音识别中的时间规整问题。该网络从输入语音信号的特征矢量序列中提取一组固定数目的特征矢量,然后将这组特征矢量馈入神经网络分类器进行识别。和其他的神经网络语音识别方法相比较,用这种网络进行前端处理,可以缩短后端神经网络分类器的训练和识别时间,简化分类器的网络结构并保持较高的识别率。  相似文献   

13.
语音信号时间动态规正新方法   总被引:5,自引:0,他引:5  
利用函数逼近原理,提出了一种语音信号时间动态规正的新方法,并由此导出了可用于神经网络语音识别的新特征。重点讨论了时间动态规正的原理、新特征的提取方法和性质。实验及理论分析表明,新特征对于神经网络语音识别及语音压缩具有很好的效果。  相似文献   

14.
在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高.  相似文献   

15.
调制域谱减法用于鲁棒性语音识别   总被引:2,自引:2,他引:0  
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。  相似文献   

16.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

17.
连续语音识别系统中测度计算的快速算法研究   总被引:3,自引:0,他引:3  
随着语音识别技术的迅速发展,其实用化前景已经逐步明朗起来,而语音识别系统实时化是首先必须解决的问题。由于测度计算占用了整个识别系统中绝大部分的计算量,所以降低测度计算的复杂度是系统实时化的首要问题。在对此加以分析的基础上,根据两级识别的思想,改进了基于决策树的方法,更进一步提出了基于Cholesky分解的M对角线方法,介绍了这些方法的原理和实现,并在大量实验的基础上对结果进行了比较和分析,说明了方法的实用效果。改进后的系统在识别率稍有下降的情况下使识别时间大为减少。  相似文献   

18.
语音情感特征提取和识别的研究与实现   总被引:9,自引:0,他引:9  
针对语音情感识别的实时性与可用性问题,提出了利用汉明窗提取语音信号中情感特征的方法,从说话者中采集带有快乐、愤怒、惊奇、悲伤情感的语句,并从语句中提取8个情感特征参数.同时提出采用贡献分析法确定情感特征参数的权值,利用加权欧氏距离模板匹配识别语音情感.实验表明该方法识别率有提高,更适合实时识别的应用。  相似文献   

19.
目前基于纯净语音信号的语音识别系统和说话人识别系统都已达到了很高的识别率,但是当信号中含有噪声,特别是含有语音噪声时,识别率就会大大降低.解决这一问题的关键是实现语音与噪声的自动分离.考虑到语音信号的非平稳特性,把时域去相关的思想推广到频域,提出了频域去相关算法,实验结果显示了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号