首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

2.
矢量量化技术和隐马尔柯夫模型方法在韵母识别中的应用   总被引:2,自引:0,他引:2  
本文应用矢量量化技术(Vector Quantization)和隐马尔柯夫模型方法(Hidden Markov Model)为一个全字汇量的孤立字普通话语音识别系统设计了韵母识别子系统.该系统由韵母信号析取器、滤波器阵列特征分析器、矢量量化器、预识别器、隐马尔柯夫模型匹配器和决策器组成.根据对汉语中1172个不同音节的语音信号测试结果,决策器输出的准确率(即系统的最后识别准确率)为89.5%,而前两个估计的识别准确率则达到97.2%.系统的训练包括生成矢量量化器的码字和为每一个韵母建立隐马尔柯夫模型,改进了Linde 等人提出的码字生成算法,提出了一个得到隐马尔柯夫模型参数的系统化方法.  相似文献   

3.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

4.
本文提出了一种基于模糊矢量量化(FVQ)和隐马尔柯夫模型(HMM)模糊训练的语音识别新方法.利用模糊矢量量化替代了传统方法中的矢量量化,语音特征参数序列经过模糊矢量量化后得到模糊观察符号序列.在此基础上提取出一个反映训练样本总体随机变化特性的模糊观察符号序列,然后用它对该音节的HMM进行一次性全局训练,训练算法经传统的Baum-Welch算法改进得到.经十个汉语数字的对比实验表明,该训练算法大大提高了系统的训练速度,模糊矢量量化与传统的矢量量化相比,不仅提高了隐马尔柯夫模型的鲁棒性,进而提高了系统的识别率,而且在语音训练数据不充足的情况下,也能得到很好的识别性能.  相似文献   

5.
用矢量量化和隐马尔可夫模型实现英语话句的识别   总被引:3,自引:0,他引:3  
描述用矢量量化和隐马尔可夫模型实现的英语话句识别系统.采用逐级优化分裂聚类分析获取矢量量化的码本,用平均振幅函数及过零率进行单词切分,用线性预测参数的似然比距离衡量两个矢量差异的大小,使用一阶从左至右的隐马尔可夫模型,用多个输出符号序列进行训练,用Viterbi算法进行识别.用文法分析技术辅助实行识别结果的判定.  相似文献   

6.
对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率.  相似文献   

7.
应用模糊神经网络反演大坝弹性模量   总被引:7,自引:0,他引:7       下载免费PDF全文
根据大坝实测位移资料,应用模糊神经网络反演坝体和坝基的弹性模量,其中两种水位下的位移的水压发量差值作为网络输入矢量,待求的坝体和坝基的弹性模量作为网络输出矢量,计算结果表明,应用模糊神经网络反演大坝弹性模量,具有精度高、速度快的优点。  相似文献   

8.
基于各类语音模型的语音识别系统中,未知语音与参考模板的匹配度处在临界状态时,系统容易发生误识别。针对这类问题,本文提出了一种聚焦式模糊分段算法,对语音特征矢量进行模糊分段量化;并将其应用于DTW语音系统中,对语音信号进行训练和匹配。实验证明:该算法能够有效提高系统的识别精度,并降低模糊分界内的误识别率。  相似文献   

9.
自调整模糊控制器在异步电机矢量控制系统中的应用   总被引:11,自引:0,他引:11  
针对异步电机矢量控制系统因电机参数变化和负载波动等因素性能变差的问题 ,设计了一种二维自调整模糊控制器作为滑差频率式异步电机矢量控制系统的速度调节器。这种自调整模糊控制器可以根据输入变量的大小调整模糊控制器的量化因子、比例因子和两个输入变量的权重 ,从而自动调整模糊控制规则。仿真和实验结果说明 ,具有自调整模糊控制器的异步电机矢量控制系统不仅动态和稳态性能都得到提高 ,而且具有较强的鲁棒性。  相似文献   

10.
BP人工神经元网络与汉语语音的音节切分   总被引:1,自引:0,他引:1  
提出了一种基于BP人工神经元网络的汉语语音声韵母分割算法.计算机模拟结果表明,该算法只需对极少数典型音节进行简单训练,便可实现汉语语音的声韵母分割,且分割精度远大于传统算法所能获得的精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号