首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
基于非特定发音人拉祜语孤立词语音识别研究   总被引:3,自引:2,他引:1  
选用200个拉祜语常用词,以词为识别单元,利用语音识别工具箱HTK开展非特定人拉祜语孤立词的语音识别研究.研究发现:特定发音人的识别率比较稳定,针对非特定发音孤立词,通过增加模型的混合高斯数目,其识别率得到显著提高,使得识别正确率保持在99%以内,为拉祜语孤立词识别提供了有效方法.  相似文献   

2.
统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。  相似文献   

3.
该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。  相似文献   

4.
【目的】针对传统声学特征所含情感信息不足的问题,提出一种基于多任务学习的深度特征提取模型优化声学特征,所提声学深度特征既能更好表征自身又拥有更多情感信息。【方法】基于声学特征与语谱图特征之间的互补性,首先通过卷积神经网络提取语谱图特征,然后使用多核主成分分析方法对这两个特征进行特征融合降维,所得融合特征可有效提升系统识别性能。【结果】在EMODB语音库与CASIA语音库上进行实验验证,当采用DNN分类器时,声学深度特征与语谱图特征的多核融合特征取得最高识别率为92.71%、88.25%,相比直接拼接特征,识别率分别提升2.43%、2.83%.  相似文献   

5.
为了改善英语自动发音评测中所使用的声学模型,提高评测的准确性,分别采用区分性训练中的最大互信息(MMI)和最小音素错误(MPE)算法训练出隐含Markov声学模型,并采用最大似然线性回归(MLLR)对模型进行非母语说话人的口音自适应,最后应用到英语自动发音评测系统中。实验结果表明:分别对MMI和MPE方法训练所得模型作自适应后的机器总分与人工评分之间的相关度在说话人层次上分别提高了3.3%和5.2%,证明了在英语发音评价中区分性模型的实用性和有效性。  相似文献   

6.
超立方体多计算机上数据并行算法性能研究   总被引:1,自引:0,他引:1  
讨论了超立方体多计算机上的数据并行算法,着重分析通信参数对算法性能的影响。提出了一个计算模型,并以并行归并算法为例,对数据元素数目和处理机数目等设计参数进行性能评价。  相似文献   

7.
正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)、感知线性预测分析系数(perceptual linear predictive analysis,PLP)和Mel滤波器组系数(Mel filter bank,FBank)3种声学特征参数,并利用网格联合技术整合3种声学特征所得的候选网格。实验结果表明:DNN-HMM模型比GMM-HMM实现了更高检测正确率。针对不同发音偏误趋势,3种声学特征有不同表现,联合系统取得最高性能,最终性能为:错误拒绝率5.5%,错误接受率35.6%,检测正确率88.6%。  相似文献   

8.
为了提升计算机辅助发音训练(CAPT)系统中发音偏误趋势(PET)的检测效果,确保反馈信息的准确性与有效性,提出一种基于对数似然比的发音特征方法。该方法将多个基于深度神经网络的发音特征提取器用于生成帧级别的对数似然比,然后将对数似然比组成的发音特征用于PET的检测,为学习者提供发音位置和发音方法的正音信息。实验结果表明,发音特征对PET的检测效果优于常用声学特征(MFCC,PLP和f Bank),当发音特征与MFCC特征相结合时,可以进一步提升性能,达到错误接受率为5.0%,错误拒绝率为30.8%,诊断正确率为89.8%的检测效果。  相似文献   

9.
基于小数据量的方言普通话语音识别声学建模   总被引:1,自引:0,他引:1  
为在少量数据情况下显著提高方言普通话的识别率,针对标准普通话和方言普通话之间发音差异是连续变化的特点,在少量方言普通话的基础上,提出了基于距离度量的识别基元扩展方法,并将扩展基元与状态相关的基于基元的模型归并方法相结合.采用1 h的上海普通话数据作为开发集,用本方法,使音节错误率降低了17.3%. 另外与自适应方法的结合使用,还可以将音节错误率再降低6.6%, 这比单纯应用自适应方法错误率多降低了5.4%.  相似文献   

10.
为提高人体运动跟踪系统的性能,将多源传感器数据进行融合。文章针对惯性传感器和Kinect体感传感器,给出了基于可信度、人体骨骼模型生理约束、运动约束和滤波误差的质量评价方法,设计了多传感器融合情况下的质量评价函数,提出了一种基于质量评价函数的运动跟踪数据融合算法。在滑动窗口内基于各传感器连续可信帧进行度量,作为数据融合时的质量因子。实验表明当Kinect或惯性传感器的数据出现较大误差时,通过融合算法提高了系统鲁棒性。  相似文献   

11.
为减轻灌浆套筒装配式桥墩的地震损伤,尽快恢复震后桥墩使用功能,在常规灌浆套筒装配式桥墩的基础上,提出一种在桥墩墩底连接处设置可更换阻尼器的改进方案。采用数值模拟方法对常规灌浆套筒装配式桥墩和附加阻尼器灌浆套筒装配式桥墩进行对比分析,研究附加可更换阻尼器装配式桥墩的抗震性能。结果表明,灌浆套筒装配式桥墩安装可更换阻尼器后,水平承载力提高了10%,累积耗能提高了27%,桥墩墩底连接处的损伤减轻,其中最大残余位移减少了19%,桥墩抗震性能提高,对桥梁韧性抗震研究具有一定参考意义。  相似文献   

12.
带可替换耗能连接的偏心支撑钢框架的框架梁由耗能连接和框架梁两部分构成,耗能连接具有震后替换方便、造价低等特点.采用Abaqus软件对10榀带可替换耗能连接的偏心支撑钢框架进行数值模拟.模拟中对该偏心支撑钢框架施加单调荷载,分析不同参数下可替换耗能连接及整个框架的承载能力、变形能力等力学性能.分析结果表明:带可替换耗能连接的偏心支撑钢框架能够很好地将结构的塑性变形集中在此耗能连接上,因此带有这种耗能连接的偏心支撑钢框架具有较高的承载力、延性、初始刚度,并且应力和应变分布较均匀.  相似文献   

13.
鉴于传统连梁在震时破坏后修复比较困难,近年来部分学者研究在连梁的跨中设置可更换耗能部件,使其在中震或大震时耗能,震后便于修复更换.本文基于ABAQUS有限元程序,建立一片带可更换连梁的大比例双肢剪力墙试件的精细有限元模型,阐述了其材料本构模型和建模过程,对其进行精细仿真分析.计算与试验结果均表明,可更换连梁能够将破坏位置集中在保险丝,而且模拟的初始刚度和峰值承载力与试验结果比较接近,模型可较好地预测试件各部分的屈服顺序,该模拟方法对类似联肢剪力墙结构的数值模拟具有较好的借鉴意义.  相似文献   

14.
交替运用结构有限元法与声学边界元法,对齿轮结构振动声学特性数值计算问题进行了研究。建立了齿轮结构三维有限元分析模型,通过频响分析计算,获得结构振动响应特性参数。以齿轮结构频响分析计算结果为声学边界条件,建立了齿轮三维边界元声学分析模型,并采用直接边界元法,对齿轮近场声学特性进行了计算,得到齿轮结构在简谐激励下的声辐射声压,为降低噪声提供理论依据。计算结果表明,所建立的振动和声辐射模型及算法是有效的。  相似文献   

15.
带可更换连梁的新型联肢剪力墙的设计与分析   总被引:1,自引:0,他引:1  
提出了一种新型可更换连梁,在连梁中部设置耗能部件,地震时塑形变形集中在耗能部件(可更换段),震后方便更换,非更换段在地震作用下不屈服.介绍了可更换连梁的设计方法,并对带有可更换连梁的新型联肢剪力墙和传统联肢剪力墙进行了时程分析和对比.分析结果表明:在小震作用下,可更换连梁没有屈服,对墙肢提供约束,在中震和大震作用下,可更换连梁屈服,其塑形变形集中在可更换段,非更换段保持弹性;与传统联肢剪力墙相比,新型联肢剪力墙的抗震性能显著改善.最后,提出了新型连梁变形与层间位移角的关系,为可更换段的设计提供依据.  相似文献   

16.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

17.
在冷暗物质晕等级成团宇宙学模型中,伴随着暗物质晕并合,星系中心黑洞也断地并合和增长.于展Press-Schechter公式(EPS)我们编写了一自适应时间长Monte Carlo程序,重构了表征暗物质晕等级成团并合树.在成功地建立了黑洞和暗物质晕宇宙学演化模型后,我们通过引入直接吸积(包标准薄盘吸积和磁流体力学吸积)和随吸积两类黑洞吸积模式,论了黑洞自旋和质量宇宙学演化.通过与观测到AGN光度函数比较,我们发现黑洞通过磁流体力学吸积模式增长,与观测符合最好.于以上理论框架,我们还研究了双大质量黑洞演化,发现双黑洞通过共转气体吸积盘吸积对双黑洞质量比分存在显著影响.  相似文献   

18.
研究了基于声发射方法的Logistic回归模型的铣削过程中刀具可靠性评估.从试验数据分析得出铣削过程的声发射信号和切削力信号,与刀具磨损量具有较强线性相关性,是刀具性能退化监测的有效方法.运用小波包分解提取声发射信号的能量,选取与刀具磨损相关的频带能量作为特征指标.将应用切削力和声发射两种监测方法建立的可靠性模型与仅用声发射监测的可靠性模型进行对比发现,两个模型都较为准确地评估出了刀具在铣削过程中的可靠度指标,而基于声发射可靠性评估模型更为方便,在实际切削力不易获得的情况下,运用此方法能够进行刀具的可靠性评估与寿命预测.  相似文献   

19.
为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母两部分建立的半音节隐含Markov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。  相似文献   

20.
声学多孔材料的孔结构优化   总被引:1,自引:0,他引:1  
介绍了一种基于微结构的声学模型,可用来对多孔材料的微组织结构进行优化,从而使多孔材料具备最佳的声学性能.该模型是一种适用于低雷诺数的非稳态线性声学模型,主要微结构考虑平行排列的柱形杆件或圆球列阵,包括3个子模型:①声波传播方向平行于圆柱形杆件的子模型;②声波传播方向垂直于圆柱形杆件的子模型;③声波在圆球列阵中传播和吸收的子模型.前2个子模型通过考虑多边形周期边界条件的影响,计及了相邻圆柱形杆件间的交互作用.由于模型是线性的,因此可以结合起来描述任意角度入射声波的传播特性.第3个子模型可用于描述胞状多孔材料中节点处的情形.文中利用这3个子模型来扩大吸声材料的设计空间,根据不同用途所要求的声学特性计算最优的胞元结构,并对这种模型的应用领域进行了分析讨论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号