期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

冯罡陈宁《华东理工大学学报(自然科学版)》2023,(6):900-906

不同方言对相同字的发音往往有所不同，因此不同方言所包含音素的概率分布存在较大差异，这是方言差异性的重要体现。为了充分利用这一差异性，提出了基于音素后验概率图分析的方言识别模型，该模型引入Convolutional Block Attention Module(CBAM)的提取音素后验概率图关键特征，并利用Emphasized Channel Attention-Propagation and Aggregation in TDNN(ECAPA-TDNN)模型对其进行聚合和注意力池化得到句子级特征。为进一步提升类间距离，引入了Additive Angular Margin(AAM)损失。实验结果表明，该模型取得了比传统模型更高的分类准确率，并且以上改进均对准确率提升有所贡献。相似文献

2.

普通话发音质量评价算法改进研究

陈彩华《贵州师范大学学报(自然科学版)》2013,(6):95-99

隐马尔科夫模型的对数后验概率算法是计算机辅助语言学习系统中用来衡量考生发音质量的重要指标。但在普通话智能测试系统中,传统的后验概率算法与专家评分之间存在比较明显的差距。文章从普通话语音评价的主观标准出发,将普通话发音的语言学知识引入后验概率算法,重构算法的语音识别网络,同时从音素评分模型角度对现有的发音质量评价算法进行改进。相似文献

3.

区分性模型在英语自动发音评测中的应用

宋寅梁维谦《清华大学学报(自然科学版)》2010,(4)

为了改善英语自动发音评测中所使用的声学模型,提高评测的准确性,分别采用区分性训练中的最大互信息(MMI)和最小音素错误(MPE)算法训练出隐含Markov声学模型,并采用最大似然线性回归(MLLR)对模型进行非母语说话人的口音自适应,最后应用到英语自动发音评测系统中。实验结果表明:分别对MMI和MPE方法训练所得模型作自适应后的机器总分与人工评分之间的相关度在说话人层次上分别提高了3.3%和5.2%,证明了在英语发音评价中区分性模型的实用性和有效性。相似文献

4.

基于优化检测网络和MLP特征改进发音错误检测的方法

袁桦钱彦旻赵军红刘加《清华大学学报(自然科学版)》2012,(4):557-560,570

该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。相似文献

5.

基于分段动态时间规整和后验特征的中文语音模式发现

杨鹏谢磊陈虹洁《清华大学学报(自然科学版)》2013,(6):903-907

语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。相似文献

6.

汉语语音声学特征复合的研究

《云南大学学报(自然科学版)》2010,(Z1)

抽取短时声学特征参数如MFCC、PLP,使用高斯混合模型(GMM)估计特征参数对应音素的概率分布的隐马尔可夫模型(HMM)在大词汇连续语音识别系统(LVCSR)已取得了良好识别效果.但短时特征却不能有效反应连续帧之间的相关特性,因此运用神经网络多层感知器(MLP)产生两类差异特征用于描述该帧的音素后验概率,并将其与传统特征复合为新的特征参数流,利用新特征流对GMHMM模型进行重构.对比实验结果表明,采用该混合声学特征的LVCSR系统其错字率(CER)有了3%～7%的改善. 相似文献

7.

鉴别性最大后验概率线性回归说话人自适应研究

齐耀辉潘复平葛凤培颜永红《北京理工大学学报》2015,35(9):946-950

为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法. 将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性. 大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%. 相似文献

8.

一种新型的基于自适应遗传算法的粒子滤波算法

汪荣贵李孟敏吴昊沈法琳《中国科学技术大学学报》2011,41(2)

针对粒子滤波算法的退化以及粒子多样性减弱问题,设计了一种新的基于自适应遗传算法的粒子滤波算法.该算法首先用粒子的重要性权重来度量其适应度值,依据粒子的适应度值自适应确定粒子进行遗传操作的概率;然后对选出的粒子实施交叉、变异操作;最后重新评估粒子的适应度并进行状态估计.这种可自适应调节概率的遗传操作能对粒子进行移动,从而提升了粒子的多样性,并使得粒子都能分布在状态的后验概率密度分布的周围.实验结果表明,该算法可有效提高非线性系统状态的估计精度,尤其在系统状态发生突变时,可以得到较好的估计精度. 相似文献

9.

基于多音素类模型的文本无关短语音说话人识别

张陈昊郑方王琳琳《清华大学学报(自然科学版)》2013,(6):813-817

对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。相似文献

10.

音素隐马尔可夫模型的训练及分布共享

许晓斌林碧琴陈芳傅秋良袁保宗《北京交通大学学报(自然科学版)》1998,22(3):91

在语音识别中,为了得到分布共享的异音模型,先要知道与发音语境无关的音素模型．在本文中,给出一种用于训练与发音语境无关音素模型的方法,然后利用这种音素模型完成对异音模型的训练、以及对异音模型的输出分布的二值决策树聚类．实验结果表明,使用给出的方法,可以实现对与发音语境的无关音素模型,以及异音模型的可靠训练．相似文献

11.

适于嵌入式英语发音评价系统的英美音融合方法

梁维谦赵坤刘润生《清华大学学报(自然科学版)》2009,(Z1)

为提高发音质量评价性能,并压缩声学模型规模以适于嵌入式实现,提出一种英音和美音模型的融合方法。该方法基于声学距离和替代概率将声学模型划分为可替代模型、可融合模型和孤立模型。抛弃可替代模型,保留孤立模型,基于模型插值归并可融合模型。引入最小置信度和最大支持数控制参与归并模型的数目。实验结果表明:融合模型与单口音模型相比,说话人级别的相关性提高了14.1%;融合模型与混合模型的性能相近,G auss ian分量数目压缩了10.7%。本方法在保证发音质量评价性能的条件下,明显压缩了模型数量。相似文献

12.

基于后验概率的低密度奇偶校验码逆向识别方法研究

刘婉月包昕王达金野《北京大学学报(自然科学版)》2016,52(3):389-395

提出一种基于后验概率对数似然比(LLR)均值的逆向识别低密度奇偶校验码(LDPC)校验矩阵的方法。通过估计接收码字的信道增益以及信道噪声方差值, 得到后验概率对数似然比, 并依据后验概率对数似然比均值最大化原则, 成功实现对 LDPC 码校验矩阵的逆向识别。仿真结果表明, 在加性高斯白噪声信道条件下, 利用所提出的LDPC 码逆向识别技术, 接收方可准确无误地找到发送方使用的LDPC 码校验矩阵。相似文献

13.

声振法混凝土路面的声学特征检测研究

吴伟彭永恒朴泽星马荣《哈尔滨商业大学学报(自然科学版)》2005,21(4):509-512

为快速而又有效地进行无损检测(NDT),声振法研究了混凝土路面板声学特征变化的关系．利用有限元方法分析了有、无缺陷混凝土路面板的振动频率和振型,用语音数字信号处理技术,实验研究了试件中缺陷对声学特征的影响．理论和实验结果一致性很好,为用声学特征进行混凝土路面脱空等缺陷无损检测提供了理论和实验依据。相似文献

14.

第四系天然气藏储层物性参数测井解释模型

窦齐丰黄述旺彭仕宓王韶华《中国石油大学学报(自然科学版)》2002,26(6)

以柴达木盆地东部台南第四系松散未成岩生物气藏为例 ,研究建立该类储层物性参数测井解释模型的方法。主要包括 :(1)应用“JD 5 81”常规测井资料 ,通过定量计算对声波测井进行了压实、泥质及含气影响的校正 ,建立了孔隙度测井解释模型 ,探索性地提出声波测井曲线天然气影响的定量校正方法 ;(2 )根据毛管理论 ,综合应用毛管压力曲线、岩石物性、岩性分析及测井资料建立了渗透率测井解释模型。研究结果表明 ,利用电阻率曲线对声波测井进行天然气影响的定量校正方法是可行的 ,该方法提高了气藏孔隙度声波测井解释模型的精度 ,实现了应用“JD 5 81”常规测井资料即可进行储层孔隙度参数评价的研究。储层微观孔隙结构参数孔喉半径均值的主要影响因素是岩石比表面及孔隙度 ,综合利用孔隙度与岩性测井曲线可以较为准确地计算该参数 ,这为储层渗透率参数的评价奠定了基础。相似文献

15.

基于语音识别技术的英语发音评测系统研究

滕海坤刘心声王丽红《盐城工学院学报(自然科学版)》2016,29(1):17-22

利用语音识别技术,依英语发音的特有性,搭建完整合理的计算机辅助英语发音评测系统。整个系统包括3个部分:语音段验证、语音信号切割和发音评测。其中语音段验证利用置信度评估的技术,并依据置信度阀值对评测语音内容是否需要评测做出判断;语音信号切割是以预先训练好的英语发音声学模型为切割依据,通过强制对位的方式切割出正确的发音区段;英语发音评测是系统的核心,使用的评测方式是比较评测语音和标准语音的相似度,采用4个评测特征:发音完整度、韵律性、语速和准确度进行发音相似度评测。针对不同的特征参数设计合理的评测机制,并对4个特征参数进行加权运算,以建立一个完整合理的英语发音评测系统。实验证明,系统能够给出比较客观的评分,达到预期设计目标。相似文献

16.

基于同一平台的声电测井模拟系统设计与研究

邓少贵李刚谭宝海陈雪莲《实验室科学》2010,13(1):100-103

选取不同的声波速度分布范围的红砂岩、黄砂岩、大理石、花岗岩为主要介质,设计研究等比例缩小模型井。由声波探头、脉冲信号发生器、示波器以及频谱分析仪等设备就组成一套完整的岩石声学测井模拟系统,研制等比例缩小普通电阻率、双侧向模拟测井仪,在同一模拟井系统和测量测控平台进行岩石电阻率测井、声波测井模拟实验。相似文献

17.

基于特征曲线重构的波阻抗反演在复杂储层预测中的应用

余为维冯磊杜艳艳《科学技术与工程》2019,19(4)

在目前储层预测方法中,基于测井约束的波阻抗反演作为一项关键技术,应用效果较为良好。对于其反演效果的优劣,声波测井资料品质具有显著影响。当声波特征曲线对有效储层与围岩差异的敏感性较低时,常规测井约束反演的结果对储层刻画能力会有所不足,而测井特征曲线重构技术则可以有效改善储层预测效果,提高砂体边界刻画的精度。本文在研究区实际地质特征分析的基础上,依据现有地震、测井资料,并结合储层预测需要,从声波测井资料的特点出发,通过特征曲线重构方法,将自然伽马、自然电位、电阻率等对岩性较为敏感的特征曲线与声波资料融合,最终在重构后的声波曲线基础上,通过测井约束波阻抗反演来表征储层。实际应用结果表明砂、泥岩得到良好区分,储层描述明显改善,为后续生产开发提供了有效指导。相似文献

18.

rEcho——基于错误趋势分组技术和共振峰错音合成技术的计算机辅助发音教学系统

麻广广张鑫万济萍叶卫平《北京师范大学学报(自然科学版)》2009,45(4):358-362

在基于语音识别的计算机辅助发音学习(CAPT)系统rEcho V1.0的基础上设计并实现了rEcho V2.0.系统继承了V1.0利用错误趋势分组技术为学习者提供有针对性反馈建议的优点,完善了课程体系,提出利用共振峰错音合成技术合成识别器训练所需错音语料的方法,为解决错音语料不足这一长期困扰CAPT的问题提供了有效的途径.实验表明,合成错音训练的识别器达到原始语音训练的识别器的识别率水平.rEcho V2.0的整体性能较之前版本有较大提高. 相似文献