期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

屈乐园解焱陆张劲松《北京大学学报(自然科学版)》2017,53(2)

为了提升计算机辅助发音训练(CAPT)系统中发音偏误趋势(PET)的检测效果,确保反馈信息的准确性与有效性,提出一种基于对数似然比的发音特征方法。该方法将多个基于深度神经网络的发音特征提取器用于生成帧级别的对数似然比,然后将对数似然比组成的发音特征用于PET的检测,为学习者提供发音位置和发音方法的正音信息。实验结果表明,发音特征对PET的检测效果优于常用声学特征(MFCC,PLP和f Bank),当发音特征与MFCC特征相结合时,可以进一步提升性能,达到错误接受率为5.0%,错误拒绝率为30.8%,诊断正确率为89.8%的检测效果。相似文献

2.

基于CTC与Transformer的普通话单音节发音错误检测

杨兴耀卢进堂肖瑞张利飞曾利文《东北师大学报(自然科学版)》2024,(1):87-95

提出CTC与Transformer结合的端到端模型,使用多编码器和字层级一致的方法,降低在复杂录制环境下的识别错误率.该端到端模型在自建数据集PSC＿Monosyllable的测试集上的词错误率为5.6%.通过预训练,可以实现发音错误检测的正误分类,且比传统机器学习模型检测结果性能提升了16%,有效地提升了发音错误检出率,得出了较好的结果,检测率为0.589. 相似文献

3.

基于DNN的发音偏误趋势检测

《清华大学学报(自然科学版)》2016,(11)

正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)、感知线性预测分析系数(perceptual linear predictive analysis,PLP)和Mel滤波器组系数(Mel filter bank,FBank)3种声学特征参数,并利用网格联合技术整合3种声学特征所得的候选网格。实验结果表明:DNN-HMM模型比GMM-HMM实现了更高检测正确率。针对不同发音偏误趋势,3种声学特征有不同表现,联合系统取得最高性能,最终性能为:错误拒绝率5.5%,错误接受率35.6%,检测正确率88.6%。相似文献

4.

基于发音特征的汉语发音偏误自动标注

魏星王玮陈静萍解焱陆张劲松《北京大学学报(自然科学版)》2018,54(2):243-248

针对发音偏误检测系统语音标注费时、费力和标注不一致的问题, 基于发音特征, 构建偏误检测系统, 给出Top-N的识别结果, 通过praat软件呈现机器初步标注文本, 在此基础上进行人工二次标注。实验结果表明, 与单纯的人工标注相比, 所提出的自动标注加人工二次标注方法在标注一致性上从80.7%提高到92.48%, 平均每个句子的标注时间从10分钟减少到3分钟。所提方法有效地提高了人工标注的效率, 可以在有限时间内为识别系统提供更多可靠的标注语料。相似文献

5.

基于优化检测网络和MLP特征改进发音错误检测的方法

袁桦钱彦旻赵军红刘加《清华大学学报(自然科学版)》2012,(4):557-560,570

该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。相似文献

6.

结合高斯混合模型和VOT特征的音素发音错误检测

刘明辉黄中伟《科学技术与工程》2013,13(7):1789-1793

结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。相似文献

7.

一种基于灰关联分析法的语音激活检测算法

下载免费PDF全文

陈功张雄伟李耀波朱流泉《解放军理工大学学报(自然科学版)》2007,8(1):10-14

为在有色非高斯噪声背景下实时、有效地区分语音信号与各种背景噪声,提出了一种基于灰关联分析的语音激活检测(VAD)算法.该算法提取语音信号过零率、线性预测系数、倒谱系数和转移倒谱系数4种特征参数作为关联参数,通过跟踪语音与噪声灰关联度的变化确定判决门限,实现语音激活检测.仿真结果表明:该算法在无噪声背景中识别率为100%,在-5 dB噪声背景环境,识别率可达80%以上.此算法对有色非高斯背景噪声不敏感,而且计算简单、可靠性高,在语音激活检测中具有可行性. 相似文献

8.

汉语普通话声调发音错误检测

张琰彬呼月宁初敏黄超梁满贵《清华大学学报(自然科学版)》2008,48(Z1):683-687

汉语是声调语言,相同的音节带上不同的声调所代表的语义就很不相同.为了便于计算机辅助语言学习或用于普通话水平测试系统,准确地检测出声调的发音错误,该文采用精细的上下文相关的声调建模(contextdependent tone model,CDTM),并通过度量与实际发音最相符合的声调模型与预期的声调模型问的KL散度(Kullback-Leibler Divergence,KLD)来检测声调发音的正确性.实验结果表明,在控制错误接受率和错误拒绝率相等的前提下,错误接受率约为6.7％. 相似文献

9.

一种基于近邻传播聚类的语音端点检测方法

林琴涂铮铮王庆伟郭玉堂《安徽大学学报(自然科学版)》2019,43(3)

为提高语音端点检测在低信噪比情况下的准确性,提出一种基于近邻传播聚类的语音端点检测算法.首先采用能量语音端点检测去除静音段;然后利用近邻传播聚类自动获取类别数的优点,有效地将语音细分为无语义语音和静音段、远场噪声段等各种类别;最后结合后处理方法,对语音端点做进一步过滤处理.实验结果表明:该算法在低信噪比的情况下,与传统的能量语音端点检测相比,其有效语音检测的漏警率相对下降13%,虚警率相对下降14%;在实际应用中,如声纹确认和声音检测等,与经典算法相比,该算法检测的准确率与效率等性能得到了显著提升. 相似文献

10.

基于小波分析的梅尔频率倒谱参数? 总被引：1，自引：0，他引：1

董丽娜何怡叶卫平《北京师范大学学报(自然科学版)》2015,(5):469-474

采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC. 相似文献

11.

基于扩展谱相减与SAP的带噪语音端点检测 总被引：2，自引：0，他引：2

王秀丽王树勋林琳《吉林大学学报(信息科学版)》2006,24(4):351-357

为提高低信噪比时带噪语音端点检测的性能,提出了一种将扩展的谱相减法与SAP(Speech AbsenceProbab ility)软门限相结合的方法。采用基于噪声补偿结构的扩展谱相减法,通过使用自适应的判决规则,在不需要进行语音激活检测的情况下有效地去除了背景噪声,克服了单麦克输入时无法在语音段对噪声进行估计的缺点。同时采用非语音段概率SAP软门限,直接对增强后的语音信号进行检测,有效提高了语音段起止端点检测的精确度和可靠性。实验结果表明,该方法比短时能量方法的计算效率高,在信噪比为-10 dB时仍能完成端点检测。相似文献

12.

基于点标定的行人检测准确度研究

李昕昕李新江龚勋《科学技术与工程》2017,17(13)

为了提高基于特征点的行人检测方法的检测准确度,提出了一种基于局部二值模式(local binary patterns,LBP)和二进制梯度方向直方图(binary histograms of oriented gradients,BHOG)特征组合和支持向量机分类器(support vector machine,SVM)的行人检测方法。实验结果显示,采用BHOG+LBP组合特征提取方式的错误检测率为0.012,相较于采用单一BHOG特征提取方式的错误检测率降低了33.33%,相较于采用单一LBP特征提取方式的错误检测率降低了40%。相似文献

13.

SELP声码器参数抗差错恢复算法

《清华大学学报(自然科学版)》2010,(5)

针对低速率语音编码领域的正弦激励线性预测(SELP)声码器,提出了一种错误帧参数修复算法。对于信道编解码不能纠错的语音帧,算法根据信道解码后所指示的错误信息,结合解码端各参数平稳性的不同,采用参数替换方法分别进行修复。测试结果表明:采用该算法,在1%、3%、5%的随机信道误码下,声码器抗误码性能均有较大改善,特别是在5%的较高信道误码率下,合成语音平均意见得分提高了0.2以上。相似文献

14.

声纹识别在开放仪器管理中的应用

赖丽旻洪青阳《华侨大学学报(自然科学版)》2015,(5):517-521

在现有的仪器工作站中加入基于GMM-HMM算法的声纹识别系统,利用声纹的唯一性识别仪器用户,实现开放仪器的无人监管.应用该声纹识别系统,进行语音动态口令测试.结果表明:该系统语音动态口令的错误接受率低于1%,可有效地防范录音冒充,保证系统的可靠性. 相似文献

15.

基于交叉熵顺序统计滤波的语音端点检测算法 总被引：2，自引：0，他引：2

钱彦旻刘加《清华大学学报(自然科学版)》2009,(10)

为提高语音端点检测在强噪声环境下的准确率,提出了一种基于交叉熵顺序统计滤波(OSF)的语音端点检测算法。该算法以子带交叉熵为语音/非语音的区分特征,首先将每帧语音的频谱划分成若干个子带,估计出每个子带能量与背景噪声之间的交叉熵,然后把相继若干帧的子带能量交叉熵经过一组顺序统计滤波器,最后根据各帧交叉熵的值对输入的语音进行分类。实验结果表明:该算法能够有效地区分语音和非语音。特别是在强噪声环境下依然能够保持很高的检测率,具有鲁棒性。通过实验结果比较,该算法在性能上优于最近提出的基于能量顺序统计滤波和单纯交叉熵判别的两种方法。相似文献

16.

基于免疫机制的病毒检测方法研究

赵丽李曼张秋余王鹏辉《科学技术与工程》2008,8(9):2360-2364

借鉴生物免疫系统识别病毒的机制,特别是抗体指令系统多样性机制提出了一种改进的检测器动态进化自适应的免疫识别方法.不同于前人工作的另外一点是构成检测器的基因不是根据病毒的动态执行特征来提取,而是根据病毒可执行文件(PE文件)的静态信息提取的.给出了该方法的具体实现步骤,并对一些病毒进行了检测,试验表明该方法提高了检测率,降低了错误肯定率和错误否定率,同时具有较好的适应性. 相似文献

17.

闽南方言对英语语音习得的影响及成因分析

张星陈井泉《科技信息》2011,(16):I0137-I0137

闽南方言音系中有些发音与英语很接近,但两者的发音部位与方法却不尽相同,各自具有不同的发音特点。闽南方言区的学生在学习英语音标发音时往往习惯性地将方言中的发音特征带入其英语发音当中。为了对学生进行系统有效的英语语音教学,使学生掌握较为纯正的英语发音,教师就必须对该方言及英语两种语言的语音系统有较全面的了解并通晓其异同之处,这样才能知道学生,分析其易犯的发音错误,并找出相应、有效的正音方法。相似文献

18.

基于相关维数的病变连续语音检测算法

贺前华何俊李艳雄王志峰《华南理工大学学报(自然科学版)》2012,40(6):1-5

针对人为设定最优采样延迟不能客观反映信号采样延迟和固定相关维数不易描述病变异常语音复杂性的缺陷,文中提出一种基于相关维数的病变连续语音检测算法.该算法在语音信号合理采样延迟区间内不断调整采样延迟,搜索使正常语音与病变连续语音的区分等错误率达到最小的嵌入相关维数,以避免设定采样延迟的缺陷.同时,通过将相关维数曲线划分成子区间,并判定子区间的稳定性,以达到不固定嵌入相关维数的目的.最后,对每个合理采样延迟时间内获取的训练语音的最优相关维数进行等错误率分析,选用具有最小等错误率的相关维数及对应的采样延迟为文中混沌参数,为测试语音提取混沌指数进行正异常区分.实验结果表明,该算法的区分正确率为75.6%,分别比GMM-SVM、Shimmer、固定相关维和采样延迟法、SHR算法和Jitter算法提高7.8%、9.3%、16.0%、18.0%和20.4%. 相似文献

19.

一种基于信道软译码的差错隐藏算法

下载免费PDF全文

肖勇张雄伟邹霞谢贵武《解放军理工大学学报(自然科学版)》2009,10(2):113-117

为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法.利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式.对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量.测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能. 相似文献

20.

纯音乐与语-音乐混合片段的高准确识别方法

孔令志罗森林张冰王耀威《北京理工大学学报》2009,29(1)

通过对同一首歌曲音频信号的特征分析,提出了一种基于音频片段平均短时能量和过0率标准偏差的融合判决方法. 该方法解决了纯音乐与语音-音乐混合片段识别易混度高的问题,可以准确地识别同一首歌曲中纯音乐片段和语音-音乐混合片段,为去除音频中不需要的部分提供一种有效的预处理方法,并且可以更好地提高数据处理的效率和性能. 实验结果表明,通过对不同风格、不同歌手以及不同语言的歌曲处理,纯音乐的平均正确率为92.30%,语音-音乐混合的平均正确率为96.36%. 相似文献