期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

肖宪波胡广书刘春红《清华大学学报(自然科学版)》2005,45(12):1680-1683

为改善数字化助听器产品的语言识别,提出了一种单频段压缩放大方法。该方法利用数学形态学方法定位共振峰和频谱包络特征,通过对特征点处增益值进行插值的方法得到放大后的频谱,再利用Fourier变换实现单频段压缩放大。该算法中谱特征定位只需逻辑判断和加法即可实现,其计算量低于同类线性预测编码(LPC)算法。仿真结果表明,该算法对声谱特征点定位完整、准确,放大后谱特征保存完好。言语测试结果表明,该方法相对于传统的多频段压缩放大方法,可提高中重度聋患者的辅音识别效果和噪声背景下的言语识别率,且减小计算量,有实用价值。相似文献

2.

基于LDA-MFCC的藏语语音特征提取技术研究

普次仁顿珠次仁《西藏大学学报》2014,(2):44-47

藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数（MFCC）特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。相似文献

3.

一种改进的适用于数字助听器的基于非线性频率压缩的多通道响度补偿方法

郭朝阳汪波王新安张国新《北京大学学报(自然科学版)》2018,54(1):25-34

为了改进数字助听器中的响度补偿, 并提高高频部分的语音可懂度, 提出一种基于非线性频率压缩的多通道响度补偿的综合方法。首先, 为了避免语音的频率畸变, 基于语音可懂度进行频谱的多通道划分。然后, 采用一种非线性的频率压缩方法, 将高频部分的声音压缩至患者能听到的低频部分。所提出的非线性频率压缩方法是基于不同频段对语音理解度的贡献占比来改变频率压缩比。最后, 为了实现自适应的响度补偿同时防止传统宽动态范围压缩的固定压缩比降低语音质量, 采用一种随时间可变压缩比的自适应宽动态范围压缩方法。实验结果表明, 相对于传统的宽动态范围压缩和频率压缩方法, 该方法可以改善20%的语音鉴别准确率。相似文献

4.

汉语平均频谱噪声下的汉语语言清晰度研究

彭健新《华南理工大学学报(自然科学版)》2005,33(8):71-74

在不同室内声学特性、不同信噪比条件下探讨汉语语言平均频谱干扰噪声及其方向对汉语语言清晰度的影响。汉语语言清晰度测试信号与干扰噪声信号按照一定的信噪比混合,由听音人进行汉语语言清晰度主观评价。结果表明：在汉语语言平均频谱干扰噪声作用下,听音位置的声场特性、信噪比和干扰噪声源方向对汉语语言的清晰度有显著影响;相比于房间声学特性和干扰噪声源方向,信噪比对汉语语言清晰度的影响更为显著;汉语语言清晰度随听音位置声场特性的改善和信噪比的提高而提高,随语言信号与噪声位置分开盼角度的增大而提高。相似文献

5.

基于藏语拉萨语语音识别中端点监测算法的研究

裴春宝《西藏大学学报》2014,(2):54-58

藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。相似文献

6.

连续汉语音识别有双词文法约束的大型HMM

张英林贾骏《兰州大学学报(自然科学版)》1999,35(1):77-80

提出针对汉语连续语音识别中的大型ＨＭＭ进行修正。在模型中加入双词法约束,然后给出洁约束下的新的识别算法,新识别算法基于Ｖｉｔｅｒｂｉ算法和分层构筑思想之上。经实验测试,识别率有较大提高。相似文献

7.

汉语语言可懂度客观评价的STI与SII方法实验对比研究

祝培生莫方朔王季卿《大连理工大学学报》2014,54(2):189-196

语言传输指数STI和语言可懂度指数SII为当前语言可懂度的两个主要客观评价体系.对STI和SII计算模型和测量结果的研究表明,二者并没有本质上的区别,测量结果的差别也主要是由采用的具体方法不同造成的;STI和SII的汉语语言可懂度主、客观评价关系曲线差别也不大,都可以用来对汉语的语言可懂度进行客观评价.但考虑到SII的测量过程更为复杂,在传统建筑声学等领域的应用也不具有优势,以及ANSI S3.5对测量条件限制的相对宽松可能会带来数据之间的可比性降低等因素,STI更适用于对汉语语言可懂度的客观评价. 相似文献

8.

Relationship between Chinese speech intelligibility and speech transmission index in rooms using dichotic listening 总被引：2，自引：0，他引：2

JianXin Peng 《科学通报(英文版)》2008,53(18):2748-2752

Speech intelligibility （SI） is an important index for the design and assessment of speech purpose hall. The relationship between Chinese speech intelligibility scores in rooms and speech transmission index （STI） under diotic listening condition was studied using monaural room impulse responses obtained from the room acoustical simulation software Odeon in previous paper. The present study employs the simulated binaural room impulse responses and auralization technique to obtain the subjective Chinese speech intelligibility scores using rhyme test. The relationship between Chinese speech intelligi-bility scores and STI is built and validated in rooms using dichotic （binaural） listening. The result shows that there is a high correlation between Chinese speech intelligibility scores and STI using dichotic listening. The relationship between Chinese speech intelligibility scores and STI under diotic and dichotic listening conditions is also analyzed. Compared with diotic listening, dichotic （binaural） listening （an actual listening situation） can improve 2.7dB signal-to-noise ratio for Mandarin Chinese speech intelligibility. STI method can predict and evaluate the speech intelligibility for Mandarin Chinese in rooms for dichotic （binaural） listening. 相似文献

9.

AMBE 语音压缩算法在机车语音记录仪中的应用

下载免费PDF全文

徐剑吕振中《空军工程大学学报(自然科学版)》2001,2(3):54-57

IMBE和AMBE都是基于MBE技术的低比特率、高质量语音压缩算法，其优越的性能已得到国际公认，并植于DVS公司的AMBE2000语音压缩芯片内。以AMBE2000压缩芯片为核心实现的机车固态语音记录仪，具有智能化、全电子、记录时间长、可靠性高的特点，是保证铁路行车安全的重要设备，正逐步在铁路机车上推广使用。相似文献

10.

基于基音同步叠加的汉语文语转换

霍华普杰信刘俊强冯阳春王平《河南科技大学学报(自然科学版)》2001,22(4):38-42

提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求相似文献

11.

一种基于功率因数补偿的谱相减算法改进 总被引：1，自引：0，他引：1

沈晓东李弼程《河南科技大学学报(自然科学版)》2011,32(1):29-32,118

对带噪语音进行传统谱减增强后,会引入"音乐噪声",并造成语售可懂度急剧下降.针对这一缺点,本文提出了一种采用功率因数补偿的过减形式的谱相减算法,以提高语音可懂度.采用MATLAB对算法进行了仿真,仿真结果表明:该算法有效的抑制了背景噪声、减少了"音乐噪声",比传统谱相减算法有较大优越性. 相似文献

12.

汉语孤立词声韵分割算法的研究 总被引：2，自引：0，他引：2

吕军马晓娜《安徽师范大学学报(自然科学版)》2008,31(3):214-218

文章从汉语语音评价系统设计的需要出发,针对DTW算法和汉语音节的特点,研究并实现了汉语音节中声母和韵母分割的两种算法,算法依据的基础都是依据不同类语音段数据相异的原理.在实际系统测试中,发现基于段间距离的分割算法取得了良好的实验结果,可以作为汉语语音评价系统中的声韵分割算法. 相似文献

13.

一种基于噪声动态检测的语音端点检测算法 总被引：1，自引：0，他引：1

胡钢沈文轩《鞍山科技大学学报》2004,27(2):115-119

HMM技术在语音识别中得到较为成功的应用．本文基于HMM的孤立词语音识别系统的识别策略，提出了两个改进的算法．第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法，较一些常规的端点检测方法如基于能量的端点检测方法，具有更高精度和鲁棒性，第二种算法针对分裂法进行码本设计时，可能出现除数为零的计算错误，提出了避免出现计算错误的改进算法．通过进行汉语孤立词语音识别实验，表明这两种算法是有效的，得到较高的识别率．相似文献

14.

Realtime robust speech communication based on iterative joint source-channel decoding and demodulation algorithm for MELP vocoder

彭坦 Cui Huijuan Tang Kun 《高技术通讯(英文版)》2010,16(2):111-116

Realtime speech communications require high efficient compression algorithms to encode speech signals. As the compressed speech parameters are highly sensitive to transmission errors, robust source and channel decoding and demodulation schemes are both important and of practical use. In this paper, an iterative joint source-channel decoding and demodulation algorithm is proposed for mixed excited linear prediction (MELP) vocoder by both exploiting the residual redundancy and passing soft information throughout the receiver while introducing systematic global iteration process to further enhance the performance. Being fully compatible with existing transmitter structure, the proposed algorithm does not introduce additional bandwidth expansion and transmission delay. Simulations show substantial error correcting performance and synthesized speech quality improvement over conventional separate designed systems in delay and bandwidth constraint channels by using the joint source-channel decoding and demodulation (JSCCM) algorithm. 相似文献

15.

人耳听觉仿声机理的研究

王琳江铭虎《山东师范大学学报(自然科学版)》1991,6(1):74-77

本文从生物物理学的角度研究了人耳听分析器的机械变压作用及换能作用,阐述了人耳的语声从机械频率分析到生物电分析的过程。对目前语音识别中几种特征参数的识别战略及算法进行了实验对比,指出了目前语音识别模型存在的问题及这几种参数识别的局限性,发掘的潜力及与人耳听觉的差距。相似文献

16.

基于BP神经网络的非特定人语音识别算法研究

戚龙赵丹《科学技术与工程》2017,17(31)

当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。相似文献

17.

语言传输指数STI评价汉语清晰度的失效性

章斯宇孟子厚《中国传媒大学学报》2015,(1):20-25

为了研究针对汉语清晰度的客观评测方法,通过汉语清晰度主观评价实验和客观测量对现有语言传输指数STI评价汉语清晰度的失效性进行分析。从汉语清晰度与STI的关系、STI的掩蔽模型、STI的权重系数三方面论述了采用STI评价汉语清晰度可能存在的问题,对引用IEC标准作为评价汉语清晰度的国家标准或工程规范提出了一些建议。相似文献

18.

变异特征加权的异常语音说话人识别算法 总被引：1，自引：1，他引：0

何俊李艳雄贺前华李威《华南理工大学学报(自然科学版)》2012,40(3):106-111

常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%. 相似文献

19.

基于卷积神经网络的入侵检测算法

贾凡孔令智《北京理工大学学报》2017,37(12):1271-1275

作为深度学习的一种有效算法,深度卷积网络已成功应用在处理图像、视频和音频等领域.通过建立一卷积神经网络模型并应用于网络入侵检测,选取的卷积核与数据进行卷积操作提取特征的局部相关性从而提高特征提取的准确度.采集到的网络数据通过多层"卷积层-下采样层"的处理对网络中正常行为和异常行为的特征进行深度刻画,最后通过多层感知机进行正确分类.KDD 99数据集上的实验表明,文中提出的卷积神经网络模型与经典BP神经网络、SVM算法等相比,有效提高了入侵检测识别的分类准确性. 相似文献

20.

Electric-stimulus rate encoding algorithm of Mandarin tonal information in cochlear implant

GUAN Tian GONG Qin YE Datian 《自然科学进展(英文版)》2006,16(12):1315-1321

The modern multi-channel cochlear implants usually extract and encode the temporal envelope cues. This kind of algorithms can hardly satisfy the users who speak tonal languages, such as Mandarin. Many studies have tried to enhance the recognition ability of Mandarin through encoding tonal information and made suggestions to frequency-modulate the fixed pulse-rate carrier with the extracted tonal information based on the rate-pitch theory in electric hearing. However, how to encode and deliver the tonal information such as F0 by changing electric-stimulus rate has not got further study in clinical electric-stimulus mode. The present paper focuses on this matter by piecewise calculating the appreciable electric-stimulus rates. Then an electric-stimulus encoding algorithm of Mandarin tone is brought forward and testified through acoustic simulations. Such conclusion can be drawn that this algorithm of electric-stimulus rate could convey tonal information well and help to enhance the Mandarin speech recognition ability. 相似文献