期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈国胡修林张蕴玉朱耀庭《华中科技大学学报(自然科学版)》1999,(10)

提出了一种对Ｉｔａｋｕｒａ语音失真测度的改进方法——感知谱失真（ＰＳＤ）测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Ｉｔａｋｕｒａ测度的优点来度量语音失真程度．通过对不同质量的语音信号进行仿真实验以及与Ｉｔａｋｕｒａ测度方法作对比实验,结果表明ＰＳＤ测度克服了Ｉｔａｋｕｒａ测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时ＰＳＤ测度明显优于Ｉｔａｋｕｒａ测度．相似文献

2.

一种改进的基于LP倒谱特征的孤立词语音识别方法

侯雪梅张雪英赵高峰《太原理工大学学报》2006,37(5):508-510

阐述了Mel谱失真测度的概念,指出用Mel频率尺度可较充分地反映人耳对频率及幅度的非线性感知特性。在此基础上,针对孤立词语音识别,对常规LP倒谱特征提取方法进行改进,即将LP倒谱按符合人耳听觉特性的Mel尺度进行非线性变化,得到LP Mel倒谱系数(LPM-CC)作为特征参数。识别网络使用RBF神经网络,进行了孤立词语音识别。实验结果表明此种方法抗噪性能好,识别效率高。相似文献

3.

语音信号中相位信息的听觉感知研究 总被引：4，自引：0，他引：4

同鸣卞正中戴启军陈砚圃张亮《西安交通大学学报》2003,37(12):1288-1291,1307

通过主观听觉测试实验，研究了语音信号中相位信息对人的听觉感知的影响．实验结果表明，保持语音信号的幅度谱不变，在改变其相位谱时，只要重建信号在时域中的包络不变，重建语音和原始语音就不存在主观听觉上的差异．重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度．重建语音中不同频率分量之间的最大相对时移决定语音感知的质量，当最大相对时移小于10ms时，语音感知质量最优；只要相位失真带来的不同频率分量之间的最大相对时移小于20ms，就不会影响对连续语音的正常理解．相似文献

4.

一种改进的客观音质评价方法 总被引：4，自引：0，他引：4

杨波傅汝林张知易《成都理工大学学报(自然科学版)》2004,31(1):108-110

描述了利用人耳的听觉掩蔽效应来对巴克谱失真距离测度进行改进,并将这些测度应用在客观音质评价中,以提高主客观音质评价的相关度.改进的测度动态地确定语音信号每个巴克带的掩蔽门限,有选择性地计算失真距离,只包含听觉能够感知的失真.针对特定失真语音条件下的实验仿真结果表明,主客观评价结果之间具有更高的相关系数.可以推断这些测度作为对语音系统进行的客观音质评价,会具有好的有效性和实用性. 相似文献

5.

一种基于语音分类的清晰度客观评价算法

下载免费PDF全文

张雄伟沈刘平曹铁勇杨吉斌孙新建《解放军理工大学学报(自然科学版)》2007,8(2):103-107

为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%. 相似文献

6.

语音失真测度系统的构成与算法实现

黄国庆宋家友《信阳师范学院学报(自然科学版)》2008,21(2):301-304

介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度. 相似文献

7.

结合SOFM失真的HMM语音识别方法

马小辉富煜清《东南大学学报(自然科学版)》1997,27(1):49-52

提出一种结合ＳＯＦＭ失真的ＨＭＭ语音识别方法，它直接将ＳＯＦＭ失真测度与左右型离散ＨＭＭ相结合综合利用ＳＯＦＭ失真五ＨＭＭ状态输出概率作为ＨＭＭ的匹配失真测度。该方法既可以看作为基于ＶＱ失真语音识别方法的推广，又可以看作为半连续ＨＭＭ的一种特例。实验结果证明它具有良好的效果。相似文献

8.

用DSP技术开发的一种新的语音识别系统 总被引：2，自引：0，他引：2

余小清万旺根陶安袁京贤《上海大学学报(自然科学版)》1999,5(2):110-114

本文介绍了一种基于听觉谱特征参数的语音识别方法和系统．该系统采用高速ＤＳＰ芯片ＴＭＳ３２０Ｃ２５,实现了语音信号的实时处理．用由此芯片开发的ＥＩＳＡ插卡与计算机结合,构成了一个智能化语音输入实时识别系统．实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到９８％以上,在非特定人和有噪情况下,系统正识率分别为９５％和９０％以上．通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好相似文献

9.

基于人耳听觉模型的语音质量客观评价方法 总被引：1，自引：0，他引：1

李云鸿胡修林张蕴玉《华中科技大学学报(自然科学版)》2000,28(5):63-65

将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83 相似文献

10.

基于人耳听觉模型的语音质量客观评价方法 总被引：11，自引：0，他引：11

李云鸿胡修林《华中理工大学学报》2000,28(5):63-65

将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到０．８３。相似文献

11.

VoIP网络中的端对端音频测试

下载免费PDF全文

曾德攀成立新《解放军理工大学学报(自然科学版)》2000,1(6):44-48

VoIp的通话质量是影响其发展和推广的主要因素,是人们最为关注的问题,如何测试通话质量是VoIP中的一项关键技术。在分析影响VoIP通话质量因素的基础上,介绍了VoIP网络中端对端音频测试的主要内容和方法,并详细介绍了一种全新的语音质量客观评估方法－听觉语音质量测度（PSQM）。相似文献

12.

16kb／s7kHz宽带语音编码器的研究

赵滨《上海交通大学学报》1998,32(8):21-25

分析了宽带语音编解码过程中遇到的特殊问题和解决办法,并通过改进窄带语音ＴＣＸ算法（主要包括系统合成滤波器的移位和将频域矢量分成高低两个矢量）实现了宽带语音压缩编码．该算法的运算量仅相当于一般ＣＥＬＰ运算量的１／２,降低了对所用ＤＳＰ的速度要求．实验证明重建语音质量有了明显改善,信噪比提高近３ｄＢ,主观听觉质量也有明显改善．同时还分析了频域量化对该系统的编码噪声的影响,认为２ｂｉｔ／ｓａｍｐｌｅ来量化相位是比较恰当的,这样能充分发挥ＴＣＸ算法优越性,获得较理想的编码效果．相似文献

13.

语音相位听觉特性在正弦模型语音编码中的运用 总被引：1，自引：0，他引：1

曹燕张军宁更新韦岗《科学技术与工程》2008,8(23)

通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。相似文献

14.

基于ADSP2186的语音识别电话

李作友江太辉《五邑大学学报(自然科学版)》1997,11(4):23-26

对基于ＡＤＳＰ２１８６的语音识别电话的硬件结构作了简明的介绍，并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。相似文献

15.

DSP语音控制器中MFCC参数的定点快速算法 总被引：2，自引：0，他引：2

何强蒙山《五邑大学学报(自然科学版)》1999,13(4):6-10

本文介绍了一个基于定点数字信号处理器ＡＤＳＰ２１８１的语音控制器，着重讨论了其语音特征参数计算方法。相似文献

16.

融合MFCC和LPCC的语音感知哈希算法

黄羿博张秋余袁占亭杨仲平《华中科技大学学报(自然科学版)》2015,(2):124-128

为了提高语音感知哈希算法的鲁棒性和识别小范围篡改定位的能力,利用人类听觉模型提出了一种语音感知哈希算法.该算法基于人类听觉特性,首先对倒谱系数MFCC算法每帧的滤波器数量进行控制,得到每帧语音的梅尔频率倒谱参数;其次对自适应梅尔倒谱系数MFCC参数和语音LPCC系数进行融合,并采用分块方法对特征矩阵进行处理,对特征块进行2DNMF分解运算,降低特征矩阵的复杂度;最后对分解后的系数矩阵进行哈希构造,得到语音感知哈希串,利用哈希匹配实现语音认证.结果表明:该算法可以有效提高哈希认证的鲁棒性,并能够实现语音小范围篡改定位功能. 相似文献

17.

一种分层阈值优化的语音感知小波去噪方法

曹斌芳彭光含彭元杰黎小琴《湖南文理学院学报(自然科学版)》2014,(2):35-39

通过分析含噪语音信号的特点,引入能够兼顾人耳听觉特性的听觉感知小波变换,构造了新的小波阈值函数,并对小波变换分解后的阈值进行基于微粒群算法的分层优化.仿真实验表明,该方法在不同信噪比条件下均具有较好的去噪性能,语音的可懂度和听觉效果得到有效提高. 相似文献

18.

基于SDCN算法的鲁棒性语音命令识别

陶世焰刘重庆何昕顾樑《上海交通大学学报》2000,34(7):889-891

提出了一种基于ＳＤＣＮ算法的鲁棒性语音命令识别。依赖于信噪比的倒谱正常化（ＳＤＣＮ）算法直接在倒谱域根据输入语音帧的信噪比（ＳＮＲ）来增加一补偿矢量,从而恢复未受污染的净语音信号,补偿矢量直接从训练环境和测试环境中记录的语音倒谱中逐帧比较得到,该算法对退化的环境具有很强的鲁棒性,实验结果证明,该算法简单,有效。相似文献

19.

低码率语音编码中感知加权滤波器的一种新型算法

李文广陈健《上海交通大学学报》1998,32(6):38-42

声学心理模型是对人听觉系统生理结构和人耳主观感知特性的数学抽象模型．这种模型已成功运用于宽带音频编码中．首次提出将声学心理模型原理应用于语音编码中感知加权滤波器的设计．通过对ＩＴＵＧ．７２３．１６．３／５．３ｋｂ／ｓ双速率编码算法中感知加权滤波器的改进,编码器的ＭＯＳ分可以改善０．１～０．３,而且新算法所要求的计算量仅比原算法大０．２６ＭＩＰＳ．基于声学心理模型的感知加权滤波器,与现有各类语音编码器中所用的感知加权滤波器相比,有自适应强、更符合人耳听觉特性、主观处理效果更佳的优点．相似文献

20.

局部凸空间上的谱算子

邓生华《西南师范大学学报(自然科学版)》1997,22(1):10-18

推广了Ｂａｎａｃｈ空中谱测度、可测函数关于谱测度的积分、谱算子及其约当分解到局部凸空间．得到定理１设Ｔ∈Ｌ（Ｘ）为谱算子，Ｅ（）为其单位分解．定义算子Ｓ＝Φ（λ），其中λ代表函数ｆ（λ）＝λ，称Ｓ为Ｔ的标部．则（ｉ）Ｄ（Ｓ）在Ｘ中稠，且Ｓ是一个闭线性算子．（ｉ）当Ｔ∈Ｌｂ（Ｘ）时，Ｓ∈Ｌ（Ｘ），且Ｎ＝Ｔ－Ｓ是一拟幂零算子，ＮＳ＝ＳＮ．（ｉｉ）在Ｄ（Ｓ）上成立Ｔ＝Ｓ＋Ｎ，其中Ｎ满足：任意有界闭集ｅ∈ΣＰ，ＮＥ（ｅ）Ｘ是一拟幂零算子，且ＳＮ＝ＮＳ在Ｘ的某稠密子空间上成立相似文献