首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
语音相位听觉特性在正弦模型语音编码中的运用   总被引:1,自引:0,他引:1  
通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。  相似文献   

2.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

3.
提出了一种对Itakura 语音失真测度的改进方法——感知谱失真(PSD) 测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura 测度的优点来度量语音失真程度.通过对不同质量的语音信号进行仿真实验以及与Itakura 测度方法作对比实验,结果表明PSD测度克服了Itakura 测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PSD测度明显优于Itakura 测度.  相似文献   

4.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

5.
全相位时移相位差频谱校正法   总被引:17,自引:0,他引:17  
为精确估计噪声背景下正弦信号频率、幅值、初始相位,提出了基于全相位FFT谱分析的时移相位差频谱校正法.此方法需对存在时移关系的两输入序列分别进行全相位FFT,直接取主谱线的相位值无需校正即可得到初始相位的估计;利用主谱线上的相位差值即可获得精确的频率估计.同时阐述了传统相位差法向全相位时移相位差法的衍生关系.由于全相位FFT具有良好的抑制频谱泄漏特性,因而该法的频率和相位估计精度非常高,无噪时频率误差处于10^12分辨率级,相位误差可达10^-9度.  相似文献   

6.
针对PSOLA算法会引起语音频谱的不连续,从而影响合成语音的质量,提出了一种基于正弦模型的汉语普通话语音基音同步分析和合成算法.首先,将连续的语音信号在时间轴上分为一帧帧短时信号,再把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量,然后根据频率匹配的原则,对相邻两帧信号的幅度和相位进行插值,得到合成信号的正弦分量的幅值和相位,最后将各正弦分量相加,就得到了合成的语音信号.实验结果证明,该方法合成的语音信号的各个正弦波分量的相位和幅值均能平滑过渡,从而可以克服PSOLA算法带来的回声效应,有助于提高合成语音的自然度.  相似文献   

7.
语音在传输过程中受到来自周围环境、传输媒介等的干扰是不可避免的,这些干扰会严重影响语音接收时的质量,导致收到的语音信号不再是原始的纯净语音信号,而是带有各种干扰噪声的语音信号,这不仅影响语音的收听质量,也给后续的语音处理带来了一定的影响.因此对语音进行增强不可或缺.大部分传统的语音增强算法仅仅只通过改变语音的幅度,再叠加上原始的语音相位或者仅调整语音的相位再和未改变的幅度叠加来实现语音信号重建从而增强语音.本文提出了一个通过既改变语音信号的幅度又改变其相位的语音增强算法.通过使用客观语音质量测评(PESQ)和语谱图对用不同方法增强后的语音进行比较,验证了用本文方法得到的增强语音质量更佳.  相似文献   

8.
基于人耳听觉模型的语音质量客观评价方法   总被引:11,自引:0,他引:11  
将人耳听觉模型应用于语音质量客观评价,用听觉模型对语音作处理得到挖的短时语音频谱,在此基础上得到谱距离作为语音质量的评判标准,实验结果表明这咱方法与主观评价结果的相关度达到0.83。  相似文献   

9.
多频激电相对相位谱研究   总被引:5,自引:0,他引:5  
2n系列伪随机多频信号含有多个在对数坐标上呈等间距分布的主频率,是电法勘探的理想场源.多频激电相对相位谱法采用上述信号作为场源,充分反映了该信号作为电法勘探场源的优点.在多频激电相对相位谱法中,相对相位谱定义为ψr(ω)=[kψ(ω)-ψ(kω)]/(k-1).根据傅里叶变换的性质和激电效应与耦合感应的关系,证明相对相位谱测量具有如下优点:可以消除发送机和接收机之间因时间不同步而引起的测量误差,提高了观测精度;对电磁耦合感应进行了一阶线性校正,可以压制耦合感应.通过改变Cole-Cole模型中的频率相关系数c和频比k来分析相对相位谱与相位谱的差异,发现相对相位谱与相位谱在形态上一致,对异常具有同等的反应能力;它们之间的差值与频比k成反比、与频率相关系数c成正比.野外实测的多频激电相对相位谱和相位谱说明,激电相对相位谱测量对耦合感应具有良好的压制效果.  相似文献   

10.
提出一种基于单演信号理论提取结构特征的全参考图像质量评价方法。方法首先利用单演信号理论将图像分解为幅值、方向和相位3个特征分量,构造单演相位一致映射图和特征分量相似度比较函数;然后对相位一致映射图进行Riesz变换,其变换后的一阶、二阶系数作为结构特征相似度比较函数,最后将单演信号的特征分量和结构特征相似度比较函数归一化加权计算得出最终的图像质量评价值。实验结果表明,由于单演相位一致具有较好的抗噪声能力,特征分量和结构特征相似度更加全面考虑到对于人眼感知图像结构的重要性,因此评价结果与图像主观质量评价具有较好的一致性。  相似文献   

11.
混响是封闭空间内产生的一种声学现象,过度的混响严重影响通信质量。在谱减法去混响的基础上提出分频带谱减去混响的方法,基于每个频段上混响时间不同这一特性,将谱减法用到每个频率子带中,提高谱减法去混响的精度。分别采用语谱图和语音质量感知评价的评价方式对整体谱减和分频谱减的两种算法效果作对比,发现分频谱减效果更为显著。  相似文献   

12.
Patel AD  Balaban E 《Nature》2000,404(6773):80-84
Despite growing interest in temporal aspects of auditory neural processing, little is known about large-scale timing patterns of brain activity during the perception of auditory sequences. This is partly because it has not been possible to distinguish stimulus-related activity from other, endogenous brain signals recorded by electrical or magnetic sensors. Here we use amplitude modulation of unfamiliar, approximately 1-minute-long tone sequences to label stimulus-related magnetoencephalographic neural activity in human subjects. We show that temporal patterns of activity recorded over particular brain regions track the pitch contour of tone sequences, with the accuracy of tracking increasing as tone sequences become more predictable in structure. In contrast, temporal synchronization between recording locations, particularly between sites over the left posterior hemisphere and the rest of the brain, is greatest when sequences have melody-like statistical properties, which may reflect the perceptual integration of local and global pitch patterns in melody-like sequences. This method is particularly well suited to studying temporal neural correlates of complex auditory sequences (such as speech or music) which engage multiple brain areas as perception unfolds in time.  相似文献   

13.
基于人耳听觉模型的语音质量客观评价方法   总被引:1,自引:0,他引:1  
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .83  相似文献   

14.
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。  相似文献   

15.
基于Haar小波提升的2.4kbit/s CWI语音编码算法   总被引:1,自引:0,他引:1  
提出一种基于Haar小波提升的2.4 kbit/s特征波形内插(CWI)语音编码算法.将特征波离散时间傅里叶级数(DTFS)得到的幅度谱转化为离散余弦变换(DCT)系数,用Haar小波提升实现特征波的多级分解与重建.利用相位谱间距的均值和基音周期增益联合判断浊音度标志,用于进行相位选择和离散余弦变换系数的选择性量化.主观A-B听音实验表明,该语音编码算法音质优于传统的3.8 kbit/s CWI编码器,在较低码率上获得较为满意的合成音质,且Haar小波提升特征波形分解与重建方法解决了传统小波变换CWI算法延时较大的问题.  相似文献   

16.
张开生  赵小芬  王泽  宋帆 《科学技术与工程》2020,20(35):14536-14542
针对复杂环境下语音端点检测准确率低下且检测耗时过长的问题,研究一种基于EEMD和OS-DL联合去噪的语音端点检测算法。首先利用EEMD(总体平均经验模态分解)算法对输入语音进行分解得到IMF(本征模式分量),然后使用OS-DL(一步式字典)算法分别对纯净语音信号与噪声信号进行训练,得到纯净语音信号和噪声信号的幅度谱字典,进而对幅度谱进行稀疏表示,利用得到的系数矩阵重新构建出语音信号频谱,将重构出的语音信号频谱经过傅里叶逆变换得到降噪后的语音信号,最后对降噪后的语音信号利用均匀子带频带方差法进行端点检测。实验结果表明:该算法在复杂环境信噪比低于-10dB情况下检测准确率仍可达到85%以上,且平均检测时间缩短至传统端点检测算法的1/3。  相似文献   

17.
基于MSP430单片机相位连续的ZPW2000轨道电路移频信号产生   总被引:1,自引:0,他引:1  
讨论了连续相位移频信号的时域与频域特性,并给出中心频率分量的相对幅度。为了设计出铁路专用连续相位的移频信号,利用美国德州仪器(TI)16位超低功耗单片机MSP430系列单片机控制AD9832产生连续相位的FSK移频信号,并用铁路专用ZPW2000测试仪表进行了测量,测量结果表明,无论是载频还是低频,误差均不大于0.05 Hz,完全满足铁路移频误差不大于0.1 Hz的要求,为铁路运输提供理论和实践应用。  相似文献   

18.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号