首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
语音信号中相位信息的听觉感知研究   总被引:4,自引:0,他引:4  
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解.  相似文献   

2.
语音参数编码中,相位信息占有重要的地位.本文根据语音信号中相位信息所遵循的统计分布规律,找到了一种新的相位编码方法,从而使相位编码的比特数得到了极大的压缩.将此法用于语音压缩中,由计算机模拟结果证明该方法是成功的,其合成语音品质获得了很好的可懂度和自然度.  相似文献   

3.
在语音信号处理系统的设计中,信号的相位信息总是没有得到设计者足够的重视。本书第一次提出并反复强调信号相位信息在声源定位、语音识别和语音增强中的重要作用,书中很好地讨论并总结了当前基于相位的语音信号处理的最新进展。  相似文献   

4.
语音在传输过程中受到来自周围环境、传输媒介等的干扰是不可避免的,这些干扰会严重影响语音接收时的质量,导致收到的语音信号不再是原始的纯净语音信号,而是带有各种干扰噪声的语音信号,这不仅影响语音的收听质量,也给后续的语音处理带来了一定的影响.因此对语音进行增强不可或缺.大部分传统的语音增强算法仅仅只通过改变语音的幅度,再叠加上原始的语音相位或者仅调整语音的相位再和未改变的幅度叠加来实现语音信号重建从而增强语音.本文提出了一个通过既改变语音信号的幅度又改变其相位的语音增强算法.通过使用客观语音质量测评(PESQ)和语谱图对用不同方法增强后的语音进行比较,验证了用本文方法得到的增强语音质量更佳.  相似文献   

5.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果.  相似文献   

6.
语音信号变速算法及其TMS320C5402实时实现   总被引:2,自引:0,他引:2  
语音信号可表述成激励源和线性时变系统的冲激响应的卷积.若激励源是一白噪声信号,则声道发清音;若激励源是一准周期信号,则声道发浊音.在语音信号序列中影响语音表达速度的是浊音,它是基音,是由多次谐波构成的准周期信号.语音信号序列可以看成是基音周期经整数倍延时后叠加而成.插入部分基音周期使语音速度降低,删除部分基音周期能使语音速度提高.但是,插入或删除基音周期使语音信号的相位不连续,造成语音跳变,为此,采用交叠分帧的方法将语音信号划分成短时段序列.然后,求增或删后短时段序列相邻短时段之间的相关函数,进而求出相关函数极大值.按最大相关点实现相邻短时段之间的相位衔接,使其相位接近连续.此外,提出了一个TMS320C5402和AT89C51双处理机系统的硬件设计方案,将语音变速算法用TMS320C5402和人-机交互用单片机AT89C51实现.  相似文献   

7.
针对PSOLA算法会引起语音频谱的不连续,从而影响合成语音的质量,提出了一种基于正弦模型的汉语普通话语音基音同步分析和合成算法.首先,将连续的语音信号在时间轴上分为一帧帧短时信号,再把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量,然后根据频率匹配的原则,对相邻两帧信号的幅度和相位进行插值,得到合成信号的正弦分量的幅值和相位,最后将各正弦分量相加,就得到了合成的语音信号.实验结果证明,该方法合成的语音信号的各个正弦波分量的相位和幅值均能平滑过渡,从而可以克服PSOLA算法带来的回声效应,有助于提高合成语音的自然度.  相似文献   

8.
对Itakura语音失真测度的改进   总被引:1,自引:0,他引:1  
提出了一种对Itakura语音失真测度的改进方法-感知谱失真(PSD)测度方法,该方法通过模拟人的听觉特性把语音短时谱转变为符合听觉特性的感知谱,再以感知谱为基础,结合Itakura测度的优点来度量语音失真程度。通过对不同质量的语音信号进行仿真实验以及与Itakura测度方法作对比实验,结果表明PSD测度克服了Itakura测度的不足,与语音质量的主观评价一致性较好,特别是在语音失真程度较大时PS  相似文献   

9.
在语音信号处理系统中,基于帧能量的语音端点检测(voiceactivitydetection,VAD)往往受到语音段能量不平稳及噪声的影响,为了提高语音端点检测的性能和鲁棒性,引入视觉信息。该文提出采用基于数据驱动的线性变换生成视觉特征,在提出一个基于统计的VAD一般模型的基础上构建两个单模式的VAD系统,通过两步式的融合方法,得到了多模式的VAD系统。实验表明:同时利用音频和视觉信息的多模式VAD比基于帧能量的听觉VAD在帧错误率上有55.0%的相对下降,在断句错误率上有98.5%的相对下降。这一结果说明多模式VAD方法基本可以避免断句错误,也能够显著改善帧检测性能,是一种相当有效的方法。  相似文献   

10.
动态阈值谱法语音增强   总被引:2,自引:0,他引:2  
根据人耳能从噪声中提取有用信息的听觉特征,并结合语音信号的基本特征,提出并研究了一个适合于语音增强的听党内模型;实验结果表明,这个方法不仅在提高语音信噪比方面,而且在减小语音失真度方面均有较好的改善。  相似文献   

11.
为研究自吸泵叶轮气液混合能力对自吸性能的影响,在叶轮原模型基础上,设计了叶片不同进口边位置的5种模型方案.采用VOF多相流模型对不同方案全流域进行三维定常数值计算,研究对自吸性能的影响规律.针对350WFB-1200-50型外混式无密封自吸泵,初始条件设定进水S型弯管中含一定体积的空气段,出口处设置含气率监测点.结果表明:针对中高比转速叶轮,进口边沿后盖板位置向出口前掠,使得叶轮进口边工作时对流体分时加载,可以有效提升叶轮的气液混合能力,从而缩短自吸泵的自吸时间;在一定前掠角度范围内改变进口边位置对自吸泵的扬程和效率影响不大,但是当叶片进口边向出口位置前掠超过一定范围时,会导致自吸泵扬程明显下降;当叶轮进口边前掠10°时,额定工况下自吸时间缩短25%,自吸性能明显得到提高.  相似文献   

12.
作为二十世纪五六十年代国内最权威的诗歌刊物《,诗刊》无疑代表了当时的文学潮流,并引领着文学的走向。研究自1957年1月到1965年停刊的《诗刊》,可以清晰地把握当时的诗坛动态和文学环境,不失为五六十年代中国文学的一份生动史料。本文着重考察的是《诗刊》如何以对“五四”以来新诗人的重估和对新诗史的重构,完成了新诗在五六十年代的历史叙述。  相似文献   

13.
技术异化的生成   总被引:3,自引:0,他引:3  
从技术的复杂性和局限性、技术的不恰当使用、自然的不可预见性、技术理性的沙文主义式扩展及社会文化等几个方面探讨了技术异化产生的根源。  相似文献   

14.
阐述了湿度传感器稳定性的误差,指出影响湿度传感器稳定性的误差有线性误差、温度影响误差、湿滞误差以及校验标准误差等.  相似文献   

15.
对图书馆读者满意度问题的思考   总被引:6,自引:0,他引:6  
分析了图书馆读者满意度的含义及衡量要素,论述了图书馆调查读者满意度的目的及方式,提出了图书馆提升读者满意度的策略。  相似文献   

16.
罗兰.巴特的著名论文《作者之死》文字不多,但其思想来源却十分复杂:哲学界反理性思想尤其是福柯的"人之死"理论、索绪尔的结构语言学理论和拉康的主体观、法国当时的社会现实等都为"作者之死"理论的提出准备了条件。和福柯、拉康在哲学界高倡"人之死"、"主体死了"相呼应,巴特把矛头指向权力结构在文学批评领域的体现者——作者身上。他宣布了"作者之死",在话语领域中争取实现自己的乌托邦理想。  相似文献   

17.
利用极大值原理证明了对于Rn 中凸域Ω在狄利克莱边界条件下拉普拉斯算子的第一、第二特征值之差成立 :λ2 -λ1≥ π2d2 ,其中d为Ω的直径  相似文献   

18.
会计信息失真问题,是一个长期存在的现实问题。会计信息失真已经对我国国民经济的发展造成了极大的损害。从认识误区的角度对公司会计信息失真的原因进行了理性的思考,探讨了解决的对策。  相似文献   

19.
在知识经济的背景下,图书馆的工作职能将发生显著变革,知识经济时代图书馆将面临新的机遇与挑战。图书馆要适应知识经济的需要,就必须加强自身建设,提高人才素质是决定性因素;网络建设是必由之路;现代化的科学管理是关键环节。  相似文献   

20.
介绍了目前图书馆业务外包的外延和内涵,论述了业务外包之后的图书馆办馆效益,分析了业务外包带来的问题,对业务外包后的图书馆事业可持续发展进行了思考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号