首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对单通道语音增强问题,基于计算听觉场景分析(CASA)的原理,提出了一种基于CASA计算模型的语音增强改进算法。该算法在特征提取中选择了目标语音有效能量、信道互相关等特征,对语谱能量和互相关特征的阈值选取进行了改进。在5种低信噪比噪声干扰条件下的仿真实验结果证明,该算法输出增强语音的信噪比平均提高了9.32dB,有效地抑制了噪声。  相似文献   

2.
基于计算听觉场景分析(Computational Auditory Scene Analysis,CASA)的语音分离系统通过模拟人耳的听觉感知系统对混合信号进行处理并分离出感兴趣的目标语音,近年来得到了很大的发展。如何在干扰噪声存在的情况下进行正确的基音提取跟踪一直是CASA系统研究的重点。提出了一种基于目标语音源的改进基音跟踪算法。该算法通过对目标源估计和基音检测两个步骤的反复迭代计算,得到最终的基音轨迹。通过在不同噪声干扰条件下与传统基音跟踪算法对比的实验结果证明,该算法能够有效地抑制噪声,提高输出语音的信噪比和语音质量。  相似文献   

3.
针对近讲场景,提出一种双麦克近讲语音增强算法。该算法基于耳间延时差(ITD)、耳间强度差(IID)特征来区分目标语音,利用声学掩蔽效应,实现目标语音对背景噪声的分离降噪。与传统的单麦克增强方法相比,该算法可消除多种类型噪声且对语音造成的损伤较小。实验表明:该算法能将8~33dB的白噪声、音乐噪声、广播噪声3种噪声类型的带噪语音的信噪比提高到36dB以上,同时保持较高的目标语音可懂度。对于冲击噪声的带噪语音也具有较好的降噪效果。  相似文献   

4.
相干谱在剩余曲率偏移速度分析中,是判别速度是否正确以及求取速度更新量的重要工具。然而利用SU相干公式计算的相干谱,对小幅度相干成分和大幅度相干成分缺乏足够的分辨能力,降低了在相干谱上拾取的准确度。基于"使相干值的大小反映信号的能量(幅度)"的思想,采用"幅度归一化"的措施进行了改进,使相干谱中能量团更集中,更能反映主要反射层位,提高了在相干谱中信息拾取的准确度。  相似文献   

5.
6.
一种基于功率因数补偿的谱相减算法改进   总被引:1,自引:0,他引:1  
对带噪语音进行传统谱减增强后,会引入"音乐噪声",并造成语售可懂度急剧下降.针对这一缺点,本文提出了一种采用功率因数补偿的过减形式的谱相减算法,以提高语音可懂度.采用MATLAB对算法进行了仿真,仿真结果表明:该算法有效的抑制了背景噪声、减少了"音乐噪声",比传统谱相减算法有较大优越性.  相似文献   

7.
基于听觉现象分析(CASA)模型的基本原理,在仅有单通道输入混合语音信号时,采用振荡器神经网络,提出了一种CASA改进模型语音分离算法结构,文中利用一个实例说明了新算法的具体实现步骤,讨论了新算法机构中语音听觉外围处理部分和分割神经网络处理部分,通过上述两个部分的处理可以将输入混合语音信号在时频域上分割为若干有听觉感知意义的语音听觉感知成分分段Segments,以便于新算法后续处理分部中语音Segments的聚为和分离重构输出处理,最终完成语音分离任务。  相似文献   

8.
9.
针对现有语音增强算法在低信噪比(SNR)非平稳噪声环境下的表现并不理想这一问题,提出了一种基于深度学习的语音增强算法.首先,构建了一个深度神经网络(DNN),然后从四个不同分辨率的耳蜗中提取了多分辨率听觉倒谱系数(MRACC)作为神经网络的输入,该系数既关注了细节的高分辨率特征,又把握了全局性的低分辨率特征;其次,跟踪噪声变化构建了一个自适应掩蔽阈值(AM)作为神经网络的训练目标,该阈值能够依据噪声调节理想二值掩蔽(IBM)和理想软掩蔽(IRM)的权重;最后,将估计的自适应掩蔽阈值用于对含噪语音进行增强.实验结果表明:相较于对比算法,该算法不仅可以进一步提高语音质量和可懂度,而且能够抑制更多的噪声.  相似文献   

10.
基于听觉现象分析计算模型 ( CASA)的基本原理 ,对仅有单通道输入混合语音信号时 ,采用振荡器神经网络 ,提出了一种 CASA计算模型语音分离算法结构 .利用实例说明了算法的具体实现步骤和参数设置 .讨论了该算法结构中各语音听觉感知成分 Segments的聚类过程和对分离输出语音的重构处理部分 ,以及如何采用合适的听觉感知成分聚类规则设计相应的聚类神经网络 ,以完成对应不同输入独立语音源信号的各 Segments的聚类 ,从而实现语音分离任务  相似文献   

11.
从CT和MRI设备中获取的三维体积图像,允许我们对三维解剖结构进行任意的观察。一般主动漫游的路径计算方法,都是基于中轴提取等算法的。本文在光线跟踪模型进行绘制的基础上,提出了一种基于深度场景分析的路径计算方法,通过交互选择得到了沿管状器官内部进行漫游的路径,并将其应用到了虚拟内窥镜系统当中。  相似文献   

12.
基于动力学仿真的后桥壳改进设计计算   总被引:4,自引:0,他引:4  
某越野车后桥改型后进行台架试验,其桥壳发生了断裂.为了解决此问题,应用ADAMS仿真软件,建立了后悬架动力学模型.然后采用后轮道路载荷谱作为输入载荷,再进行仿真分析,得到了最大峰值载荷时各连接点处的载荷.采用有限元方法对该车后桥壳结构强度、刚度进行计算分析,发现了桥壳断裂的原因,并对其进行了改进设计.改进设计后的后桥壳经台架试验再无断裂现象.  相似文献   

13.
现有的语音盲分离算法都是针对说话人个数已知且在分离过程中恒定的情况,现实中说话人个数是时变的,提出仅用2个麦克风对说话人个数时变的语音信号进行盲分离的方法,不仅能反映说话人个数时变的过程,而且解决了麦克风与说话人之间个数差异引起的超定、欠定问题。  相似文献   

14.
目标库(object bank,OB)方法是一种使用了高水平语义特征的场景分类方法。针对OB方法使用过高维数的特征向量来表征图像的缺点,提出一种基于Fisher权重改进的OB方法。通过对没有进行空间金字塔处理的OB方法中的低维特征向量加以Fisher权重,使得新得到的特征向量具有极大化类间数据差异并且极小化类内数据差异的性质。实验表明,该方法与OB方法相比在分类效率上提高了10倍以上,并在分类的准确率上提高了3%左右。  相似文献   

15.
从基于麦克风阵列和基于人耳听觉机理两个方面综述了当前机器人听觉定位跟踪声源目标的研究动态和发展方向.首先回顾了机器人听觉定位声源的研究历史;其次讨论了两种系统的优缺点;最后指出了未来机器人听觉定位跟踪声源的发展趋势.基于麦克风阵列的声源定位系统,盲波束形成技术是未来进一步研究内容.而基于人耳听觉机理的声源定位系统,运用计算听觉场景分析建立声源定位模型将是未来热点研究内容.  相似文献   

16.
将盲源分离理论应用于数字音频水印技术,以达到在宿主信号未知的情况下分离出嵌入水印信号的目的;把生成混沌序列的初始值和宿主信号的时、频掩蔽信号作为密钥信息,生成嵌入水印信号,充分保证了水印检测的安全性;引入人类听觉系统(human auditory system,HAS)掩蔽效应的概念,使嵌入水印信号完全自适应于宿主信号,以提高算法的鲁棒性.实验结果表明,嵌入水印的音频信号没有明显的听觉失真,满足了音频水印不可听性的要求;经过低通滤波、重采样、添加噪声、剪切和mp3压缩等攻击后,嵌入水印信号和分离出的水印信号之间的相关函数较进行频域和时域掩蔽作用之前,具有更加明显的二值分布特征,算法的鲁棒性明显优于掩蔽作用之前;同时,该方法无需外加同步信息,就可以取得良好的同步效果.  相似文献   

17.
服务场景是服务产品的重要组成部分,对顾客的消费体验有显著的影响.提出了一种基于感性工学的服务场景设计方法,利用该方法可以获得消费者的感性需求与服务场景设计要素之间的关系、探索最佳的服务场景设计要素组合.以服务管理中的等候场景设计为例,探讨了等候场景的感性词汇空间和场景设计空间的建立、基于感性词汇的场景样本评价、感性词汇与场景设计要素关系的分析等关于等候场景设计的具体问题,证实了所提出方法的合理性和有效性.  相似文献   

18.
为满足无人驾驶车辆对越野环境的适应能力,提高无人驾驶车辆对环境的理解能力,必须对环境感知层面提出更高的要求.而环境感知中最为关键的一点就是车道线提取或者路面提取.与城市环境下的结构化道路相比,越野环境下的路面提取更加复杂.综合对多种越野场景展开研究,提出了一种能够自适应场景变化的路面分割方法.文中在越野环境下采集了大量的数据,并且制作了相应的数据集;应用深度学习技术对这些场景进行识别;应用语义分割算法对不同场景下的路面进行分割;最后统一了整个算法模块,给出测试结果.   相似文献   

19.
基于改进CamShift的多场景接力跟踪   总被引:1,自引:0,他引:1  
为解决多场景多摄像机下目标接力跟踪问题,减少因场景、光照、视角、遮挡等变化引起的目标丢失,构建了基于CamShift算法的多颜色模型空间,并用多目标规划最优求解法获得最优组合,以减少场景转换给目标追踪带来的干扰;并利用IIR滤波器、加速度位移方程、二阶矩阵等对目标位置、速度、旋转角度等进行预测.大量实验表明,该方法能够在无人值守的情况下,对多个摄像机视频录像中的目标进行自动搜索和跟踪,跟踪效率较高,鲁棒性较强.  相似文献   

20.
选取ETSI语音增强系统作为研究对象.该系统使用传统维纳滤波方法,在信噪比较高时降噪性能优秀,但在信噪比较低的情况下,降噪能力弱,对于脉冲噪声无较好抑制.而模拟人耳听觉特性的计算听觉场景分析技术能够比较好地弥补这一缺陷.故在ETSI算法的基础上,结合计算听觉场景分析技术,提出一种新的算法,将维纳滤波器参数估计由原本的Mel域变换到Gammatone域,并进一步利用理想率掩蔽估计对带噪信号进行信噪分离,抑制脉冲噪声.该算法在TIMIT语音库上进行了实验,结果证明,与原算法相比,提出的新算法使听觉质量在低信噪比下提升较大,脉冲噪声抑制亦明显.在低信噪比的情况下,后端语音识别系统的识别率得到提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号