首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于目标声源方位已知的双麦克风噪声抑制   总被引:1,自引:0,他引:1  
复杂噪声抑制是语音技术实用化的基础。很多应用中,目标说话人的方位相对固定,而噪声的类型、个数、位置均是未知的,且可能随时间变化。针对这类应用,该文提出一种基于语音信号时频分布稀疏性的半盲双麦克风噪声抑制方法。首先假定说话人方位已知且固定,并根据方位关系建立其空间方位模型,实际噪声的空间方位模型根据观测数据在目标说话人空间方位模型上自适应得到;然后对每个时频点进行分类,并建立二元掩膜;最后利用二元掩膜重构目标语音。实验结果显示:该方法在复杂噪声环境下仍具有显著的降噪效果,且语音失真度较低,其降噪性能接近于噪声源方位已知下的非盲降噪方法。  相似文献   

2.
语音信号处理是欠定盲源分离的一个重要研究领域。本文基于混合语音的基本模型,分析并讨论了两种欠定盲源分离方法在语音信号处理中的应用思路。欠定混合语音信号分离更接近实际情况,有着重要的研究意义。  相似文献   

3.
研究基于二进制时频掩码和ICA的欠定语音盲分离.首先对混叠语音进行时频变换;然后利用二进制时频掩码技术从混叠信号的时频信息中消除掉一个源信号,将欠定的盲源分离问题转变成正定的盲源分离;最后,将消除后的混叠信号变换回时域,再利用ICA技术进行分离.利用本方案进行欠定语音分离,可以大大消除因二进制时频掩码带来的音乐噪声,能够达到很好的分离.  相似文献   

4.
一种基于粒子滤波的双模态语音提取方法   总被引:1,自引:0,他引:1  
说话入的唇动信息有助于加强对语音的感知.根据说话人语音的双模态特性,将振动信息引入语音提取问题,提出了一种基于粒子滤波的贝叶斯融合架构的双模态语音提取方法.该方法融合说话人的语音和唇动信息,根据信息论中的最大互信息准则与盲源分离中的高阶统计量准则.将音视频互信息与语音峭度的乘积作为代价函数,利用粒子滤波估计混合矩阵.解决时变瞬时混合情况下的语音提取问题.仿真结果表明.该方法在低信噪比情况下仍然能够实现语音信号的有效提取.  相似文献   

5.
为了在欠定条件下实现语音盲源分离,该文首先利用势函数估计源信号的个数和混叠矩阵,在估计势函数曲线时对其做平滑处理,以提高源信号个数估计的准确性.在语音信号分离部分,提出了一种改进的最短路径法,该方法对混叠信号各时频单元进行分类处理,避免了最短路径法中对每个时频单元进行矩阵求逆运算,在大大减少计算量的同时也降低了分离信号的背景噪声.最后给出了仿真实验,实验结果证明了该算法的可行性和优异性.  相似文献   

6.
针对目前欠定盲源信号分离在源信号不充分稀疏的情况下分离精度较低的问题,提出一种基于压缩感知和优化算法的欠定盲源信号分离方法.首先分析了欠定盲源信号分离和压缩感知问题的等价性,并建立基于压缩感知的欠定盲源信号分离的数学模型;然后以分离信号的稀疏性和互相关性来建立目标函数,并通过使用压缩感知和优化算法来实现欠定盲源信号的分离;最后对语音信号进行了仿真实验.实验结果表明,在源信号不充分稀疏的情况下,利用这种方法得到的分离信号与源信号的平均相似系数为0.990 3,由此可见这种方法是一种有效的、分离精度较高的分离方法.这也为欠定盲源信号分离问题的研究提供了一种新的途径和手段.  相似文献   

7.
基于两路人体心声信号的专用检测平台,提出了一种针对双声道心音信号的欠定盲分离方法。首先对数据点进行频域聚类计算,利用观测信号中稀疏信号所表现出的特征对源信号个数进行分析,以实现对混叠矩阵的估计;然后根据观测信号的散列图分离出其中一路或多路源信号,从而使观测信号变为适定或者超定;最后用现有的适定或者超定盲分离方法分离剩余源信号。分别对一组人工混合信号和实际检测的双声道心声信号进行欠定盲分离实验,验证了本方法的有效性和可行性。  相似文献   

8.
单信道盲源分离是盲信号分离的重要研究方向.针对单信道线性混合语音信号一次分离后不能完全消除干扰语音的问题,提出了基于子频率分量高斯混合模型与贝叶斯理论的多次盲源分离方法.首先,对源语音的子频率分量分别进行训练,建立高斯混合模型;然后,应用贝叶斯理论从混合语音中首次分离源语音,并针对一次分离后目标语音中仍混有干扰语音的问题采取多次分离的方法,实现尽可能的彻底分离.实验结果表明,这种方法取得了良好的分离效果.  相似文献   

9.
本文提出了一种用自适应滤波器对语音的混声进行分离的方法。该方法根据自适应消噪原理,利用两只传声器采集多个说话人的混合语音,进行分离试验。试验结果证实了本系统能够对其中所需的说话人的语音信噪比和可懂度有一定程度的改善。  相似文献   

10.
扩展联合对角化算法及其在语音分离中的应用   总被引:2,自引:0,他引:2  
用扩展联合对角化(JADE)算法对混合语音信号进行盲源分离,并对分离前后的语音信号的波形和频谱进行了分析比较.实验表明,JADE算法在混合语音信号的分离中是有效的.  相似文献   

11.
随着人工智能物联网(artificial intelligence & internet of things, AIoT)的发展, 硬件技术的飞速进步, 更多的智能音箱进入人们的生活, 人机交互方式也从早期的遥控变成了人声控制. 但设备中麦克风采集到的语音信号往往含有大量噪声和干扰人声, 为此需对麦克风采集到的语音进行语音分离处理. 常用的技术有频域独立成分分析(independent component analysis, ICA), 但是频域ICA存在次序不确定性问题, 即将分离出的源1分量分类到源2通道, 将分离出的源2分量分类到源1通道, 从而导致分离性能大大降低. 为此, 提出一种基于语音能量比来解决频域ICA中次序不确定性问题的算法, 有效地提高了分离性能. 在SiSEC(Signal Separation Evaluation Campaign)、ChiME(Challenge for Computational Hearing in Multisoure Environments)数据集上对分离性能进行实验, 所得结果比已有算法均有提升, 且针对强混响环境下的混合信号依然保持良好的分离性能.  相似文献   

12.
目前基于纯净语音信号的语音识别系统和说话人识别系统都已达到了很高的识别率,但是当信号中含有噪声,特别是含有语音噪声时,识别率就会大大降低.解决这一问题的关键是实现语音与噪声的自动分离.考虑到语音信号的非平稳特性,把时域去相关的思想推广到频域,提出了频域去相关算法,实验结果显示了算法的有效性.  相似文献   

13.
Directional speech enhancement of signals from microphone arrays is an effective way to improve speech recognition for cochlear implant users.The strict implant size limitation results in a short distance between microphones.The fractional delay problem due to the short distance between microphones is solved by a maximal flat (Maxflat) finite impulse response (FIR) filter,using the Maxflat error criteria at a low frequency containing most of the speech information and energy.The fractional Maxflat FIR filter approximates the ideal digital fractional filter at the magnitude response,phase response,and phase delay characteristics,and is also very low order.The results demonstrate that the Maxflat FIR filter accurately and effectively solves the fractional digital delay and is very suitable for real-time speech processing in practical cochlear implant products.  相似文献   

14.
论辩的强大攻击力不仅仅需要缜密的逻辑思维能力的支撑,还离不开论辩者出色的语言表达能力。辞格作为一种修辞手段与论辩有着密切的联系。辞格具有论辩功能,无论是日常生活中轻松诙谐的论辩,还是正式场合下紧张严肃的辩论,都因辞格的参与而精彩。辞格的恰当使用能够大大增强论辩效果。  相似文献   

15.
以超完备基的独立分量分析(Overcomplete ICA)为信道模型,采用自然梯度和最短路径的算法和提出的基于小波变换的Overcomplete ICA算法进行欠通道混叠语音盲分离,两者进行了比较.结果表明,该算法能够成功地分离混叠语音数据.  相似文献   

16.
Limits on bilingualism   总被引:1,自引:0,他引:1  
A Cutler  J Mehler  D Norris  J Segui 《Nature》1989,340(6230):229-230
Speech, in any language, is continuous; speakers provide few reliable cues to the boundaries of words, phrases, or ther meaningful units. To understand speech, listeners must divide the continuous speech stream into portions that correspond to such units. This segmentation process is so basic to human language comprehension that psycholinguists long assumed that all speakers would do it in the same way. In previous research, however, we reported that segmentation routines can be language-specific: speakers of English do not. French has relatively clear syllable boundaries and syllable-based timing patterns, whereas English has relatively unclear syllable boundaries and stress-based timing; thus syllabic segmentation would work more efficiently in the comprehension of French than in the comprehension of English. Our present study suggests that at this level of language processing, there are limits to bilingualism: a bilingual speaker has one and only one basic language.  相似文献   

17.
在模拟英国议会制辩论中经常困扰论辩双方的问题是如何确立论辩要素,即辩论的焦点问题。文章运用内容分析法对国际知名辩手和裁判撰写的辩论稿中常见的论辩要素进行分析研究。结果显示:常见的论辩要素有五个,依次为方案的合理性、方案的后果、方案的有效性、对问题的深度分析和问题。  相似文献   

18.
Mesgarani N  Chang EF 《Nature》2012,485(7397):233-236
Humans possess a remarkable ability to attend to a single speaker's voice in a multi-talker background. How the auditory system manages to extract intelligible speech under such acoustically complex and adverse listening conditions is not known, and, indeed, it is not clear how attended speech is internally represented. Here, using multi-electrode surface recordings from the cortex of subjects engaged in a listening task with two simultaneous speakers, we demonstrate that population responses in non-primary human auditory cortex encode critical features of attended speech: speech spectrograms reconstructed based on cortical responses to the mixture of speakers reveal the salient spectral and temporal features of the attended speaker, as if subjects were listening to that speaker alone. A simple classifier trained solely on examples of single speakers can decode both attended words and speaker identity. We find that task performance is well predicted by a rapid increase in attention-modulated neural selectivity across both single-electrode and population-level cortical responses. These findings demonstrate that the cortical representation of speech does not merely reflect the external acoustic environment, but instead gives rise to the perceptual aspects relevant for the listener's intended goal.  相似文献   

19.
基于麦克风阵列的语音信号实时时延估计   总被引:2,自引:0,他引:2  
为了更好地利用麦克风阵列定位语音信号,得到更高的定位精度,研究了时延估计算法的构成方法与性能特征,分析了定位过程中误差的产生原因与环境,提出了切实可行的减小或消除相应误差的办法。该算法利用同一语音信号分别到达各麦克风的时间差,进行关系换算。利用Matlab在电脑上仿真的定位结果表明,该修改方法能大大改善定位的准确性,提高时延估计算法在实际应用中的利用率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号