首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

2.
汉语数码语音识别中一种新的抗噪声特征参数   总被引:1,自引:1,他引:0  
为了提高中小词汇量语音识别系统在噪声环境下的识别性能,以10个汉语数码语音为对象,利用汉语数码语音信号区别于噪声信号的准周期特性,提出了一种汉语数码语音频谱包络峰值特性的提取方法,首先用基频对语音频谱采样得到由谐波值构成的包络以提高信噪比,然后再对所得包络进行峰值提取得到汉语数码语音的峰值特征。实验结果表明,在信噪比大于5dB时,用该方法得到的峰值特征具有一定的抗噪性。  相似文献   

3.
研究了噪声对语音信号的干扰规律,利用语音信号的准周期性,较好的提取了含噪语音信号的频谱包络。通过一些改进算法,对包络峰值特征提取方法进行优化,并使用工程数学软件Matlab对此方法进行了模拟计算。结果表明:该方法可以较好的重建被噪声污染的语音谱包络,从而较好的提取到频谱的包络峰值特征。  相似文献   

4.
为了解决语音信号参考独立分量分析(ICA with Reference,ICA-R)算法中参考信号选取难的问题.依据语音信号传播机理和Bessel函数展开系数对语音信号的表征能力,提出了基于Bessel函数展开的语音信号建模方法,利用Bessel函数展开系数作为变换系数,用少量的系数构建ICA-R中的参考信号来实现对期望语音信号的提取,并将该方法运用到语音信号隐藏技术中.仿真实验结果表明该方法能够较好地从混合语音信号中提取期望语音信号,并能有效地实现语音信号的隐藏与恢复.  相似文献   

5.
为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。  相似文献   

6.
甘振业  杨鸿武 《甘肃科技》2010,26(4):34-35,86
介绍了一种基于STRAIGHT语音修改算法的个性化语音的方法。对输入的语音提取基本信息,并进行频谱分析;利用STRAIGHT算法对相关参数进行修改;通过STRAIGHT合成器生成新的个性化的语音。实验结果表明,该方法可以得到高质量的个性化合成语音,MOS得分为4.18分。  相似文献   

7.
针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。  相似文献   

8.
为解决强背景噪声下经验小波变换(EWT)难以准确提取滚动轴承故障特征的问题,提出了一种自适应频率窗EWT方法。首先对轴承故障振动信号进行傅里叶变换,引入一个带宽可变的滑动频率窗对其频谱进行分割;然后利用水循环优化算法(WCA),通过所提出的包络谱谐波噪声比指标,自适应确定滑动频率窗位置;最后进行EWT筛选出最佳的模态分量信号,通过包络解调分析提取轴承故障特征信息。采用所提方法对滚动轴承故障实验信号进行分析,结果表明,该方法可以有效用于滚动轴承微弱故障特征的提取,而传统EWT方法因为受强背景噪声影响较大,无法准确提取故障特征信息。  相似文献   

9.
针对PSOLA算法会引起语音频谱的不连续,从而影响合成语音的质量,提出了一种基于正弦模型的汉语普通话语音基音同步分析和合成算法.首先,将连续的语音信号在时间轴上分为一帧帧短时信号,再把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量,然后根据频率匹配的原则,对相邻两帧信号的幅度和相位进行插值,得到合成信号的正弦分量的幅值和相位,最后将各正弦分量相加,就得到了合成的语音信号.实验结果证明,该方法合成的语音信号的各个正弦波分量的相位和幅值均能平滑过渡,从而可以克服PSOLA算法带来的回声效应,有助于提高合成语音的自然度.  相似文献   

10.
一种基于小波系数方差的语音端点检测方法   总被引:4,自引:1,他引:4  
首先分析讨论了小波变换的原理,在此基础上提出了一种利用小波系数方差识别含噪语音信号中静音与语音的新算法。算法首先对含噪语音进行小波分解,观察各层小波系数的统计特性,提取它们的方差作为检测特征,从而进行语音端点检测。对该算法进行了仿真实验,并与传统的基于能量与过零率的端点检测算法进行了比较。实验结果表明:该算法在低信噪比条件下也能够有效分割语音。  相似文献   

11.
为了提高跨模态人脸表示与合成的性能,针对语音与人脸图像2种模态数据,提出一种基于人脸参数化表示与稠密深度网络相结合的面部生成方法。针对输入语音模态,通过对信号进行频谱变换,将一维时域信号转换到二维频率域,可提取频域上稳健的特征描述;针对输出图像模态,利用主动外观模型对不同面部区域独立建模以降低区域间的相关性,并提取紧凑的人脸参数化特征;为了获得有效的跨模态学习性能,提出采用稠密连接的深度卷积神经网络学习语音、图像2种模态的回归预测,并通过预测的人脸参数进行面部重构,所采用的深度网络模型可以加强特征传播与特征复用,有利于增强面部细节的合成。在2组音视频数据集上验证了提出方法的有效性。  相似文献   

12.
利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人平台对系统进行测试,结果表明,系统识别效果良好,控制者通过语音可以实时控制机器人行动。  相似文献   

13.
随着人工智能行业的不断发展,智能语音问答技术逐步得到国内外学者的广泛关注和研究,但是语音识别方面仍然存在两个技术瓶颈,第一是语音识别系统,第二是根据识别的语音进行问题的回答。基于此,开展了基于深度学习的智能语音问答系统研究。首先介绍了基于隐马尔科夫模型的语音识别系统,然后研究了基于梅尔频率的语音信号特征提取技术,并建立了声学和语言模型,最后研究了基于GRU算法的问答匹配模型,并基于以上模型开发了智能语音问答系统。经实际实验验证分析,文章所提出的算法在语音识别和问答的准确度方面都相比传统算法具有很高的精确度,本算法具有较大的实用价值。  相似文献   

14.
自适应滤波器消除语音信号中混合噪声   总被引:1,自引:0,他引:1  
语音信号在实际采集和传输的过程中,往往掺杂着多种噪声干扰,比较常见的是正弦窄带干扰和高斯白噪声,而一个简单的自适应滤波器往往很难同时滤除多种噪声。为了抑制混合噪声而得到真实的语音信号,在最小均方误差(LMS)自适应算法和自适应噪声抵消原理的基础上,提出了一种两级自适应滤波器方案,第Ⅰ级在传统噪声抵消系统中加入延迟单元消除正弦窄带干扰,第Ⅱ级用LMS自适应噪声抵消器消除高斯白噪声,同时,利用Simulink模块库对所设计的两级自适应滤波器进行了建模仿真。仿真结果表明:该方案滤波器可以有效地滤除包含正弦窄带干扰和高斯白噪声的混合噪声,达到提高语音质量的目的。  相似文献   

15.
随着移动通信系统的广泛应用,低速率语音编码也获得了极大的发展。本文研究了一种基于连续正弦波形(CSW—Continuous Sinusoidal Waveform)的低速率语音编码算法。该算法是一种改进的正弦谐波编码算法,鳊码速率达到2.4kb/s以下。本算法采用叠加一组正弦波的方法来合成语音,这些正弦波的频率是基音频率的整数倍。并采用内核ARM920T(mpu是Samsung公司的S3C241O)对语音编码信号进行处理。  相似文献   

16.
基于语音信号的发音器官运动估计,是根据说话人语音推断发音器官运动过程的技术,在语言学、医学、影视动画学等领域有广阔应用前景.本文主要对基于单元选择模型和回归模型实现该技术的方法进行介绍.单元选择模型法部分阐述了码本库建设、语音单元切分、选择算法设计、拼接合成算法等方面的研究现状.回归模型法部分阐述了此类问题中隐马尔科夫模型、高斯混合模型、人工神经网络等回归算法的研究现状.最后,文章进行了总结和展望.  相似文献   

17.
Facial shape transformation described by facial animation parameters (FAPs) involves the dynamic movement or deformation of eyes, brows, mouth, and lips, while detailed facial appearance concerns the facial textures such as creases, wrinkles, etc. Video-based facial animation exhibits not only facial shape transformation but also detailed appearance updates. In this paper, a novel algorithm for effectively extracting FAPs from video is proposed. Our system adopts the ICA-enforced direct appearance model (DAM) to track faces from video sequences; and then, FAPs are extracted from every frame of the video based on an extended model of Wincandidate 3.1. Facial appearance details are transformed from each frame by mapping an expression ratio image to the original image. We adopt wavelet to synthesize expressive details by combining the low-frequency signals of the original face and high-frequency signals of the expressive face from each frame of the video. Experimental results show that our proposed algorithm is suitable for reproducing realistic, expressive facial animations.  相似文献   

18.
运用Matlab软件,以自己建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能.  相似文献   

19.
利用正弦模型设计一个音乐合成系统 .由于正弦模型具有高效性和灵活性 ,它能够修改合成单元的基音频率、时长等 ,因此本合成系统利用波型拼接的方法来合成音乐 .合成系统中的合成单元由专业歌手发音来形成  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号