排序方式: 共有47条查询结果,搜索用时 296 毫秒
21.
矢量泰勒级数是一种有效的抗噪声鲁棒语音识别算法.然而在对数谱域,美尔滤波器组的不同通道之间有较强的相关性,因而难以从含噪语音中准确估计噪声的方差.提出了一种基于矢量泰勒级数的倒谱域特征补偿算法.该算法在倒谱域,用一个高斯混合模型描述语音倒谱特征的分布,通过矢量泰勒级数从含噪语音中估计噪声的均值和方差.实验结果表明,此算法能明显提高语音识别系统的性能,优于基于矢量泰勒级数的对数谱域特征补偿算法. 相似文献
22.
为了解决传统说话人识别系统在集成学习后识别速度变慢且容易过学习的问题,构造了一种基于最大后验矢量量化(VQMAP)模型和自适应提升(AdaBoost)学习算法的说话人识别系统.首先,分析了说话人识别系统中基分类器性能对集成分类器泛化误差的影响.然后,针对说话人的类别数,构造适当精度的VQMAP模型.最后,利用包含提前终止策略的AdaBoost学习算法将该模型提升为强分类器.实验结果表明:该算法的识别速度较高,是最大后验高斯混合模型(GMMMAP)的9倍;该算法可有效控制AdaBoost学习算法在说话人识别中的过学习问题,其性能优于VQMAP模型,且在训练数据较少或者类别数可预计的情况下,其性能可接近甚至超过GMMMAP模型. 相似文献
23.
根据人耳听觉特性,提出新的同步多带最大似然线性回归算法用于噪声环境下语音识别。该算法采用最大似然作为参数估计准则,利用各频带信号同步感知和噪声污染假定的方法进行语音模型补偿,有效地提高了识别系统在噪声环境下的识别性能。 相似文献
24.
一种基于离散时延的鲁棒声源三维定位方法 总被引:1,自引:0,他引:1
为了减少相位变换加权的可控响应功率(SRP-PHAT)声源定位算法的计算量,提出一种基于离散时延的改进算法.该方法首先利用FFT将麦克风阵列的每一帧接受信号变换到频域,然后在频域补零至16倍帧长,再运用IFFT将所有麦克风对的广义互相关函数在搜索之前计算好,从而可大幅度减少计算量.频域补零提高了广义互相关函数的采样率,因而由时延离散带来的定位误差很小.仿真结果表明,无论在远场还是近场条件下,该算法均能将计算量降低一个数量级而保持原算法的鲁棒性. 相似文献
25.
该文提出了一种基于修正倒谱模型的改进的倒谱基音检测算法.该算法首先对分帧语音进行10阶线性预测编码(LPC)分析和逆滤波,获得LPC预测残差;然后对残差信号进行倒谱分析,倒谱分析中采用了离散傅里叶变换频谱的高频分量置零的计算措施;最后根据倒谱的特征求得浊音语音的基音周期.仿真检测结果表明:该算法无论对纯净语音,还是对不同加噪情况下的含噪语音,其基音检测结果都明显优于传统倒谱基音检测算法,并且也明显优于基于平均幅度差函数的基音检测算法,而略优于基于自相关函数的基音检测算法. 相似文献
26.
在用声像法求双耳房间冲激响应的过程中融入了个人化与头相关传递函数,研究了基于个人化双耳房间冲激响应的外部化虚拟声系统.首先通过个人人体参数获取个人化与头相关传递函数,然后用声像法得到前4阶个人化的早期双耳反射声,最后截取前80 ms早期反射声作为个人化双耳房间冲激响应加入到虚拟声系统.主观测听实验结果表明,使用假人双耳房间冲激响应可以改善头中效应而不降低定位精度,而使用个人化双耳房间冲激响应不仅可以改善头中效应,而且可以提高近13%的定位精度. 相似文献
27.
基于隐马尔可夫模型与并行模型组合的特征补偿算法 总被引:1,自引:0,他引:1
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协方差矩阵,使之与识别环境相匹配.最后,根据基于状态转移矩阵压缩的前向后向算法计算隐马尔可夫模型的后验概率,并通过最小均方误差准则估计纯净语音特征向量.实验结果表明,该算法能够更加准确地估计纯净语音特征向量,其性能明显优于基于高斯混合模型的特征补偿算法;状态转移矩阵压缩算法可以在不影响补偿精度的前提下,显著减少前向后向算法的计算量. 相似文献
28.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引:1,自引:0,他引:1
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献
29.
空间听觉与虚拟听觉空间的计算机仿真 总被引:3,自引:0,他引:3
吴镇扬 《东南大学学报(自然科学版)》1995,25(4):143-151
一些科学工作者对人类以及动物听觉的自由声场至耳膜的传递函数进行了测量。他们发现在宽带信号激励的情况下,不同频率分量之间的幅度差异是与声源的方向有关的。这一发现已被用于展现“真实”的三维听觉,称作虚拟听觉空间仿真。 相似文献
30.
AMR与G.729之间的转码算法 总被引:1,自引:1,他引:0
提出了AMR与G.729语音编码标准之间的2种新型转码算法--索引域转码算法和语音域转码算法.它们分别针对具有相同和不同固定码本结构的语音编码标准进行转码.索引域转码算法直接对2个编码的索引值进行相互转换;语音域转码算法则需要在语音域重新对转换的固定码本及增益进行搜索.实验结果表明,这2种转码算法都能有效地降低转码复杂度,语音域转码算法的算法复杂度仅为传统Tandem转码的55%左右,而索引域转码算法的算法复杂度则不到Tandem转码的10%.同时,索引域转码算法的语音质量相对Tandem转码有所提高,而语音域转码算法则保持了约略相当的语音质量. 相似文献