首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 0 毫秒
1.
Unseen handset mismatch is the major source of performance degradation in speaker identification in telecommunication environments. To alleviate the problem, a maximum likelihood a priori knowledge interpolation (ML-AKI)-based handset mismatch compensation approach is proposed. It first collects a set of handset characteristics of seen handsets to use as the a priori knowledge for representing the space of handsets. During evaluation the characteristics of an unknown test handset are optimally estimated by interpolation from the set of the a priori knowledge. Experimental results on the HTIMIT database show that the ML-AKI method can improve the average speaker identification rate from 60.0% to 74.6% as compared with conventional maximum a posteriori-adapted Gaussian mixture models. The proposed ML-AKI method is a promising method for robust speaker identification.  相似文献   

2.
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法. 将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性. 大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%.   相似文献   

3.
根据极大似然原理,推导了滑动平均模型的极大似然参数估计算法.仿真结果说明:当数据长度较大时,提出的方法给出的参数估计精度高于增广最小二乘算法.  相似文献   

4.
Improved MFCC-Based Feature for Robust Speaker Identification   总被引:2,自引:0,他引:2  
The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically degrade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech enhancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experiments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range.  相似文献   

5.
一种三参数Weibull分布极大似然估计的求解方法   总被引:1,自引:0,他引:1  
提出了一种求解极大似然估计的新算法.根据极大似然估计原理求出尺度参数的表达式,把该表达式代入对数似然函数,使对数似然函数中只包含位置参数和形状参数,把求解非线性方程组问题变成了求解满足约束条件的最优化问题,使问题得到了简化.该法具有计算精度高、运算速度快的优点,利用EXCEL的规划求解即可求解,便于工程应用.  相似文献   

6.
基于分块级的模式噪声,提出一种基于最大似然估计的自适应阈值视频被动取证方法.它采用小波去噪和维纳滤波提取传感器的模式噪声,并通过固定大小的滑动窗口,计算分块级的能量梯度、信噪比和相邻帧相同位置块模式噪声的相关性构造特征值向量.在此基础上,采用最大似然估计得到判别篡改区域的自适应阈值.仿真实验结果表明,提出的方法对于复制-粘贴的视频内容篡改取得了较好的取证效果,并且能够对较小区域的篡改进行定位.  相似文献   

7.
提出一种基于鲁棒估计的遥感图像融合方法.该方法首先建立了高分辨率的多光谱图像到低分辨率的多光谱图像和高分辨率的全色图像之间的观测模型,然后在最大后验概率框架下引入鲁棒估计以增强估计的鲁棒性,最后利用阶段非凸和逐次超松弛方法实现了低分辨率的多光谱图像和高分辨率的全色图像之间的融合.鲁棒估计的引入,大大减小了观测噪声对融合结果的影响,而且省去了目标函数中的正则项,使得融合过程更加简单方便.以QuickBird卫星数据为例的实验结果表明,与其他几种常见方法相比,本方法不仅能够提高多光谱图像的空间分辨率,对光谱信息的保持也具有更好的效果.  相似文献   

8.
从最大后验概率估计出发,分析了一类图像恢复变分模型与贝叶斯方法的统一性.将图像的梯度场的分布建模为ε-容许密度类,利用鲁棒统计学中的Hubber定理,导出了一个由二次函数和线性函数分段组成的鲁棒性密度,构造了一个耦合全变差积分和Dirichlet积分的变分模型.讨论了该变分问题的解的存在性,通过一种加权梯度最速下降流的时间步进法迭代求解,应用于图像恢复取得很好的效果.  相似文献   

9.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

10.
针对低信噪比及大多普勒频率变化率情况下的载波同步问题,提出一种基于最大似然估计和Kalman滤波相结合的跟踪环结构.利用最大似然估计在低信噪比环境下准确估计载波频率和相位,并结合Kalman滤波对载波变化进行稳定跟踪.其中利用二分法搜索保证低计算复杂度的同时提高了估计精度.仿真结果表明了此载波跟踪环路良好的跟踪性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号