首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
为了降低语音识别系统中噪声的影响,提出了一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4-9个百分点的提高,相对于最大后验概率和本征音方法有更大的提高。  相似文献   

2.
为了降低语音识别系统中噪声的影响,提出一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4~9百分点的提高,相对于最大后验概率和本征音方法有更大的提高。  相似文献   

3.
基于矩阵线性插值的说话人自适应算法   总被引:1,自引:0,他引:1  
语音识别技术中说话人快速自适应技术受到普遍关注。最大似然模型插值 (maxim um likelihood model inter-polation,ML MI)算法是一种有效的快速自适应算法 ,它的主要缺点是需要存储大量的特定人模型。为克服这一缺点 ,该文提出一种改进方法——矩阵线性插值自适应算法。该算法用表示说话人特性的矩阵代替 ML MI中的特定人模型进行线性插值。而插值系数由测试者提供的语音数据按照最大似然准则确定。插值后的线性矩阵与非特定人模型相作用得到最终的说话人自适应模型。该算法大大减少了计算存储量 ,且自适应性能基本与 ML MI相当  相似文献   

4.
基于最大互信息的离散隐马尔柯夫模型训练方法   总被引:4,自引:1,他引:3  
在基于隐马尔柯夫模型(HMM)的语音识别系统中,模型训练最常用的算法是Baum-Welch算法,该算法具有快速收敛及保证每步迭代模型的似然概率单调增的优点,但它基于最大似然训练准则,而该准则不能将各个模型很好地分析,这直接导致了识别时的错误,鉴于最大互信息可以克服这一缺点,提出了一种基于最大互信息的训练方法,该方法借助于梯度,调整参数以使模型与训练数据的互信息最大,实验结果表明,使用该方法使系统的识别性能得到了一定的改善。  相似文献   

5.
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法. 将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性. 大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%.   相似文献   

6.
针对空间调制技术提出一种基于M准则的次最优检测算法(M-ML),该算法通过缩小最大似然检测中发送符号搜索空间来降低复杂度.仿真结果显示,在发送天线相关性较高的场景下,M-ML算法可以获得与最大似然检测相当的误码率性能.同时,通过将M-ML算法和最大似然算法进行复杂度比较发现,随着调制阶数与发送天线数的提升,M-ML算法复杂度将不断降低.  相似文献   

7.
本文主要研究了用Hopfield神经网络实时实现最大似然多信号源空间参数估计方法。报传统最大似然信号参数估计的理论和Hopfield连续状态神经网络特性后,给出了一种实现最大似然空间参数估计模型,该神经网络模型的模拟实验结果表明,用Hopfield网络实时实现的信号参数估计方法具有与传统的最大似然参数估计法拥有同样的理论分析结果。  相似文献   

8.
为满足恶劣无线环境下低速率语音通信需要,针对混合激励线性预测(MELP)提出了一种基于信道软译码的差错隐藏算法.利用软译码所得对数似然概率比估计比特错误概率,提出了利用比特错误概率和信源残留冗余,基于最大后验概率(MAP)估计合成端语音清浊音模式.对不同的清浊音模式,选择不同的参数重构方案,浊音帧时,利用对数似然概率比基于最小均方误差(MMSE)准则进行参数重构;清音帧时,硬判决对数似然概率比,由硬判决结果通过映射直接重构参数,在信道编码为递归系统卷积码和并行级联卷积码情况下,采用PESQ测试了提出的差错隐藏算法误码条件下合成语音质量.测试结果表明,与近年来提出的针对MELP的差错隐藏算法相比,该算法具有更好的性能.  相似文献   

9.
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能.  相似文献   

10.
基于参数的贝叶斯先验选择方法   总被引:1,自引:0,他引:1  
在一个参数的可选先验分布类中选择一个合理先验的问题,类似于从参数空间中估计一个恰当参数的问题.基于这一观点,利用贝叶斯分析的后验分布理论,先求出参数的后验分布,再根据后验分布中各个先验的相对似然选取似然最大的先验为合理先验,从而建立了一个基于参数的后验分布的先验选择方法,它是ML-Ⅱ先验的一个拓广.  相似文献   

11.
A transformation matrix linear interpolation (TMLI) approach for speaker adaptation is proposed. TMLI uses the transformation matrixes produced by MLLR from selected training speakers and the testing speaker. With only 3 adaptation sentences, the performance shows a 12.12% word error rate reduction. As the number of adaptation sentences increases, the performance saturates quickly. To improve the behavior of TMLI for large amounts of adaptation data, the TMLI MAP method which combines TMLI with MAP technique is proposed. Experimental results show TMLI MAP achieved better recognition accuracy than MAP and MLLR MAP for both small and large amounts of adaptation data.  相似文献   

12.
最大后验估计和加权近邻回归结合的说话人自适应方法   总被引:1,自引:0,他引:1  
提出了一种最大后验 (m aximum a posteriori,MAP)估计和加权近邻回归 (weighted neighbors regression,WNR)相结合的说话人自适应方法。在 MAP自适应中 ,只有自适应数据对应的模型参数可以得到调整。针对这一缺点 ,提出一种基于变换的模型插值 /平滑方法 - WNR,利用模型近邻信息和 MAP自适应结果 ,建立距离加权的回归模型 ,对没有自适应数据的模型完成模型调整。实验证明 ,该方法可以有效地提高 MAP自适应的速度。在自适应数据为 10句时 ,音节误识率降低近 15 % ;而在自适应数据为 2 5 0句时 ,误识率降低 5 0 %以上。此外 ,证明了向量域平滑 (vectorfield sm oothing,VFS)是 WNR方法的一种退化的特例  相似文献   

13.
该文提出一种改进的基于隐Markov模型(HMM)和Bayes信息准则(BIC)的说话人日志系统。它用来检测会议语音数据中"谁在什么时候说话"。在对说话人模型进行Gauss混合模型(GMM)建模的时候,考虑到用来建模的数据通常会比较短,首先训练一个通用背景模型,然后用最大后验概率(MAP)准则得到相应片段的模型。在NIST 2004年举办的说话人日志评测任务数据集RT-04S上的实验结果表明:该系统与国际主流系统相比有一定的优势。  相似文献   

14.
一种基于梯度的HMM参数重估方法   总被引:1,自引:1,他引:0  
对于隐Markov模型(HMM),经典的参数重估方法是Eaum-Welch算法,该算法基于最大似然准则,具有快速收敛和保证似然度单调增的优点,但是对于其他的训练准则,则不存在这样的算法,由于目标函数的复杂性,在考虑采用梯度方法时,必须先解决如何求取梯度的问题,为此,提出一种求取梯度的实现方法,结果表明,使用该方法所取得的模型与用Baum-Welch算法所得的模型性能相当,而前者适用于基于各种准则的训练方法。  相似文献   

15.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

16.
提出了一种长期演进(LTE)上行链路频偏最大似然(ML)估计算法,并通过定量分析该算法与基于2个训练序列相差的频偏估计算法(相差法)的估计性能,提出了一种联合频偏估计算法.仿真结果表明:与相差法相比,所出提的ML估计算法与联合估计算法的频偏估计范围均能够覆盖高速铁路应用场景中的最大频偏,且ML估计算法不受LTE上行链路跳频传输的影响;在信噪比10 dB且少于4个用户的情况下,2种算法均能够提供10-4或更小的归一化频偏估计均方误差;在单用户情况下,联合估计算法比ML估计算法的均方误差在信噪比上提高了近5 dB.  相似文献   

17.
This paper addresses the problems of parameter estimation of multivariable stationary stochastic systems on the basis of observed output data. The main contribution is to employ the expectation-maximisation (EM) method as a means for computation of the maximum-likelihood (ML) parameter estimation of the system. Closed form of the expectation of the studied system subjected to Gaussian distribution noise is derived and parameter choice that maximizes the expectation is also proposed. This results in an iterative algorithm for parameter estimation and the robust algorithm implementation based on technique of QR-factorization and Cholesky factorization is also discussed. Moreover, algorithmic properties such as non-decreasing likelihood value, necessary and sufficient conditions for the algorithm to arrive at a local stationary parameter, the convergence rate and the factors affecting the convergence rate are analyzed. Simulation study shows that the proposed algorithm has attractive properties such as numerical stability, and avoidance of difficult initial conditions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号