首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
连续语音识别中的说话人快速自适应技术   总被引:2,自引:0,他引:2  
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。  相似文献   

2.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

3.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

4.
本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最大似然准则的做法 ,该算法用最大后验准则以更好地估计参数。实验证明 ,在仅有 1句自适应数据的情况下它即能取得 6 .4 5 %的相对误识率下降 ,自适应速度远快于传统的最大后验方法 ,也不存在最大似然线性回归方法在极少数据量情况下反而造成系统识别性能下降的现象。结果表明该方法并不明显依赖相关子空间的划分数量 ,是一种稳健的自适应方法  相似文献   

5.
基于最大互信息的离散隐马尔柯夫模型训练方法   总被引:4,自引:1,他引:3  
在基于隐马尔柯夫模型(HMM)的语音识别系统中,模型训练最常用的算法是Baum-Welch算法,该算法具有快速收敛及保证每步迭代模型的似然概率单调增的优点,但它基于最大似然训练准则,而该准则不能将各个模型很好地分析,这直接导致了识别时的错误,鉴于最大互信息可以克服这一缺点,提出了一种基于最大互信息的训练方法,该方法借助于梯度,调整参数以使模型与训练数据的互信息最大,实验结果表明,使用该方法使系统的识别性能得到了一定的改善。  相似文献   

6.
研究了VBLAST-OFDM系统基于QR分解的几种信号检测算法,分析了各种算法优缺点,指出信号检测顺序是降低误码率的关键,针对VBLAST算法计算量大的缺点,建议采用SQRD算法,该算法利用迭代运算代替矩阵求逆运算,降低了VBLAST算法的计算量,并采用MMSE准则对该算法进行进一步推广,仿真结果表明采用MMSE-SQRD算法优于除ML(最大似然)算法以外的检测算法.  相似文献   

7.
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能.  相似文献   

8.
提出了一种基于高斯混合模型的语音模板匹配算法.该算法采用快速傅立叶变换、平均过零率分析和高斯混合模型3种方法的加权平均来生成判决门限值.通过比较门限值误差的大小,根据"最大似然准则"给出模板匹配的结果.最后通过一个语音识别的实例验证该算法的可行性.  相似文献   

9.
针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。  相似文献   

10.
在FS-BLAST算法的基础上,提出了一种改进的适用于频率选择性多输入多输出(MIMO)信道的接收方案,该方案采用部分最大似然分层检测,其主要思想是在空时分层检测的基础上,部分地引入最大似然(ML)检测,从而有效地克服FS-BLAST类算法由于误差扩散所导致的系统性能下降的缺点.该方法的特点是仅对接收信号的一部分使用最大似然检测,因此,计算量并没有太大的增加.另外,该方法可以自由地选取进行最大似然检测的信号维数,因此可根据实际系统特点在计算复杂度和误码率性能间选取最优折衷.  相似文献   

11.
A transformation matrix linear interpolation (TMLI) approach for speaker adaptation is proposed. TMLI uses the transformation matrixes produced by MLLR from selected training speakers and the testing speaker. With only 3 adaptation sentences, the performance shows a 12.12% word error rate reduction. As the number of adaptation sentences increases, the performance saturates quickly. To improve the behavior of TMLI for large amounts of adaptation data, the TMLI MAP method which combines TMLI with MAP technique is proposed. Experimental results show TMLI MAP achieved better recognition accuracy than MAP and MLLR MAP for both small and large amounts of adaptation data.  相似文献   

12.
矩阵值有理插值在部分实现问题和系统线性理论的模型简化问题中起重要的作用,顾传青给出了矩阵值有理插值的Lagrange基形式,我们根据基样条插值的性质构造了一种样条型的矩阵值有理插值,这种插值形式避免了高次Lagrange多项式插值的不确定性,给出了一种实用的公式。  相似文献   

13.
Unseen handset mismatch is the major source of performance degradation in speaker identification in telecommunication environments. To alleviate the problem, a maximum likelihood a priori knowledge interpolation (ML-AKI)-based handset mismatch compensation approach is proposed. It first collects a set of handset characteristics of seen handsets to use as the a priori knowledge for representing the space of handsets. During evaluation the characteristics of an unknown test handset are optimally estimated by interpolation from the set of the a priori knowledge. Experimental results on the HTIMIT database show that the ML-AKI method can improve the average speaker identification rate from 60.0% to 74.6% as compared with conventional maximum a posteriori-adapted Gaussian mixture models. The proposed ML-AKI method is a promising method for robust speaker identification.  相似文献   

14.
首先对样本数据运用径向基函数的方法进行理想化插值处理,找到输入输出数据之间的函数关系t=h(x),在考虑高斯噪声干扰的情形下,构造新的能量函数,并使其收敛到稳定态,从而反推出精确插值函数t=y(x);由似然函数变形构造得到误差平方和函数E**作为误差分析函数,结果表明:E**的最小值点(或极小值点)即为似然函数的最大值点(或极大值点),所采用的噪声数据插值处理使得神经网络的整体误差最小。  相似文献   

15.
本文提出了采用分形插值方法对砂体的展布规律进行研究,从全新的角度为油气勘探、开发提供更多的技术支持.分析论证了使用分形插值方法研究砂体展布的可行性,并以塔巴庙地区太原组砂体为例,做出了砂体展布的平面展布图和三维展布图,由此对砂体展布规律进行了预测,结果较符合工程实际.  相似文献   

16.
介绍一种改进的最小偏差法圆弧插补原理及实现方法.此方法具有软件简化、设计新颖、算法明快、节约内存等优点,且具有正偏差特性.实践证明,这是一种较好的圆弧插补方法.  相似文献   

17.
在滑坡地表位移监测过程中,由于设备工作异常或恶劣气候的干扰,原始数据会随机出现长时间序列的缺失,这类数据对滑坡的预警和预测有很大的影响。针对上述问题,文章提出一种基于主成分分析(principal component analysis,PCA)和长短期记忆网络(long short -term memory,LSTM)的数据插补方法。首先利用PCA实现滑坡监测数据的降维和特征提取,消除数据间的相关性,然后建立基于LSTM的地表位移监测数据插补模型,对缺失数据进行插补。实验结果表明:该模型与BP(Back Propagation,BP)神经网络等其他几种机器学习插补模型相比,平均绝对误差、均方根误差和平均绝对百分比误差分别为0.523、1.233和0.009,均优于其他几种模型;该模型能够较好的解决地表位移长时间序列数据缺失的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号