共查询到17条相似文献,搜索用时 62 毫秒
1.
连续语音识别中的说话人快速自适应技术 总被引:2,自引:0,他引:2
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。 相似文献
2.
本文对量子力学中的厄米算符的数学结构——本征空间进行了分析,并给出了求解单厄米算符和对易厄米算符的本征值和本征函数的几个有用的性质。 相似文献
3.
基于矩阵线性插值的说话人自适应算法 总被引:1,自引:0,他引:1
语音识别技术中说话人快速自适应技术受到普遍关注。最大似然模型插值 (maxim um likelihood model inter-polation,ML MI)算法是一种有效的快速自适应算法 ,它的主要缺点是需要存储大量的特定人模型。为克服这一缺点 ,该文提出一种改进方法——矩阵线性插值自适应算法。该算法用表示说话人特性的矩阵代替 ML MI中的特定人模型进行线性插值。而插值系数由测试者提供的语音数据按照最大似然准则确定。插值后的线性矩阵与非特定人模型相作用得到最终的说话人自适应模型。该算法大大减少了计算存储量 ,且自适应性能基本与 ML MI相当 相似文献
4.
基于双变量模型的子带自适应滤波方法 总被引:1,自引:0,他引:1
利用贝叶斯最大后验估计理论研究了双变量层间模型、模型的子带自适应参数估计方法,推导了对应的萎缩函数;在此基础上设计了一种子带自适应图像滤波方法,并与两种基于模型的类似算法进行了比较.实验结果表明:利用小波系数层间模型可以有效地改善图像去噪质量. 相似文献
5.
针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。 相似文献
6.
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法. 将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性. 大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%. 相似文献
7.
为了提高语音识别准确率,提出了一种子空间域相关特征变换与融合的语音识别方法(MFCC-BN-TC方法)。该方法提取语音短时谱结构特征(BN)和包络特征(MFCC)分别描述语音短时谱结构和包络信息,并采用域相关特征变换的形式分别对BN和MFCC特征进行特征变换;然后对这种变换进行泛化扩展提出子空间域相关特征变换,以采用不同的时间颗粒度(帧和语音分段)进行多层次区分性特征表达;最后,对多种区分性特征变换后的特征进行联合表征训练声学模型,并给出了区分性特征变换与融合的一般框架。实验结果表明:MFCC-BN-TC方法比采用原始BN特征方法和采用MFCC特征基线系统方法,识别性能各自提高了0.98%和1.62%;融合MFCCBN-TC方法变换以后的语音信号特征,相比于融合原始特征,识别率提升了1.5%。 相似文献
8.
为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性. 相似文献
9.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。 相似文献
10.
多用户检测技术是DS—CDMA中解决多址干扰问题的一种重要技术。针对基于PASTd多用户检测方法在子空间追踪收敛速度慢和收敛的不稳定问题,提出一种快速子空间追踪的盲自适应多用户检测改进算法。该算法通过空间分解得到信号子空间,并利用信号子空间的特征值和特征向量得到解相关多用户检测器;最后,应用归一化正交Oja快速自适应地追踪信号子空间。仿真结果表明,相对PASTd多用户检测方法,降低计算复杂度,加快算法的收敛速度,系统稳定性好,拟制多址干扰具有良好的性能,达到很好的多用户检测效果。 相似文献
11.
最大后验估计和加权近邻回归结合的说话人自适应方法 总被引:1,自引:0,他引:1
提出了一种最大后验 (m aximum a posteriori,MAP)估计和加权近邻回归 (weighted neighbors regression,WNR)相结合的说话人自适应方法。在 MAP自适应中 ,只有自适应数据对应的模型参数可以得到调整。针对这一缺点 ,提出一种基于变换的模型插值 /平滑方法 - WNR,利用模型近邻信息和 MAP自适应结果 ,建立距离加权的回归模型 ,对没有自适应数据的模型完成模型调整。实验证明 ,该方法可以有效地提高 MAP自适应的速度。在自适应数据为 10句时 ,音节误识率降低近 15 % ;而在自适应数据为 2 5 0句时 ,误识率降低 5 0 %以上。此外 ,证明了向量域平滑 (vectorfield sm oothing,VFS)是 WNR方法的一种退化的特例 相似文献
12.
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能. 相似文献
13.
XUXiang-hua ZHUJie 《武汉大学学报:自然科学英文版》2004,9(6):927-930
A transformation matrix linear interpolation (TMLI) approach for speaker adaptation is proposed. TMLI uses the transformation matrixes produced by MLLR from selected training speakers and the testing speaker. With only 3 adaptation sentences, the performance shows a 12.12% word error rate reduction. As the number of adaptation sentences increases, the performance saturates quickly. To improve the behavior of TMLI for large amounts of adaptation data, the TMLI MAP method which combines TMLI with MAP technique is proposed. Experimental results show TMLI MAP achieved better recognition accuracy than MAP and MLLR MAP for both small and large amounts of adaptation data. 相似文献
14.
推导了前向MAP的一种简化形式-F-MAP,并给出了它的两种实用算法:Log-F-MAP和Max-Log-F-MAP,F-MAP与SOVA算法(寄存器交换模式)间有着密切的联系,特别是可将Log-F-MAP看作对SOVA的进一步改进,通过定点仿真,对F-MAP和其他流行SISO算法在Turbo译码中的BER/FER性能进行了比较与分析,得到了译码延迟D的合理值为5~6倍的约束长度。 相似文献
15.
为了降低语音识别系统中噪声的影响,提出了一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4-9个百分点的提高,相对于最大后验概率和本征音方法有更大的提高。 相似文献
16.
为了降低语音识别系统中噪声的影响,提出一种利用隐空间投影算法的模型自适应方法。该方法利用状态间的相关性提取出反映码本和待识别语音共同特性的基矢量。由于语音与噪声是相互独立的,因此,当语音识别系统中有噪声存在时,认为不能用基矢量表示的那部分余量就是噪声。与本征音方法相比,该方法可以有效地降低噪声对语音识别系统的影响。该方法在提取基矢量时利用了自适应数据,并且节省了存储空间。实验结果表明:该方法在噪声环境下相对于最大似然线性回归自适应方法有4~9百分点的提高,相对于最大后验概率和本征音方法有更大的提高。 相似文献
17.
针对正则化MAP (Maximum a Posteriori Probability)超分辨率算法重建结果细节不够清晰,正则化参数选取的鲁棒性较差,运算速度慢等问题,提出基于形态学边缘保持的自适应超分辨率算法.首先基于形态学定义边缘保持算子,该算子能随着迭代过程自适应调整;其次,将该算子作用于超分辨率重建的正则项,从而... 相似文献