首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对非对称语料库情况下的语音转换,提出了一种基于混合Gauss归一化的语音转换方法。通过背景说话人模型,分别自适应训练得到源说话人和目标说话人模型。利用训练得到的模型自适应参数,提出了基于Gauss归一化的特征映射方法,为了进一步提高转换效果,进而提出了混合Gauss归一化的方法。针对说话人模型中未被更新的参数,采用KL散度(Kullback-Leibler divergence)方法进行了优化。最后通过主客观实验对提出的算法的有效性进行了仿真和验证。实验结果表明:该文提出的基于混合Gauss归一化的语音转换方法,在倒谱失真度、转换语音的目标倾向度以及感知质量上,都获得了接近基于对称语音库的传统Gauss混合模型(Gaussian mixture model,GMM)方法的效果。  相似文献   

2.
针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。  相似文献   

3.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

4.
变异特征加权的异常语音说话人识别算法   总被引:1,自引:1,他引:0  
常用的加权算法难以跟踪非常态语音特征的变异,为此,文中提出了一种变异特征加权的异常语音说话人识别算法.首先统计大量正常语音各阶MFCC特征的概率分布,建立正常语音特征模板;然后用测试语音特征与正常语音特征模板之间的K-L距离和欧氏距离来度量语音的变异程度,确定K-L加权因子和欧氏加权因子;最后利用加权因子对测试语音的MFCC特征进行加权,并将加权后的特征输入高斯混合模型进行异常语音说话人识别.实验结果表明,文中提出的K-L加权和欧氏加权的异常语音说话人识别算法的整体识别率分别为46.61%和42.25%,而基于各阶特征对说话人识别贡献的加权算法和不加权算法的整体识别率分别为39.68%和36.36%.  相似文献   

5.
基于矩阵线性插值的说话人自适应算法   总被引:1,自引:0,他引:1  
语音识别技术中说话人快速自适应技术受到普遍关注。最大似然模型插值 (maxim um likelihood model inter-polation,ML MI)算法是一种有效的快速自适应算法 ,它的主要缺点是需要存储大量的特定人模型。为克服这一缺点 ,该文提出一种改进方法——矩阵线性插值自适应算法。该算法用表示说话人特性的矩阵代替 ML MI中的特定人模型进行线性插值。而插值系数由测试者提供的语音数据按照最大似然准则确定。插值后的线性矩阵与非特定人模型相作用得到最终的说话人自适应模型。该算法大大减少了计算存储量 ,且自适应性能基本与 ML MI相当  相似文献   

6.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

7.
为解决文本无关说话人识别中训练与识别环境不同导致模式失配的问题,提出了一种采用语音增强模块进行前端预处理的i-向量说话人识别系统,从而提高系统对于环境噪声的鲁棒性.为评估不同语音增强算法的性能,利用NIST08核心测试集进行仿真实验.采用IMCRA算法对语音进行噪声估计后,分别用维纳滤波法、MMSE-LSA、传统谱减法和多频带谱减法等4种方法进行语音增强前端处理,在基于i-向量的说话人识别系统下进行实验.实验结果表明采用了语音增强的系统具有一定抗噪声性能,并且在高信噪比条件下,基于多频带的谱减法在此系统下性能最佳,而低信噪比情况下MMSE-LSA算法更有优势.  相似文献   

8.
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98.  相似文献   

9.
为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法.  相似文献   

10.
连续语音识别中的说话人快速自适应技术   总被引:2,自引:0,他引:2  
语音识别技术中说话人快速自适应技术受到普遍关注。该文综述了说话人快速自适应技术在国际上的研究现状 ,并且介绍了本研究组提出的快速自适应方法 ,即最大似然模型插值快速自适应框架及插值算法。与现有的相关自适应方法相比 ,该算法在更复杂的识别系统上同时实现了均值和协方差的自适应 ,并取得较好的自适应效果。当仅有一句自适应数据时 ,识别系统的误识率从 2 8.75 %下降到2 4 .93%。  相似文献   

11.
本征音自适应是一种快速自适应算法 ,它根据对说话人矢量全空间的本征分析指导参数更新。该文提出一种基于子空间分析的本征音自适应算法 ,并且不同于一般本征音自适应采用最大似然准则的做法 ,该算法用最大后验准则以更好地估计参数。实验证明 ,在仅有 1句自适应数据的情况下它即能取得 6 .4 5 %的相对误识率下降 ,自适应速度远快于传统的最大后验方法 ,也不存在最大似然线性回归方法在极少数据量情况下反而造成系统识别性能下降的现象。结果表明该方法并不明显依赖相关子空间的划分数量 ,是一种稳健的自适应方法  相似文献   

12.
In a coordinated multipoint transmission system with centralized architecture for saving power consumption, total power metric is minimized while completely using the backhaul capacity and maintaining the minimum target data rate. The problem is formulated as a mixed integer optimization problem, which is difficult to solve. To overcome this problem, a joint user selection and rate adaptation scheme is developed based on the water-filling rate adaptation with the given user set and the power saving criterion with the allocated rates.Numerical results demonstrate that compared with the norm-based and semi-orthogonal user selection algorithms,the proposed algorithm can significantly reduce the total power consumption. The proposed algorithm can also achieve near-optimal performance compared with the performance achieved by the exhaustive search-based method. In addition, the computational complexity of the proposed algorithm is reduced by heuristic iteration and search scope shrinking.  相似文献   

13.
群体智能优化算法Memetic算法(Memetic Algorithm,MA)采用进化算法的操作流程,引入局部搜索算子,使其在问题的求解中保证较高收敛性能的同时又能获得较高质量的解,克服了遗传算法等传统全局优化算法易"早熟"的问题,同时避免陷入局部解。在MA框架基础上,提出了全局动态适应MA算法,采用遗传算法为全局搜索算子,k-means算法为局部搜索算子。使用Java语言实现算法并对UCI中分类实验数据集进行测试,结果表明,将遗传算法和k-means结合的全局动态适应MA在分类问题中具有较高准确率。  相似文献   

14.
针对复杂电磁干扰背景下相干信源二维波达方向的快速估计问题,根据垂直阵列系统特点,利用单次快拍数据在3个不同维度构造了数据矩阵实现解相干,并结合ESPRIT算法实现了二维DOA的快速估计. 该算法仅利用单次快拍数据,不需要进行协方差矩阵的计算,并将二维DOA估计问题转化为3个一维DOA估计,可同时在3个维度并行处理,因此运算量大大降低,利于工程实现. 针对算法存在阵列孔径损失和仅采用一次快拍数据量导致的估计误差偏大问题,利用非圆信号特征和同相位数据叠加,改善了算法的估计性能,提高了阵列自由度. 数值仿真验证了本文算法及提高估计精度对策的有效性.   相似文献   

15.
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法. 将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性. 大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%.   相似文献   

16.
引入定义在混合代数和三角多项式空间的5阶NUAT B样条,建立基于IIk模型的改进型反褶积算法.结果表明:改进型反褶积算法继承了IIk算法的稳定性,加强了IIk反褶积算法对弧度的适应性;相对于目前存在的变流量反褶积方法,改进的算法不仅对常见的试井数据具有高度的精确性和适应性,而且可得到更多更准确的地层资料,能够消除叠加...  相似文献   

17.
本文基于单线激光雷达提出了一种对于草丛障碍物的识别方法。首先对草丛特征进行分析,阐述了草丛障碍物与其他连续体障碍物的特征区别,由特征分析提出了一种多阈值草丛特征识别算法,通过候选框对单线激光雷达点云识别保留,最后通过试验进行验证该多阈值草丛识别方法。试验结果表明该算法能够充分利用单线激光雷达点云数据量小、计算时间短、鲁棒性强等优点,弥补了特殊环境下视觉识别适应性差、识别失效等问题,更好地发挥了单线激光雷达的作用。  相似文献   

18.
为了解决海量空间数据的快速网络分析,在分析Dijkstra算法缺点的基础上,提出并详细介绍了一种基于Dijkstra算法的优化算法-邻接结点算法,该算法充分利用了网络拓扑信息中的弧段的连接关系,避免了使用含有大量无穷值的关联矩阵,结果表明:该优化算法可以节约大量的内存,适合海量数据的网络分析.实践证明,该算法对于结点数比较大的网络具有较好的适用性.  相似文献   

19.
针对传统的基于密度的局部离群点检测算法对原始数据集没有进行预处理导致该算法在面对未知数据集时检测效果不理想,又由于其需要计算每一个数据点的离群因子,在数据量过多时,计算量大大增加的问题,通过对局部离群点检测算法的分析,提出了一种基于目标函数的局部离群点检测方法FOLOF(FCM objective function-based LOF).首先,使用肘部法则确定数据集的最佳聚类个数;然后,通过FCM的目标函数对数据集进行剪枝,得到离群点候选集;最后,利用加权局部离群因子检测算法计算候选集中每个点的离群程度.利用该方法在人工数据集和UCI数据集上进行了相关实验,并与其他相关方法进行了对比,结果显示,该算法能够提高离群点检测精度,减少计算量,有效提高离群点检测性能.  相似文献   

20.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号