排序方式: 共有26条查询结果,搜索用时 15 毫秒
1.
提出了1种基于变分自编码器和辅助分类器生成对抗网络的语音转换方法,实现了非平行文本条件下多对多的高质量语音转换.在该方法中,利用辅助分类器生成对抗网络替代基于变分自编码器和生成对抗网络模型中的Wasserstein生成对抗网络.由于辅助分类器生成对抗网络将特征样本的类别标签作为辅助信息,其鉴别器不仅能预测样本真假,还能预测生成样本所属的类别,从而提高了生成对抗网络的生成效果.充分的客观和主观评价表明:本文提出的方法明显优于基准模型,在显著改善语音质量的同时也有效提升了说话人个性的相似度. 相似文献
2.
讨论了如何通过大学生数学建模竞赛来培养和提高大学生创新能力的问题。基于对一些经典赛题的分析,阐述了赛前准备、模型假设、模型建立和模型求解这四个具体实践过程对大学生创新能力的培养和提高的作用,说明大学生建模竞赛对大学生创新能力的培养和提高起到了非常重要的作用,应该让更多的大学生认识并参与到全国大学生数学建模竞赛这个活动中来. 相似文献
3.
从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。 相似文献
4.
5.
音乐速度谱图是基于内容的音乐信息检索研究领域的一种中间层次的重要的特征信息,广泛应用于音乐速度估计、节拍跟踪、节奏识别等.本文提出一种新型音乐速度谱图生成算法,该算法首先基于音乐速度创建母原子,构成冗余字典,然后运用匹配追踪算法计算音乐速度的系数,生成音乐速度谱图.该算法生成的音乐速度谱图相对现有的自相关函数法和傅里叶变换法具有更高的音乐速度分辨率、更强的稀疏性.最后分析了该算法的特性,并运用一个简单示例说明了算法的应用. 相似文献
6.
该文提出了一种适于说话人辨认的自适应频率尺度变换,基于说话人信息在不同频带中的非均匀分布性质,通过F比衡量不同频率子带对说话人信息的贡献大小,设计自适应频率滤波器,提高贡献大的频带的频率分辨率,降低贡献小的频带的频率分辨率,提取鉴别性特征DFCC。干净语音环境下,不同测试文件的实验表明,该文提出的DFCC特征的识别率比传统MFCC特征平均提高了1.45%,表明特征的稳定性好,对语音内容不存在依赖性;在不同信噪比的噪声环境下,识别率平均提高了6.37%,表明DFCC特征能够充分利用语音频带中包含的说话人信息,具有良好的抗噪性能。 相似文献
7.
针对MFCC特征补偿技术在低信噪比时性能不高的缺点,提出了基于PLAR鲁棒特征的模型补偿方法进行抗噪声说话人识别.PLAR特征从人类听觉感知机理出发,运用听觉心理学概念表征说话人个性特征,具有雏数低,运舅速度快,抗噪性能强等特点,是一种稳健的特征.模型补偿则通过分析被测语音帧的整体分布,对高斯混合模型似然概率进行某种程度的补偿,降低噪声的影响,改善系统的性能,进一步增强系统的鲁棒性.理论分析和实验结果表明,在平稳和非平稳背景噪声环境下,当信噪比大大降低时,此方法比MFCC-GMM方法的识别率平均提高了12.2和14.9个百分点. 相似文献
8.
9.
针对最小二乘支持向量机在语音数据大样本输入下的局限性,提出了一种基于GMM特征变换和模糊LS-SVM的学习算法,结合高斯混合模型在拟合数据分布方面和最小二乘支持向量机在分类辨别方面的突出优势,有效地提取说话者特征信息,压缩了数据,解决了大样本数据输入下最小二乘支持向量机的训练速度和测试精度问题,同时在LS-SVM系统中引入模糊隶属度函数,很好地解决了不可分数据的输出.理论研究和实验表明,所提方法能充分地利用训练数据,使得系统在具有更好辨别能力的同时提高了鲁棒性和识别率. 相似文献
10.
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。 相似文献