期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

黄国庆宋家友《信阳师范学院学报(自然科学版)》2008,21(2):301-304

介绍了语音失真测度系统的构成以及实现的算法思想.采用前端处理技术.实现了对重放语音信号进行分帧、端点检测等特征的提取,获得了以Mel尺度倒谱参数作为衡量语音失真测度的特征向量.采用动态时间弯折算法,获得了用于语音质量客观评价的语音失真测度. 相似文献

2.

基于Fourier-Bessel展开和Karhunen-Loeve变换的语音变换

下载免费PDF全文

岳振军宋巍王浩张雄伟《解放军理工大学学报(自然科学版)》2008,9(1):15-19

为了有效地进行语音变换,改善变换后语音的自然度和目标人倾向度.依据语音信号传播机理和(Fourier-Bessel)展开式系数对语音信号的表现能力,提出了利用F-B展开系数作为变换参数.在该算法中,根据F-B展开系数无语音相位信息的特点,提出基于最大基频相位的语音分帧算法;针对F-B展开式数据量过大的问题,提出了基于Karhunen-Loeve变换的参数压缩算法,转换模型使用GMM(Gaussian mixture model)模型.对算法进行了仿真实验.对变换后语音所进行的ABX测试表明,算法能够较好地完成语音变换,变换后语音的目标人趋向度比较高. 相似文献

3.

一种基于语音分类的清晰度客观评价算法

下载免费PDF全文

张雄伟沈刘平曹铁勇杨吉斌孙新建《解放军理工大学学报(自然科学版)》2007,8(2):103-107

为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-WBSD.该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度.通过分析 3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-WBSD权重矢量.实验结果表明,SC-WBSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%. 相似文献

4.

基于LP-MMSE的高效语音感知哈希认证算法

《华中科技大学学报(自然科学版)》2016,(12):127-132

为了满足移动语音通信中对语音内容保持操作的鲁棒性和区分性,并实现高效认证等要求,提出一种基于线性预测最小均方差(LP-MMSE)的高效语音感知哈希认证算法.该算法首先对待认证语音进行预处理、分帧和加窗后的语音信号进行线性预测分析(LPC)得到其最小均方差(MMSE)系数矩阵;然后对分帧后的语音利用谱熵法计算得到每帧的谱熵值参数矩阵;最后结合上述两个矩阵,生成最终的二进制感知哈希序列.仿真结果表明,该算法的感知哈希摘要性优于现有的其它方法并对内容保持操作具有较好的鲁棒性和区分性,认证效率高,能够满足语音通信实时认证的要求. 相似文献

5.

不同监督分类方法分类结果的对比分析研究

张芬翟苗苗丁庆福《山东师范大学学报(自然科学版)》2011,26(3)

笔者以2007年11月中巴资源卫星多光谱遥感影像数据为例,选择山东省济宁市市中区作为研究区,利用ERDASImagine9.2遥感影像处理软件对数据进行预处理后,运用最大似然法(Maximum Likelihood)、马氏距离法(Mahalanobis Distance)、最小距离法(Minimum Distance)进行监督分类试验.然后对分类后的结果进行主观和客观的分析,并评价各种分类结果的精度,为用户进行影像分类前选择分类方法提供参考. 相似文献

6.

多特征全卷积网络的地空通话语音增强方法

高登峰杨波杨红雨刘洪《四川大学学报(自然科学版)》2020,57(2):289-296

为了研究空中交通管理领域中的语音增强问题,并且节约存储资源,提出了一个新的语音增强方法.在基于全卷积神经网络(FCN)的基础上加入了跳跃连接(Skip Connection),并引入次要特征来进行联合学习.具体而言,使用语音的对数功率谱(LPS)作为网络的主要训练特征,引入对数梅尔倒谱系数(L-MFCC)作为网络的次要训练特征,来联合优化网络参数.实验证明,相较于单个LPS特征输入的架构,结合LPS和L-MFCC的多特征网络架构具有更好的语音增强性能表现,且作为次要特征的L-MFCC还可以用作其它用途.实验还证明,跳跃连接的加入可以很好的提高FCN的网络性能,且相较于基线的深度神经网络(DNN)模型,新的网络结构在相同参数数量的情况下,要具有更好的性能. 相似文献

7.

LHBA优化VMD降噪算法及在管道泄漏信号中的应用

王冬梅何壮柴永康孙颖路敬祎《吉林大学学报(信息科学版)》2023,(6):961-968

针对变分模态分解(VMD:Variational Mode Decomposition)算法在分解信号时参数选择不准确导致降噪效果不理想的问题,提出一种改进的蜜獾优化算法(LHBA:Levy Honey Badger Algorithm)与VMD结合的降噪算法。首先,利用LHBA算法优选VMD的分解模态数K和惩罚因子α;其次,利用优化后的参数进行VMD信号分解;最后,计算各模态分量与原始信号之间的豪斯多夫距离(HD:Hausdorff Distance),选取有效模态分量进行信号降噪处理。实验结果表明,该算法与HBA(Honey Badger Algorithm)-VMD、 GA(Genetic Algorithm)-VMD和PSO(Particle Swarm Optimization)-VMD相比,其4种评价指标均优于其他对比算法,具有较好的降噪效果,验证了该算法的有效性和先进性。相似文献

8.

一种稀少训练数据条件下的语音转换算法

徐宁杨震《南京邮电大学学报(自然科学版)》2010,30(5)

提出了一种新的语音说话人转换算法,利用变分贝叶斯方法估计高斯混合模型参数,进而将其应用于语音转换的声道谱参数映射过程,实现说话人身份转换.将变分贝叶斯算法用于模型参数的估计,一方面解决了训练数据量稀少情况下容易使模型产生"过拟合"的问题,另一方面通过将模型参数概率化,使得参数估计问题不再是"点估计",而成为了"全局估计",因此在一定程度上提高了模型的精度.主观和客观实验结果表明:将基于变分贝叶斯估计得到的统计模型用于语音声道谱参数的转换,明显提高了在训练数据稀少的情况下系统的鲁棒性,同时转换后语音的音质和说话人个性特征均优于经典的语音转换系统. 相似文献

9.

引入包分析的E-Model语音质量评价模型改进

杨英杰赵万马王冲《重庆邮电大学学报(自然科学版)》2017,29(2):149-154

为了能够更加准确地评价语音包丢失对基于IP的语音传输(voice over internet protocol,VoIP)的语音质量的损伤,对ITU-T G.107建议书提出的语音质量预测模型E-Model中计算丢包与编码造成的损伤Ie-eff的方法作出改进,在综合考虑语音包的内部特性和存在突发连续丢包情况后,提出利用在固定语音长度下,语音实际损失时间Tloss来衡量语音包丢失造成的语音损伤.仿真结果表明,相比原有模型,改进后的模型得到的语音质量评分同主观语音质量评估方法(perceptual evaluation of speech quality,PESQ)评分相比,皮尔森相关系数平均提高了0.045 8,均方根误差平均降低了0.053 4,改进后的E-Model模型在评价语音质量时与PESQ更具有一致性,可以更为准确地预测VoIP通信的语音质量. 相似文献

10.

改进的PSO-VMD算法及其在管道泄漏检测中的应用

张超侯男路敬祎王闯《吉林大学学报(信息科学版)》2021,39(1):28-36

针对变分模态分解(VMD:Variational Mode Decomposition)算法分解后有效模态分量选择困难以及去噪效果不理想等问题,将粒子群(PSO:Particle Swarm Optimization)与VMD算法结合,提出一种基于混沌和Sigmoid函数改进PSO的优化算法.利用改进的PSO算法优化VMD的分解模态数κ和惩罚因子α,进行模态分解,然后计算各模态分量概率密度函数与信号概率密度函数之间的欧氏距离(ED:Euclidean Distance),选取有效模态分量重构信号.实验结果表明,该算法与VMD-CORR(Variational Mode Decomposition-Correlation Coeffificient)算法和EMD-ED(Empirical Mode Decomposition-Euclidean Distance)算法相比,仿真信号和实际管道泄漏信号都得到了较好的去噪效果,并验证了其在管道泄漏检测中的有效性. 相似文献

11.

加性噪声环境下语音特征参数提取方法的研究

张昊慧《淮阴师范学院学报(自然科学版)》2010,9(4)

提出一种具有良好抗噪性的语音特征分析方法.将语音信号的短时自相关序列进行时间方向上的平滑处理,然后利用平滑后的序列代替原语音信号进行线性预测分析,从而得到线性预测倒谱系数.实验表明,利用该特征参数的语音识别系统的识别性能优于MEL倒谱系数、LPC倒谱系数等传统的语音特征参数. 相似文献

12.

基于掌上电脑录音的说话人辨认

殷启新韩春光杨鉴《云南民族大学学报(自然科学版)》2003,12(4):251-254

说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认，而特征矢量的协方差矩阵取不同形式时，比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明，当特征矢量参数协方差矩阵为满矩阵时，EM算法能更有效估计GMM参数，有效提高识别率。相似文献

13.

基于相位调制特征的语音活动检测

尚永强殷未来姜双双王金芳《吉林大学学报(信息科学版)》2016,34(1):29-33

针对现有语音活动检测特征易受各种环境噪声影响而导致检测性能恶化的问题, 提出基于相位调制特征的语音活动检测算法。相位调制特征能充分表征语音动态特性, 与静态特征相比, 更能体现语音和噪声间的差异, 从而保证良好检测性能。与传统美尔频率倒谱系数特征的检测对比实验结果表明, 相位调制特征明显优于美尔频率倒谱系数。相似文献

14.

连接数字语音识别系统的DSP实时实现 总被引：2，自引：0，他引：2

雷传华张秀彬孙济宇《上海交通大学学报》1999,33(12):1525-1528

：针对各种数字信息,实现了一种基于ＴＭＳ３２０Ｃ５ｘ评价模块（ＥＶＭ）的与特定人无关的连接数字语音识别系统．在分析了连续概率密度的隐马尔可夫模型（ＣＤＨＭＭ）基础上,利用ＬＰＣ倒谱系数、ＬＰＣ差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Ｖｉｔｅｒｂｉ算法和Ｂａｕｍ－Ｗｅｌｃｈ重估算法,有效地提高了系统的识别率．给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响．在具体实现中,着重处理了抗噪及实时实现问题．实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到９２％ ,为其实用化提供了较为重要的技术途径．相似文献

15.

基音周期矢量量化中权重系数的计算

唐昆李晔徐敬德崔慧娟《清华大学学报(自然科学版)》2010,(4)

为了更好地区分正弦激励线性预测声码器中待量化基音周期参数矢量各维基音周期参数的重要性,提高合成语音质量,提出了一种新的权重系数计算方法。发现权重系数的计算应考虑当前语音帧所有子带的清浊音度参数,而不仅仅是第一个子带的清浊音度参数,这样能够更好地区分各语音帧基音周期参数的重要性。将各语音帧的所有子带清浊音度参数相加,其和作为基音周期参数量化时的权重系数。测试结果表明,与仅将第一个子带的清浊音度参数作为权重系数相比,新方案能使合成语音质量MOS有较大提高。相似文献

16.

一种优化的VMD算法及其在语音信号去噪中的应用

李宏李定文朱海琦田雷李富《吉林大学学报(理学版)》2021,59(5):1219-1227

针对非连续、非平稳语音信号中含有噪声的问题, 提出一种基于参数优化的变分模态分解去噪算法. 首先, 利用灰狼优化算法搜寻变分模态分解算法的最优分解参数组合——分解模态数K和惩罚因子α, 通过使用获得的参数组合分解语音信号以获得K个特征模态函数分量IMF; 其次, 利用相关系数选择有效模态分量, 并用小波阈值处理无效模态分量; 最后, 重构小波阈值处理后的模态分量和有效模态分量以对语音信号进行去噪. 实验结果表明, 该算法与其他经典算法相比能有效提升信噪比, 降低均方误差, 提高语音信号的质量. 相似文献

17.

一种适用于双微阵列的语音增强算法研究

毛维曾庆宁《科学技术与工程》2018,18(10)

考虑到传统单通道语音增强算法对噪声抑制的局限性,本文采用由两个微型麦克风阵列组成的双微阵列,利用该阵列空间结构的时空域特性对含噪语音进行处理,提出了一种适用于双微阵列的语音增强算法。该增强算法是将各通道采集到的带噪语音信号先使用对数最小均方误差(Logarithmic Minimunm Mean Square Error,LogMMSE)提升其信噪比,然后利用频域宽带最小方差无畸变响应(MVDR)通过对目标声源信号的获取,保留目标声源方向的信号并抑制其他方向的信号干扰,最后通过一个改进可懂度结合改进最小控制递归平均(Improved Minimum Controlled Recursive Average Algorithm,IMCRA)噪声估计的维纳滤波器来去除噪声残留提升语音质量。仿真实验结果表明,相比传统的单通道语音增强算法,该算法具有良好的噪声抑制性能。相似文献

18.

基于特征的音频比对技术

郭兴吉范秉琪《河南师范大学学报(自然科学版)》2006,34(2):35-38

音频比对有别于语音识别,音频比对不存在音频重构.在保证音频主要信息不丢失的前提下,采用二阶Haar小波变换压缩原始音频,以音频帧的方式提取出能代表音频主要信息特征的质心、均方根和前12个Mel倒谱系数,并分别计算这3类参数的欧氏距离,根据欧氏距离的值与阀值ε之间的关系,完成音频间的比对任务.经实践证明,这套方案对于音频比对具有较高的准确性和较好的实时性. 相似文献

19.

混响声场中语音识别方法研究 总被引：1，自引：4，他引：1

栗学丽徐柏龄《南京大学学报(自然科学版)》2003,39(4):525-531

免提式话筒语音识别系统是语音识别走向实用的目标之一．实现这一系统，首先要解决房间效应引起的混响问题．通过讨论室内混响声场中语音的特点，提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC，即MFCC参数在对数功率谱域进行低通滤波，倒谱域进行均值减，并用标准差加权进行非线性规整，采用这3种措施来消除混响引起的语音参数的变化．识别方法用矢量量化法，用4组无混响数码语音进行训练，对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98．7％．提出的这一新方法在不降低无混响音识别率的情况下，提高了混响声场的语音识别率．该方法不仅识别率高，而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统．相似文献