期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

2.

说话人识别中语音特征参数研究 总被引：1，自引：0，他引：1

杨建华于小宁《大理学院学报：综合版》2009,8(8):32-35

在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。相似文献

3.

基于因特网的说话人识别技术研究

叶蕾方鹏杨震《南京邮电大学学报(自然科学版)》2004,24(3):45-48

比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。相似文献

4.

用于分布式识别的语音参数的提取和性能分析

郑清杨震《南京邮电大学学报(自然科学版)》2003,23(2):31-34

主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。相似文献

5.

汽车噪声中自动语音的识别技术 总被引：6，自引：0，他引：6

韦晓东胡光锐《上海交通大学学报》1998,32(10):10-13

汽车中的话音拨号系统是自动语音识别技术的应用热点．自动语音识别系统是一个基于训练的系统．在汽车噪声中,由于实际应用环境与形成系统参数的训练环境的失配,传统语音识别系统的性能会大幅度地下降,从而无法实用．为了提高语音识别系统在特定环境下的识别率及实用性,首先根据汽车环境中语音的失真模型分析了系统性能下降的原因,然后针对加性汽车噪声与信道失真对系统的影响,讨论了在汽车噪声中改善语音识别系统性能的方法．提出了在识别系统中用基于子带的语音增强算法和倒谱均值相减算法相结合的方法．对大量的多人连续数字串语音的识别实验表明,这一方法大大提高了系统在汽车噪声环境中的识别率,它还可以简便、实时的实现,具有一定的实用性．相似文献

6.

说话人识别中的Mel特征频率倒谱系数

曹辉徐晨赵晓吴胜举《西北大学学报(自然科学版)》2013,(2):203-208

目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。相似文献

7.

噪声环境下话者识别系统的特征提取

王蕾孟慧杰《科技信息》2010,(33):48-49

说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语音信号的特征提取。应用线性预测的MFCC特征提取方法提高鲁棒性。提取几种重要的语音特征参数,包括LPCC、MEL倒谱系数、线性预测倒谱系数等,对这些参数进行分析和比较,以达到话者识别的目的。相似文献

8.

一种基于加权Mel倒谱的语音信号共振峰提取算法

杨鸿武赵涛涛《西北师范大学学报(自然科学版)》2014,(1)

提出了一种利用加权Mel倒谱提取语音信号共振峰的算法.首先对短时语音信号进行加权Mel倒谱分析,获得包含频谱主要成分的加权Mel倒谱系数;然后利用离散余弦平滑算法,从加权Mel倒谱系数获得谱包络,并从谱包络的峰值位置获得候选共振峰;最后根据共振峰的连续性约束条件和频率范围,从候选共振峰筛选得到共振峰的估计值.实验结果表明,本算法比倒谱法提取的共振峰误差更小,在噪声环境下具有较好的鲁棒性. 相似文献

9.

概率神经网络在文本无关说话人识别中的应用

周长锋韩力群《北京工商大学学报(自然科学版)》2007,25(1):49-51

采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率. 相似文献

10.

基于改进GFCC特征参数的广播音频语种识别

邵玉斌陈亮龙华杜庆治《吉林大学学报(理学版)》2022,60(2):417-424

针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法. 相似文献

11.

基于倒谱特征的舰船辐射噪声识别算法研究

王彪杨志明杨小东黄海宁田杰《西北师范大学学报(自然科学版)》2006,42(6):34-35,43

研究了舰船辐射噪声的倒谱信息．倒谱可以避免连续谱特征的不稳定性，基于此，将倒谱代替连续谱作为舰船辐射噪声识别的特征，并对实测的海上数据进行了仿真实验．结果表明，该方法可以有效地达到识别舰船辐射噪声的目的，且识别率高．相似文献

12.

基于浊音语音谐波谱子带加权重建的抗噪声说话人识别 总被引：1，自引：0，他引：1

曾毓敏吴镇扬《东南大学学报(自然科学版)》2008,38(6)

提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率. 相似文献

13.

基于时频域特征的人员连续动作分段识别

李华昊郇战耿宏杨陈瑛高歌李志新周帮文王云良《重庆邮电大学学报(自然科学版)》2021,33(5):877-884

基于惯性传感器的步态识别研究是人工智能应用到实际生活的典型范例,近几年取得满意的成就.针对日常生活中连续动作类型的信号,对其进行精确分割和识别的效果仍略有不足;这些研究局限于传感器信号的时域特征和一些简单的频域特征,且没有对不同动静状态的动作进行分类.将人类常见6种连续行为分为3类动态动作和3类静态动作,并对其进行分割和识别.使用滤波器去除原始信号噪声干扰.通过滑动窗口分割法进行分割,对每一个窗口片段提取常用传统特征和梅尔倒谱系数,以及倒谱系数的一二阶delta导数等频域特征.将6类动作的不同特征进行多种组合,使用分类器识别不同动作,将不同特征组合的识别结果进行比较.该模型在UCI公开数据集随机抽取了5组测试样本,整体分割识别准确率最高达到98.19％. 相似文献

14.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献

15.

用于语音识别的减谱结合RASTA的抗噪声方法 总被引：1，自引：0，他引：1

黄石磊武剑虹匡镜明《北京理工大学学报》2003,23(5):621-624

主要论述加性和卷积性噪声条件下语音识别的抗噪方法．在特征提取阶段，用功率谱短时均值相减的谱减方法补偿加性噪声的影响，用在Mel频标倒谱域RASTA(relative specllral)滤波补偿卷积性噪声对语音识别系统的影响．在汉语非特定人孤立数字识别实验中，使用该方法的误识率比未使用该方法要低，并且需要很小的噪声先验知识和假设，运算简单．实验证明，提出的减谱结合RASTA的方法是一种比较有效地削减噪声的方法。相似文献

16.

一种基于修正倒谱平滑技术改进的维纳滤波语音增强算法

李季碧马永保夏杰刘金刚《重庆邮电大学学报(自然科学版)》2016,28(4):462-467

传统的倒谱平滑维纳滤波算法在求取选择性平滑范围时,噪声会对维纳增益函数的倒谱产生影响,使估计出的选择性平滑范围不正确,进而导致此传统算法在平滑掉音乐噪声的同时也影响了噪声抑制效果。为此提出了一种基于修正倒谱平滑技术改进的维纳语音增强算法,该算法先用最大似然准则估计出纯净语音的倒谱,然后在纯净语音倒谱中求取基频和共振峰的位置,进而得到选择性平滑的范围。该方法提高了选择性倒谱平滑的准确性,进而改善了传统倒谱平滑维纳滤波语音增强算法的噪声抑制效果。最后在不同的噪声场景中对传统算法和改进算法进行了仿真对比,表明该算法能够在去除噪声的同时更好地保留语音的特征结构,较好地提高了带噪语音的质量。相似文献

17.

基于梅尔频率倒谱系数和支持向量机的汽车鸣喇叭声识别

陈东黄智鹏《科学技术与工程》2021,21(11):4486-4491

使用违法鸣笛辅助执法设备监测城市交通中汽车鸣喇叭事件的发生,可以有效地治理扰民的喇叭噪声,汽车鸣喇叭声的识别方法是其关键.为了准确高效地在交通噪声里识别出汽车鸣喇叭声,采用支持向量机(support vector machine,SVM)作为喇叭声和交通噪声的二分类器,针对汽车喇叭声的谐波特征分布特点,提取其梅尔频率倒谱系数(Mel frequency cepstrum coefficient,MFCC)作为特征向量,并分析MFCC的梅尔滤波器个数及特征维数对识别效果的影响.实验结果表明,通过增加MFCC特征中梅尔滤波器个数及特征维数可以改善识别效果,信噪比越低越明显. 相似文献

18.

混响声场中语音识别方法研究 总被引：1，自引：4，他引：1

栗学丽徐柏龄《南京大学学报(自然科学版)》2003,39(4):525-531

免提式话筒语音识别系统是语音识别走向实用的目标之一．实现这一系统，首先要解决房间效应引起的混响问题．通过讨论室内混响声场中语音的特点，提出用鲁棒性特征参数——滤波规整的Mel频率倒谱参数(FNMFCC，即MFCC参数在对数功率谱域进行低通滤波，倒谱域进行均值减，并用标准差加权进行非线性规整，采用这3种措施来消除混响引起的语音参数的变化．识别方法用矢量量化法，用4组无混响数码语音进行训练，对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98．7％．提出的这一新方法在不降低无混响音识别率的情况下，提高了混响声场的语音识别率．该方法不仅识别率高，而且运算量小、所需内存空间小。易于做成小型实用的快速识别系统．相似文献

19.

基于统计阈值的鲁棒性语音识别

李银国蒲甫安郑方 《重庆邮电大学学报(自然科学版)》2012,24(2):127-132

近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法... 相似文献