共查询到18条相似文献,搜索用时 62 毫秒
1.
基于VQ的说话人识别系统的实现 总被引:1,自引:0,他引:1
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。 相似文献
2.
本文根据网络服务的特点提出了一种分布式的说话人识别系统,从文本选择、模式匹配以及判决方式方面给出了具体方案.在模式匹配中对VQ算法进行了改进以提高系统的实时性及可用性. 相似文献
3.
说话人识别的参量研究和语音库建设 总被引:4,自引:0,他引:4
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。 相似文献
4.
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。 相似文献
5.
为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。 相似文献
6.
本论文重点对语音特征参数的组合进行了研究,通过参数的特征组合从不同的角度来反映说话人的个性特征,能够大大提高说话人识别系统的识别率。对其中的特征参数(MFCC及LPCC)的特性及提取过程进行了详细的解释和仿真。 相似文献
7.
说话人识别中语音特征参数研究 总被引:1,自引:0,他引:1
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。 相似文献
8.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法. 相似文献
9.
研究的说话人识别系统,采用能够反映人对语音的感知特性的线性预测(LPC)倒谱参数作为特征参数,同时对特征参数各维分量的识别能力进行定量分析,采用一种新的加权方法进行矢量量化,在此方法下系统取得识别率很高的效果,而且计算量和存储量都比较低. 相似文献
10.
电话信道下应用DMFCC进行说话人识别 总被引:2,自引:0,他引:2
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。 相似文献
11.
语音识别和说话人识别中各倒谱分量的相对重要性 总被引:37,自引:0,他引:37
采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度,在标准英文数字语音库上的实验表明,最有用的语音信息包含在MFCC分量C1到C12之间,最有用的说话人信息包含在MFCC分量C2到C16之间。MFCC分量C0和C1包含有负作用的说话人信息,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。 相似文献
12.
张歆奕 《五邑大学学报(自然科学版)》2005,19(1):10-16
介绍了指数展开分类器,引出了NAPS核函数及核映射的概念.详细讨论了如何利用基于NAPS核函数的支持矢量机进行说话人识别的算法.理论和实验表明,算法具有模型参数小、识别速度快和识别率较高的优点. 相似文献
13.
针对当前基于DSP等硬核处理器的嵌入式说话人识别系统存在训练和辨认时间较长的问题,提出一种基于FPGA平台与矢量量化原理的说话人识别系统实现方案.在采用遗传算法进行矢量量化的说话人识别的系统中,该方案实现的硬件并行运算结构可大大减少求适应度的耗时.经测试,该实现方案在保证识别率前提下,可有效提高训练与识别速度. 相似文献
14.
基于矢量量化的组合参数法说话人识别 总被引:5,自引:0,他引:5
说话人识别的方法很多,提出的基于矢量量化(VQ)的算法,在语音特征表征上利用几种特征参数的组合使用来提高识别率,在VQ过程中,经典的K均值算法收敛速度快,但极易收敛于局部最佳点,为了使聚类算法收敛于全局最优点,同时提高识别率,采用模拟退火算法来改善聚类码本质量.讨论了具体的算法实现,并给出了一些实验数据,实验结果表明该处理方法是有效的. 相似文献
15.
说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能. 相似文献
16.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 相似文献
17.
通过对VQ码本在线性频谱域进行噪声补偿,使得补偿后的VQ码本逼近测试环境下训练出的码本,从而提高说话人辨认系统的性能。实验中,在不同的信噪比条件下测试辨认率,并将补偿和没有补偿时的辨认率进行比较,结果显示,该算法能够有效地提高说话人辨认系统的性能。 相似文献
18.
Improved MFCC-Based Feature for Robust Speaker Identification 总被引:2,自引:0,他引:2
The Mel-frequency cepstral coefficient (MFCC) is the most widely used feature in speech and speaker recognition. However, MFCC is very sensitive to noise interference, which tends to drastically degrade the performance of recognition systems because of the mismatches between training and testing. In this paper, the logarithmic transformation in the standard MFCC analysis is replaced by a combined function to improve the noisy sensitivity. The proposed feature extraction process is also combined with speech enhancement methods, such as spectral subtraction and median-filter to further suppress the noise. Experiments show that the proposed robust MFCC-based feature significantly reduces the recognition error rate over a wide signal-to-noise ratio range. 相似文献