共查询到18条相似文献,搜索用时 265 毫秒
1.
说话人识别技术是根据待识别人的语音与预先提取的说话人语音特征是否相匹配来鉴别说话人身份的一种生物认证技术,具有广泛的应用前景。采用矢量量化(VQ)方法,可以在信息量损失较小的情况下更好地压缩数据量,从而增高说话人识别系统的识别率。本文研究了说话人识别的相关技术,提出并设计了一个基于VQ的说话人识别系统,当用于训练的数据量较小时,可以得到比较稳定的识别性能。 相似文献
2.
提出了一种新的语音识别方法,该方法综合了VQ,HMM和无教师说话人自适应算法的优点。该方法首先在每个状态通过用矢量量化误差值取代传统HMM的输出概率值来建立VQ-HMM,同时采用无教师自适应矢量量化算法,来改变VQ-HMM的各状态的码字,从而实现对未知说话人的码本适应。本文通过非特定人汉语数码(孤立和连续数码)识别实验,把新的组合方法同基于CHMM的自适应和识别方法进行了比较,实验结果表明该方法鲁棒性好,所需计算量较少,自适应和识别效果远优于基于CHMM的方法。 相似文献
3.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。 相似文献
4.
针对当前基于DSP等硬核处理器的嵌入式说话人识别系统存在训练和辨认时间较长的问题,提出一种基于FPGA平台与矢量量化原理的说话人识别系统实现方案.在采用遗传算法进行矢量量化的说话人识别的系统中,该方案实现的硬件并行运算结构可大大减少求适应度的耗时.经测试,该实现方案在保证识别率前提下,可有效提高训练与识别速度. 相似文献
5.
6.
提出一种基于遗传神经网络的说话人识别系统.将遗传算法和矢量量化技术结合建立说话人模型,然后利用遗传神经网络进行识别.实验结果表明,这种方法既降低了用户的语音数据采集量,有利于话者模板的建立,又提高了系统的识别性能及鲁棒性,较传统方法有明显的优越性. 相似文献
7.
针对LPC参数量化过程的多级VQ码书设计中顺序与迭代顺序设计算法收敛速度较慢这一缺点,提出了一种新的顽健多级VQ的联合码书设计方案。实验表明,该多级VQ的联合码书设计方案应用于线谱对参数的量化时,可提供透明质量的合成语音。相比顺序设计算法不仅加快了收敛速度,而且改善了VQ的性能测度。 相似文献
8.
陈在 《重庆邮电学院学报(自然科学版)》1992,4(1):40-47
本文讨论了基于非均匀矢量量化、隐马尔可夫模型(HMM)的孤立数字语音识别系统。在现有的连续密度隐马尔可夫模型多说话人孤立数字识别系统中,通常采用 LBG 算法建立矢量码本,并采用全搜索识别算法,这样的结果限制了识别精度和识别速度。本文提出了一种新的系统算法,即用非均匀矢量量化(Non-Uniform Vector Quantization——NUVQ)取代原矢量量化部份,实验结果证明,本系统在识别速度和识别精度上都有了较大的改善。 相似文献
9.
为了有效地提高矢量量化(VQ)码书的性能,提出了一种新的自学习特征映射(SLM)算法,并应用到图像VQ中,实验表明,与自组织特征映射(SOM)算法相比,SLM算法具有聚类特性好和峰峰信噪比高等优点,是一种非常有前途的码书设计算法. 相似文献
10.
夏菽兰 《盐城工学院学报(自然科学版)》2008,21(2):35-38,43
提出了一种基于PCANN/PDP混合结构的实际环境下说话人识别的方法。它采用相继几帧组成的特征参数矢量作为说话人识别系统的输入,能有效地在说话人识别系统中引入帧间相关信息。针对噪声往往具有帧间相关性小,能量分布频率范围广且数值较小,在语音信号主分量特征中对应于贡献率较小的分量等特点,话人识别系统的前端增加语音参数压缩的主分量分析神经网络(PCANN)。同时提出了概率DP匹配说话人识别方法。通过对噪声环境下与文本无关的说话人识别实验,这种方法的有效性得到了验证。 相似文献
11.
12.
该文针对LBG算法可能有空胞腔产生及有些码字利用率低的问题,提出了一种改进的矢量量化算法,并将其应用到与文本无关的说话人识别研究,得到了一种新的说话人识别方法.实验表明,这种方法对说话人的识别性能好于基于LBG算法的说话人识别方法. 相似文献
13.
一种基于遗传算法的图象矢量量化方法 总被引:1,自引:0,他引:1
描述了一种基于遗传算法的图象矢量量化方法.遗传算法基于自然进化原理可得到全局优化结果,把遗传算法用于码本设计,其运算简单,而且可避免传统方法如K-均值技术等所带来的局部优化局限.同时,由于其结构的规则性和并行性,较适于VLSI实现.文中主要讨论了遗传算法用于图象矢量量化的评价函数及操作过程,并与传统算法作了比较,给出实验结果. 相似文献
14.
为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。 相似文献
15.
16.
用于LBG初始码书设计的改进PNN算法 总被引:1,自引:1,他引:0
矢量量化初始码书对于码书的形成非常重要,为了改善初始码书的性能和提高最终的码书质量,在分析成对最邻近(pair-wise nearest neighbor,PNN)算法与基础上,提出2种改进算法用于LBG算法初始码书的设计。改进的算法将训练矢量的分量和值排序与一次迭代多次融合用于PNN算法中,有效地降低了PNN算法的复杂度,减小了PNN算法的收敛时间。实验证明,该算法具有合理性和有效性,与LBG算法结合可进一步提高码书质量。 相似文献
17.
基于话者分类和HMM的话者自适应语音识别 总被引:2,自引:1,他引:2
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点. 相似文献
18.
与文本无关的说话人辨认系统中一种新的使用基音周期方法研究 总被引:4,自引:0,他引:4
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。 相似文献