首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。  相似文献   

2.
基于矢量量化的组合参数法说话人识别   总被引:5,自引:0,他引:5  
 说话人识别的方法很多,提出的基于矢量量化(VQ)的算法,在语音特征表征上利用几种特征参数的组合使用来提高识别率,在VQ过程中,经典的K均值算法收敛速度快,但极易收敛于局部最佳点,为了使聚类算法收敛于全局最优点,同时提高识别率,采用模拟退火算法来改善聚类码本质量.讨论了具体的算法实现,并给出了一些实验数据,实验结果表明该处理方法是有效的.  相似文献   

3.
提出了一种应用于正交矢量空间,加快图像矢量化的新算法。该算法图像信号在正交矢量空间中的能量集中性,有效地减小了码书的搜索范围,加快了矢量量化速度。计算机模拟结果表明,在相同的技术指标下,与其他一些方法相比,该算法有效地减少矢量量化的编码时间。  相似文献   

4.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

5.
白玉  陈立伟 《应用科技》2005,32(12):45-47,50
提出一种基于遗传神经网络的说话人识别系统.将遗传算法和矢量量化技术结合建立说话人模型,然后利用遗传神经网络进行识别.实验结果表明,这种方法既降低了用户的语音数据采集量,有利于话者模板的建立,又提高了系统的识别性能及鲁棒性,较传统方法有明显的优越性.  相似文献   

6.
距离加权矢量量化文本无关的说话人识别   总被引:10,自引:0,他引:10  
本文在研究说话人识别的矢量量化方法时,分析了用矢量量化建立说话人识别模型的可行性。针对量化码本描述的不完全性,提出了一种经距离加权的矢量量化方法,能更好地刻划出说话人语音特征空间的精细结构,从而提高正识率。本文还对特征参数LPCCEP的选取进行了理论分析和实验研究,提出了平均互—自差异比的概念,给出了一种对特征矢量的每一维分量识别能力进行定量化估算的公式。实验结果表明,距离加权矢量量化是一种具有很高正识率的与文本无关的说话人识别方法。  相似文献   

7.
隐马尔可夫模型(HMM)广泛应用于说话人识别系统中,主要研究了HMM与自组织人工神经网络(SONN)相结合的混合模型HMMNN,并分析构造了基于HMMNN的说话人识别的系统模型.  相似文献   

8.
一种新的基于分裂法的矢量量化算法   总被引:2,自引:0,他引:2  
提出了一种新的适合于矢量量化技术的码书设计算法,它的主要思想是依据等误差准则和分区域收敛性质,对满足迭代终止条件的质心区域进行标记,以后不再对已标记区域进行迭代,每一步迭代执行基于分裂码字的改进LBG算法。该算法简单,能极大地提高训练速度,并得到较低的失真,而且不适合于并行计算。理论分析和实验结果表明本文提出的算法是有效的并优于其它算法。  相似文献   

9.
提出了一种针对码书优化的图像矢量量化算法。首先设定矢量距离的初始门限值,基于空间划分对训练矢量聚类,找到矢量个数小于平均胞腔矢量数的胞腔;提取其聚类矢量后删除该胞腔,然后缩小距离门限值再次聚类提取,依次循环直到聚类矢量个数达到要求。将提取的聚类矢量作为初始码书,进行LBG算法码书设计,有效地改善了传统LBG算法依赖于初始码书而容易陷入局部最优的缺点,采用改进算法生成的码书更接近全局最优,加快了收敛速度。仿真结果证明了该方法的有效性。  相似文献   

10.
为了研究模糊聚类算法在高斯混合模型(GMM)参数获取方面的应用,采用模糊C均值算法(FCM)进行语音特征矢量的聚类,并结合Tabu搜索算法得到全局最优的聚类结果,进一步用EM算法得到GMM模型参数.使用TIMIT数据库中的语音进行测试,开集和闭集说话人辨认实验都表明,该方法获取的GMM参数比普通EM算法获得的GMM模型参数性能更优,能有效降低说话人辨认系统的误识率.  相似文献   

11.
郭莹  董吉文 《山东科学》2008,21(1):57-60
矢量量化(VQ)是一种极其重要的信号压缩方法,广泛地应用于图像信号压缩、语音信号压缩领域。它的主要问题是码本设计,在码本设计过程中,有很多算法被提出,但是大部分的算法只适用于码本当中码字个数比较少的情况。随着数据量逐渐地增加,算法所需的时间复杂度和空间复杂度也大幅度地增加,本文提出的方法是结合了FCM聚类算法和LBG算法,首先对大量数据分类,然后通过用FCM聚类算法对每一组数据进行分类,可以得到相似度比较小的聚类中心。用这些相似度比较小的聚类中心作为LBG的初始码本,进行码本设计。虽然LBG算法依赖初始码本的好坏,容易陷入局部最小,但因为已经用FCM对初始码本进行了处理,所以初始码本对于算法的影响并不大。这样不仅可以改善LBG算法容易陷入局部最小的情况,而且由于首先对大量的数据分类,根据需要得到了一些可用的码字所以同时也改善数据量大所带来的运行时间的问题。  相似文献   

12.
针对当前基于DSP等硬核处理器的嵌入式说话人识别系统存在训练和辨认时间较长的问题,提出一种基于FPGA平台与矢量量化原理的说话人识别系统实现方案.在采用遗传算法进行矢量量化的说话人识别的系统中,该方案实现的硬件并行运算结构可大大减少求适应度的耗时.经测试,该实现方案在保证识别率前提下,可有效提高训练与识别速度.  相似文献   

13.
介绍了指数展开分类器,引出了NAPS核函数及核映射的概念.详细讨论了如何利用基于NAPS核函数的支持矢量机进行说话人识别的算法.理论和实验表明,算法具有模型参数小、识别速度快和识别率较高的优点.  相似文献   

14.
说话人识别技术是通过判断待识别人语音与预先提取的说话人语音特征是否匹配来鉴别说话人身份的一种生物认证技术,环境噪声是说话人识别技术走向实用化的一个主要障碍.针对噪声环境中说话人识别性能较差的不足,结合小波变换的优点,提出了将小波变换技术与传统的特征参数提取方式相结合的方法.该方法首先对语音信号进行小波分解,在此基础上再对小波系数进行阈值处理,仅保留阈值以上的数据,而后提取相关性不大的传统特征参数进行组合,分别作为说话人识别系统的输入矢量.仿真结果表明:在噪声环境中,说话人识别系统能较好识别出说话人,经过小波变换后再提取特征参数的方法可以得到更高的识别率,大大提高说话人识别系统的识别性能.  相似文献   

15.
16.
说话人识别的参量研究和语音库建设   总被引:4,自引:0,他引:4  
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。  相似文献   

17.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

18.
蔡铁  朱杰 《上海交通大学学报》2005,39(12):1997-2001
针对语音识别系统中快速说话人自适应问题,提出了一种支持说话人权重算法.该算法通过支持说话人的计算实现了说话人选择与自适应参数的降维,减少了自适应时的存储量,有效提高了自适应数据较少时的性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对非特定人(SI)系统下降了5.82%,明显优于其他快速自适应算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号