首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对传统分层聚类方法运算速度较慢的问题,提出一种基于矢量量化的时序说话人聚类方法。首先对各语音段的特征进行矢量量化得到各语音段的码本,然后采用贝叶斯信息判据计算各码本之间的距离,最后按时间先后顺序进行说话人聚类。采用会议和新闻语音数据进行测试,实验结果表明:会议语音的说话人聚类F值为73.47%,新闻语音的说话人聚类F值为80.00%;在处理速度方面,该方法比无矢量量化时序聚类方法提高了3.16倍,比传统分层聚类方法提高了53.31倍。  相似文献   

2.
陈雪芳 《科学技术与工程》2013,13(12):3297-3300
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。  相似文献   

3.
为有效找出会议语音中的说话人角色个数及各角色的说话人语音,提出了一种多说话人角色聚类方法.首先定义说话人角色聚类的特征,然后采用测地距离度量特征的相似度,进而提出了一种利用类内距离来控制类间合并的多说话人角色聚类方法,最后采用4种不同类型的会议语音对该方法进行测试.结果表明:对手工分割和自动分割后的会议语音进行说话人角色聚类时,如果采用相同的聚类方法,则使用测地距离的性能优于使用传统距离的性能;如果采用相同的距离度量方法,则文中方法的性能优于传统层次聚类方法.  相似文献   

4.
采用模糊切分实现非特定人连接数字语音识别   总被引:1,自引:0,他引:1  
选用倒谱特征、△倒谱特征、能量类特征等多个语音信号特征,采用多码本和HMM/VQ技术实现非特定人连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

5.
基于话者分类和HMM的话者自适应语音识别   总被引:2,自引:1,他引:2  
本文提出了一种基于话者分类和HMM的话者自适应语音识别方法,采用对参考话者聚类、并按话者类分别建立HMM模板的策略,对于新注册的用户,系统只需利用其极少量的语音,便可将与之最相近的一类模板指派给新用户,再采用基于谱空间映射的两级自适应方法,使系统自适应到用户的模式下工作.这种方法既提高了识别性能,又降低了自适应的难度,还有利于HMM的建立.讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响,提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于FVQ的码本自适应改进算法,该算法还具有对自适应字表不敏感的特点.  相似文献   

6.
为提高语音端点检测在低信噪比情况下的准确性,提出一种基于近邻传播聚类的语音端点检测算法.首先采用能量语音端点检测去除静音段;然后利用近邻传播聚类自动获取类别数的优点,有效地将语音细分为无语义语音和静音段、远场噪声段等各种类别;最后结合后处理方法,对语音端点做进一步过滤处理.实验结果表明:该算法在低信噪比的情况下,与传统的能量语音端点检测相比,其有效语音检测的漏警率相对下降13%,虚警率相对下降14%;在实际应用中,如声纹确认和声音检测等,与经典算法相比,该算法检测的准确率与效率等性能得到了显著提升.  相似文献   

7.
语音识别中基于模糊聚类分析的参数聚类   总被引:1,自引:0,他引:1  
徐向华  朱杰  郭强 《上海交通大学学报》2004,38(12):2086-2088,2093
为减少语音识别中声学模型的参数量,提高参数训练的鲁棒性,基于声学决策树结构,提出利用模糊聚类分析方法对模型参数聚类,包括高斯聚类和方差共享.对大词汇量汉语连续语音识别的实验结果表明:高斯模糊聚类使高斯数减少25%时,识别率提高了0.15%.进一步做模糊方差共享,当方差减少到初始模型的24%,与同样参数量的未进行聚类的模型相比,误识率下降了3.01%,证明了模糊聚类分析在语音参数聚类中的有效性.  相似文献   

8.
聚类集成是集成学习中的一个重要分支,其目标是解决无监督聚类分析中聚类算法的选择性、偏差性与数据特殊性等导致聚类结果不理想的问题。文章提出了一种基于数据关联的聚类集成方法(CEBDR),该算法先提取出在聚类成员中体现有关联关系的数据对象来组成新的类,然后对这些类进行二次聚类得到最终的集成结果。文中选用了一些标准数据集,采用CEBDR算法、已有的基聚类和聚类集成算法来进行对比实验,实验结果表明,该算法能够有效地提高聚类质量。  相似文献   

9.
介绍了一种融合多尺度形态学、蚁群聚类、模糊C-均值(FCM)聚类的新的彩色图像分割方法.该算法首先利用多尺度形态学提取图像边缘,再利用蚁群聚类算法的全局搜索性和鲁棒性的优点并结合边缘信息,确定聚类中心和聚类个数,将其作为FCM聚类的初始聚类中心和聚类个数,克服了FCM算法自身并不能确定聚类中心需要人为设定的缺陷.实验结果表明,该算法可以准确地分割出目标,是一种有效的图像分割方法.  相似文献   

10.
介绍了一种融合多尺度形态学、蚁群聚类、模糊C-均值(FCM)聚类的新的彩色图像分割方法。该算法首先利用多尺度形态学提取图像边缘,再利用蚁群聚类算法的全局搜索性和鲁棒性的优点并结合边缘信息,确定聚类中心和聚类个数,将其作为FCM聚类的初始聚类中心和聚类个数,克服了FCM算法自身并不能确定聚类中心需要人为设定的缺陷。实验结果表明,该算法可以准确地分割出目标,是一种有效的图像分割方法。  相似文献   

11.
阐述了分析非线性、非平稳信号的Hilbert—Huang变换(HHT)算法。针对非平稳语音信号,提出了一种基于HHT的提取语音特征参数HHT—IF的新方法,设计了基于VQ的说话人辨认系统,分别采用HHT-IF和LPCC从不同角度进行说话人辨认实验。结果表明,特征参数HHT-IF用于说话人识别是可行的。  相似文献   

12.
该文研究基于矢量量化技术的合成孔径雷达(SAR)原始数据压缩算法,提出了块自适应树型矢量量化(BATSVQ)算法和块自适应球形矢量量化(BASVQ)算法。与块自适应矢量量化(BAVQ)算法相比较,该文提出的算法采用约束型矢量量化技术,能够充分利用SAR原始数据经过自适应块处理后在较小的范围内具有稳定高斯分布的特性。采用以上算法对SAR实测数据进行了验证,并比较图像及其性能参数,结果表明BATSVQ算法和BASVQ算法能够获得算法性能和实现复杂度之间的合理折衷。  相似文献   

13.
缪凯 《科技信息》2013,(1):461-461
Kmeans算法是一种基于样本相似度的聚类分析算法。金融IC卡推广是重要的国家发展战略。本文利用Kmeans算法探索山东省金融IC卡城市推广规划,有效加强了方案的准确性和针对性。  相似文献   

14.
为了克服传统VQ与GMM说话人识别的缺点,提出了一种新的FVQMM说话人识别方法。该方法综合了VQ、GMM和模糊集理论的优点。通过用模糊VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果表明该方法是有效的。  相似文献   

15.
通过对随机VQ和晶格VQ优劣分析 ,得出随机VQ优于晶格VQ的结论 ,而晶格VQ仅仅在用于无记忆的、均匀分布的输入向量时 ,才是最优的  相似文献   

16.
为了克服传统核判别方法将样本唯一归属于某一类的不足,基于模糊集理论对传统的核判别分析方法进行改进,引入了模糊类别隶属度并详细分析了基于模糊核判别分析的语音情感识别。识别实验中采用VQ方法进行了特征参数的融合,根据实验结果对模糊核判别分析和核判别分析的性能进行了比较和分析。  相似文献   

17.
刘祥楼 《科学技术与工程》2012,12(11):2590-2593
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。  相似文献   

18.
提出一种简单有效的VQ码书生成的分频算法。该算法将图像分割为高频、低频两部分,在高频段采用阈值比较的方法,在低频段采用分块提取的方法生成VQ码书。实验结果表明,该算法生成的码书通用性较强,在码率为0.625bpp的情况下,重构图像的峰值信噪比为23.20~32.24dB,性能优于其他方法。  相似文献   

19.
提出了一种针对码书优化的图像矢量量化算法。首先设定矢量距离的初始门限值,基于空间划分对训练矢量聚类,找到矢量个数小于平均胞腔矢量数的胞腔;提取其聚类矢量后删除该胞腔,然后缩小距离门限值再次聚类提取,依次循环直到聚类矢量个数达到要求。将提取的聚类矢量作为初始码书,进行LBG算法码书设计,有效地改善了传统LBG算法依赖于初始码书而容易陷入局部最优的缺点,采用改进算法生成的码书更接近全局最优,加快了收敛速度。仿真结果证明了该方法的有效性。  相似文献   

20.
声音匹配识别技术是将被识别的目标声音对象和声音样本进行比对,得到目标声音和样本的一致性判断.本文通过对声音的特性分析,提出了一种高效的识别算法,采用声音特征参数提取、矢量化(Vector Quantization)技术、样本匹配等手段,克服了一般声音识别算法存在的占用CPU时间长、识别速度跟不上语速的弱点,提高了声音识别正确率.经过实际测试,识别准确率高达99%以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号