首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
探讨了层次混合专家模型在说明人辨认中的应用。对于一个多路分类问题,提出了一个推广的贝努利概率分布密度函数,取代早先用于HM中的多项式概率分布密度函数。利用提出的概率分布密度函数和HME模型,用EM学习算法对模块网络进行训练所得到的说明人辩认系统不仅具有良好的而且具有非常快的训练速度。  相似文献   

2.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

3.
两级决策的开集说话人辨认方法   总被引:10,自引:0,他引:10  
为了减少语音数据量 ,提高处理速度和识别的准确性 ,提出了一种采用公共码本、个人隐 Markov模型 (HMM)和个人拒识阈值进行两级决策来实现开集说话人辨认的新方法。在系统实现时 ,采用了一种改进的语音切分算法来提高输入数据的有效性 ,并将说话人识别和人脸识别融合在一起进行身份验证。实验证明这种融合方法能够有效地降低识别的相等错误率至 1%。  相似文献   

4.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

5.
提出了一种新的注册者模型——“时间一空间分布模型(TSDM)”,传统GMM用参数表征训练矢量的空间分布,但舍弃了训练矢量间的时间联系信息,而TSDM利用基于GMM中均值矢量的高阶协方差矩阵,可向训练矢量的空间分布模型中引入一定程度的训练矢量间时间联系.还给出了TSDM的判据生成方法.实验表明,TSDM能在长训练语句时获得与传统GMM相当的识别性能,在短训练语句时表现得更优秀.  相似文献   

6.
一种新的高斯混合模型参数估计算法   总被引:3,自引:0,他引:3  
该文提出了一种高斯混合模型(GMM)参数估计的改进算法.原始的特征向量先经Schmidt正交化消除各维间的相关性,再用数学形态学方法估计出各维概率分布中混合分量的真实个数,最后按真实的混合分量个数用EM算法对各维分别作标量GMM参数估计.该方法能缓解GMM传统参数估计算法引起的“不易扩展”的不便.实验结果表明,将其应用于说话人辨认,能在较大幅度提高训练速度的基础上相对传统GMM参数估计方法获得更高的识别率.  相似文献   

7.
为了提高基于G auss混合模型通用背景模型(GMM-U BM)的说话人辨认系统的运算效率,提出一种基于树的核心挑选算法(TBK S),通过将U BM中的各个G auss分布按组织成树形结构,来减少从中挑选核心分布的运算量。实验结果表明:对1 000个说话人进行辨认,TBK S与现有的基于特征矢量重排序的剪枝算法(ORBP)相结合,将基于GMM-U BM的辨认系统的运算速度提高21.9倍,误识率却只上升不到4%;TBK S和ORBP相结合,可大幅度提高GMM-U BM系统的运算效率,而基本不降低识别率。  相似文献   

8.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。  相似文献   

9.
针对经典支持向量机对非目标样本没有拒绝能力,且应用于说话人辨认时存在不可分区域的问题,提出一种基于模糊C均值聚类和模糊支持向量机的多级模糊说话人辨认方法。首先利用模糊C均值聚类方法对特征向量进行聚类,减少样本的数目,加快模糊支持向量机训练速度。最终由FSVM得出判决结果。并通过仿真实验验证了该方法的有效性。  相似文献   

10.
针对最小二乘支持向量机在语音数据大样本输入下的局限性,提出了一种基于GMM特征变换和模糊LS-SVM的学习算法,结合高斯混合模型在拟合数据分布方面和最小二乘支持向量机在分类辨别方面的突出优势,有效地提取说话者特征信息,压缩了数据,解决了大样本数据输入下最小二乘支持向量机的训练速度和测试精度问题,同时在LS-SVM系统中引入模糊隶属度函数,很好地解决了不可分数据的输出.理论研究和实验表明,所提方法能充分地利用训练数据,使得系统在具有更好辨别能力的同时提高了鲁棒性和识别率.  相似文献   

11.
提出一种新的可用于说话人识别的径向基函数网络(RBFN)阵列.RBFN网设计思想是在确定网络中心点之后采用最小线性方差作为目标函数解得最优权重,该方法并不能得到最优分类效果.使用Fisher目标函数,替代RBF中的误差目标函数来求取最优权重,用与文本无关的闭集说话人识别系统对该算法进行了验证,实验结果表明,该方法提高了RBF分类能力,比传统的RBF、算法以及ROLS算法具有更高的识别率,并在识别效果接近GMM方法的情况下计算量大幅度减少。  相似文献   

12.
Unseen handset mismatch is the major source of performance degradation in speaker identifica-tion in telecommunication environments.To alleviate the problem,a maximum likelihood a priori knowledge interpolation (ML-AKI)-based handset mismatch compensation approach is proposed.It first collects a set of handset characteristics of seen handsets to use as the a priori knowledge for representing the space of handsets.During evaluation the characteristics of an unknown test handset are optimally estimated by in-terpolation from the set of the a pdod knowledge.Experimental results on the HTIMIT database show that the ML-AKI method can improve the average speaker identification rate from 60.0% to 74.6% as compared with conventional maximum a posteriori-adapted Gaussian mixture models.The proposed ML-AKI method is a promising method for robust speaker identification.  相似文献   

13.
基于类别层次结构的多层文本分类样本扩展策略   总被引:1,自引:0,他引:1  
针对大规模多层文本分类训练样本获取代价高、类别分布不均衡等问题, 提出并比较几种基于类别层次结构的大规模多层文本分类样本扩展策略, 即利用类别层次体系中蕴含的类别名称、描述以及类别间的层次结构关系, 从内涵和外延两方面入手构造或扩展类别训练样本。在首次大规模中文新闻信息多层分类评测数据集上, 基于外延的局部样本扩展策略取得较好的性能。参测系统在第一级类别和第二级类别上宏平均F1分别为0.8413和0.7139, 在10个参赛系统中位列第二。  相似文献   

14.
说话人识别中特征参数提取的一种新方法   总被引:6,自引:0,他引:6  
提出了一种新的说话人识别中特征参数的提取方法.在分别使用傅立叶分析和小波分析得到两组特征参数之后,进一步利用Fisher准则进行参数选取,构造了一种新的混合特征参数.在不增加训练和识别时计算量的同时,结合了傅立叶分析和小波分析两者的优点,具有更好的分类能力,实验结果显示,这种新的混合参数有效地提高了说话人的识别率,能更好地表征说话人的特征。  相似文献   

15.
Unseen handset mismatch is the major source of performance degradation in speaker identification in telecommunication environments. To alleviate the problem, a maximum likelihood a priori knowledge interpolation (ML-AKI)-based handset mismatch compensation approach is proposed. It first collects a set of handset characteristics of seen handsets to use as the a priori knowledge for representing the space of handsets. During evaluation the characteristics of an unknown test handset are optimally estimated by interpolation from the set of the a priori knowledge. Experimental results on the HTIMIT database show that the ML-AKI method can improve the average speaker identification rate from 60.0% to 74.6% as compared with conventional maximum a posteriori-adapted Gaussian mixture models. The proposed ML-AKI method is a promising method for robust speaker identification.  相似文献   

16.
 识别储层流体性质是测井评价储层的内容之一,识别结果影响着对油气藏的认识和开发方案部署。本文以多种测井参数作为储层流体的分类参数,采用样品分解思想的交汇图和决策树方法对苏丹某油田流体性质进行分类建模。结果表明,(1) 单个交汇图最高识别正确率为80%,而样品分解思想将交汇图分为两个层次,可提高识别准确率,但是仍存在不足之处;(2) 决策树方法通过计算参数权重,依据权重大小自动挑选参数,识别准确率达到了86.7%;而交汇图和决策树法相结合,识别准确率可达到100%,弥补了样品分解交汇图的不足;(3) 原来认为苏丹某油田是具有统一油气界面的油气藏,应用决策树结合交汇图方法后,认为该油田应为层状油气藏;油田据此调整开发方案,取得了良好效果。  相似文献   

17.
利用分层分类法把厦门岛城市土地类型分为七类,并对分类结果进行了验证.在TM图像光谱特征分析和归一化差异型指数分析结论上,提出分层分类法的分类步骤.利用ERDAS的专家分类器逐类地提取土地类型,并利用掩膜法将原图像上新提取地类所对应区域掩膜掉,使得分类过程越来越容易.分层分类法避免了一次划分多种类别方法在选择波段组合上的矛盾.精度评价结果表明,总分类精度达到90.9%,达到分类要求标准.  相似文献   

18.
王淇 《科技促进发展》2018,14(4):264-269
加快知识产权强国建设,知识产权保护是关键,行政执法是重要的保护手段,而事实认定则是秉公执法的前提。在行政执法中引入专家技术鉴定,有利于借助独立第三方的协助发现事实,更为高效公平处理执法案件。构建这一机制,可从管理办法、监管体系、业务开展和职业培训等方面入手,通过先行先试的方法统筹协调,稳步推进。  相似文献   

19.
分类别层次化教学在计算机基础教学中的应用研究   总被引:1,自引:0,他引:1  
针对新形势下计算机基础教学中出现的问题和不足,研究了分类别层次化教学方法,提出了改革的实施内容和分类别层次化教学的具体方案.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号