首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。  相似文献   

2.
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题, 提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法. 通过提取每帧信号的能量谱包络, 去除部分与说话人相关的特征, 采用Gammatone滤波器组滤波, 经离散余弦变换后再进行倒谱提升, 得到改进的伽马频率倒谱系数特征参数. 将广播音频信号提取特征参数输入隐Markov模型中进行训练测试, 得到的语种识别结果表明, 该方法有效提升了广播音频语种识别的准确率, 优于目前使用的伽马频率倒谱系数特征及其衍生方法.  相似文献   

3.
语种识别的关键问题之一是提取语音信号中的语种鉴别性信息。近期,音素对数似然比(phone log-likelihood ratio,PLLR)的新特征被引入语种识别领域,并表现出了优异的性能。该文利用F比方法分析了PLLR特征向量各维的语种鉴别性大小,提出了加权音素对数似然比(weighted PLLR,WPLLR)特征,赋予PLLR特征中含有较多语种鉴别性信息的分量较高的权重。在美国国家标准技术署(National Institute of Standards and Technology,NIST)2007年语种识别测试集上的实验结果表明:相比于原PLLR特征,该文所提出的WPLLR特征在平均检测代价和等错率2个指标上都显著降低。  相似文献   

4.
基于贝叶斯理论的抽样方法,对结构的多模型结构识别问题进行试验研究.采用基于贝叶斯理论的多模型结构识别的概念与基本框架,以及马尔科夫链-蒙特卡洛模拟(MCMC),建立了有限元模型库.针对MCMC在参数维度较高时不易收敛和计算效率低下等问题,提出了一种改进的MCMC抽样方法来进行多模型结构识别.利用Matlab-Strand7的交互访问技术(API)能够进行大型结构有限元模型的参数自动修正,在获得校验后的有限元模型库后,能基于有限元模型的后验概率分布进行预测.为了验证该理论的可行性和有效性,针对一根简支梁的数值算例和一座实际大跨钢管混凝土桁架系杆拱桥进行了基于贝叶斯理论的结构识别研究与响应评估,并使用传统的单模型结构识别方法——遗传算法(GA)进行对比分析,结果表明本文提出的基于贝叶斯理论的多模型结构识别方法能够更好地进行结构响应预测.  相似文献   

5.
为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。比较了均值方差和排序两种归一化方法,并将多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明:排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7%的提升,并与GMM分类器有很强的互补性。  相似文献   

6.
为了克服测量响应的不确定性给乘员约束系统参数识别带来的困难,利用马尔科夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)采样和近似模型构造技术,提出一种基于贝叶斯推理的乘员约束系统不确定性参数识别方法.该方法结合约束系统参数的先验分布和测量响应,通过马尔科夫链在未知参数联合概率密度空间进行抽样,从而获得了织带刚度缩放系数和质量流率缩放系数的后验边缘概率密度函数.识别结果表明,相比于传统确定性识别方法,基于贝叶斯推理的不确定性参数识别方法不仅能有效给出乘员约束系统参数的概率分布,而且能够保证参数寻优的全局收敛性.  相似文献   

7.
面向手语自动翻译的基于Kinect的手势识别   总被引:1,自引:0,他引:1  
提出了一种基于3D体感摄像机Kinect设备实现面向手语自动翻译的手势识别方法,利用Kinect体感外设提供的深度图像实现手的检测,并通过OpenNI+NITE框架中函数获得手掌质心在三维空间中的位置,然后通过等值线追踪算法(又称围线追踪算法)和三点定位算法识别出手指实现了手势跟踪,最后通过矢量匹配方法识别手指名字,并设计了三层分类器来实现静态手势语的识别.相较于传统的基于数据手套和单目摄像机的方法,本方法识别的更准确.基于上述方法,实现了一个手势识别系统.实验结果显示,本文提出的方法更加简洁且行之有效.  相似文献   

8.
为了整合多种已有的端到端(P2P)流识别方法,支持对新识别方法的迅速扩展,提高分布式环境中的远程管理能力,提出了一种可扩展在线识别P2P流的架构(EAIOPF).首先,提出了识别程序最优序列的思想,即通过优化多个识别程序的运行顺序,提高系统的运行效率;然后,提出了在线更新识别方法的机制,根据该机制,无需重新编译程序就能扩展P2P流的识别功能;最后,设计了一种远程管理机制,实现对识别程序的远程更新、启动与停止.针对原型系统的测试结果表明,EAIOPF能有效提高识别系统的性能,支持在线更新识别方法和远程管理,为高速网络环境中整合多种P2P流识别方法提供了可行方案.  相似文献   

9.
现有低分辨雷达目标识别通常采用先特征提取、再进行目标分类的两步识别算法,存在识别率难以提高和方法泛化性不足的问题,因此提出了一种基于卷积神经网络(CNN)的低分辨雷达目标一步识别算法。该算法直接将采样数据作为输入,利用设计的一维CNN,通过卷积池化等操作自动获取数据深层本质特征,无需特征提取,实现对目标的一步识别。仿真实验结果表明:基于CNN的低分辨雷达目标一步识别方法的识别率较传统基于提取特征的两步识别方法提高了10.31%,识别时间较传统两步识别方法减少了0.142 s,充分证明了一步识别方法的有效性,为低分辨雷达目标识别问题提供了新的解决途径。  相似文献   

10.
针对基于惯性传感器的步态识别方法在动态情况下表现不佳且计算复杂度较高的问题,提出一种基于重构吸引子融合盒近似几何(BAG)方法。首先,将人类步态视作一个动态系统,根据Taken理论在潜在空间重构吸引子;然后,利用奇异谱分析方法获得奇异值,并将其应用于惯性传感器的标量测试;最后,利用盒近似几何方法完成步态识别。针对20个不同对象的模式分析了各种参数对步态识别性能的影响,实验结果表明,相比其它几种步态识别方法,本文方法能够实现高精度的识别且具有较低的计算复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号