首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。  相似文献   

2.
基于实码遗传算法的河流水质模型的参数估计   总被引:5,自引:2,他引:5  
针对理想条件下采用解析法往往导致水质参数估计较大误差的问题,以及针对含有多参数的二维水质模型的参数估计问题,具体介绍了采用有限单元法和实码遗传算法求解二维水质模型未知参数的基本步骤,对水质参数(包括纵向、横向弥散系数和衰减系数)分别进行编码,通过计算机模拟浓度输出,并与实测值比较从而得出最优的水质参数估计值.算例表明,采用有限单元法-遗传算法估计河流水质模型的参数是可行的.  相似文献   

3.
通过对VQ码本在线性频谱域进行噪声补偿,使得补偿后的VQ码本逼近测试环境下训练出的码本,从而提高说话人辨认系统的性能。实验中,在不同的信噪比条件下测试辨认率,并将补偿和没有补偿时的辨认率进行比较,结果显示,该算法能够有效地提高说话人辨认系统的性能。  相似文献   

4.
支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。  相似文献   

5.
针对最大似然训练分辨能力的不足,把最大互信息训练方法引入到高斯混合模型(GMM)的训练中,并直接采用进化策略实现模型参数的全局训练,以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强,而且摆脱了局部搜索的缺陷。实验结果表明,这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法(EM)生成的系统。  相似文献   

6.
笔者设计了一种主从式控制结构的计算机模拟训练系统,采用电容式触控按键和电子开关分别代替实际的机械式拇指轮按键和拨码开关作为输入单元,数码管作为实时显示操作结果窗口,搭建的系统可完成多种车型计算机的模拟训练任务,有效地提高了训练设备的使用寿命和操作人员的训练效果。  相似文献   

7.
探讨了层次混合专家(HME)模型在说话人辨认中的应用。对于一个多路分类问题,提出了一个推广的贝努利概率分布密度函数,取代早先用于HME中的多项式概率分布密度函数。利用提出的概率分布密度函数和HME模型,用EM学习算法对模块网络进行训练所得到的说话人辨认系统不仅具有良好的性能,而且具有非常快的训练速度  相似文献   

8.
研究了与文本无关的说话人辨认系统中一种新的使用基音周期方法。在说话人辨认系统中将矢量量化(VQ)、高斯混合模型(GMM)分类器结合,使用升正弦窗函数加权的线性预测倒谱系数(LPCC)。在训练时为训练集中的每个说话人估计一个一维高斯形式的基音周期概率密度函数;在识别时,将测试语音中提取的基音周期在训练集说话人基音周期概率模型中得到的基音周期概率密度对VQ、GMM分类器的似然测度加权,形成新的似然测度。实验结果表明,使用新的似然测度进行与文本无关的说话人辨认比VQ、GMM分类器的辨认率有较大的提高,码字个数为8,测试时间为8s时,辨认率相对VQ提高约13%。  相似文献   

9.
直接序列扩频信号快速捕获   总被引:8,自引:0,他引:8  
提出一种新的基于频域并行搜捕法的改进型快捕电路结构.该结构利用设计复用技术实现FFT单元和IFFT单元的复用;通过软件计算本地伪码FFT,并将其结果存储在ROM中,使硬件规模大幅减少;采用并行设计提高系统的运算速度;采用块浮点算法提高动态范围和运算精度.整个快捕电路由一块FPGA XC2V3000-5实现,工作时钟为29 ns,精度为1/4码片情况下,伪码捕获仅需4.145 ms.仿真和测试结果验证了设计的正确性.  相似文献   

10.
基于GA/VQ的说话人辨认的研究与实现   总被引:3,自引:0,他引:3  
为了改善在矢量量化说话人识别中,采用模板(码书)表征说话人,模板的质量对识别系统的性能。采用遗传算法改进模板的生成方式,构建了一种GA/VQ说话人辨认系统,给出了一种GA/VQ识别算法,通过遗传操作获得全局优化的说话人模板。实验证明,GA/VQ方法提高了码书的质量,比经典矢量量化识别系统识别率高。  相似文献   

11.
本文从实践角度出发以芯片的存贮方式和语音合成方式为依据分析了一些主流语音合成芯片的特征,提出了选择芯片的原则和方法。分析了语音作为控制信号的特点,并就语音控制脉冲的取得、电路的消抖、语音和语音控制信号的分配问题提出解决措施。另外还分析了影响音质量的几个主要方面:滤波、功放电路、录音期间的回授等并就这几方面提出改善语音质量的措施。  相似文献   

12.
对基于ADSP2186的语音识别电话的硬件结构作了简明的介绍,并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。  相似文献   

13.
比较详细地描述了由AT&T、法国电信等几家公司新提出的、并为ITU T采纳、作为 4kbit/s语音编码国际标准的一种候选方案 ,该方案所具有的优良编解码质量已被相应的ITU T独立主观测试和各种语言测试所证实。  相似文献   

14.
附加标注信息的语音数据库在语音识别研究中的作用十分重要。本介绍了我们开发的维吾尔语音数据库手工标注系统的功能及其在实现过程中采用的一些技术,并阐明了对语音数据库进行标注的重要性及切分的基本原理。  相似文献   

15.
从语音信号的多种常用分析方法着手,讨论了语音信号的特性,用C~(++)语言编程,实现了采用微机对语音信号进行分析,并可在屏幕上同时显示语音的时域波形、预测误差信号、自相关函数、LPC谱和FFT谱等,还提供了对语音进行编辑(包括增删、重叠、放大、缩小等)功能。  相似文献   

16.
提出用码激励线性预测(CELP)实现GSM半速率编码器的一种方案。该方案把中心削波和结构化码本相结合,并推导了加权滤波器响应的公式,使码本搜索的计算量大大降低,存储量显著减少,并获得高质量语音。计算机模拟结果表明,本方案编码速率为675kbit/s,合成语音MOS得分为35dB~40dB。该方案可以在一块TMS320C30上实时实现。  相似文献   

17.
新的通信方式和计算机网络的飞速发展,对语音信号的编码传输提出了新的要求。在新一代的网络中,希望能充分利用信号源的特征和信道的统计复用性,改变以往信源一般输出是恒定速率码流的特点,而以具有不同速率的分层编码和变速编码,作为新的信源编码系统。讨论了基于ADPCM、CELP和多类激励的多种变速率编码方案。实验表明,利用语音信号本身特征,达到高压缩比同时具有较高合成语音质量是可能的。  相似文献   

18.
本文对码激励线性预测编码器(CELPC)进行了分析,针对CELPC不能很好地重构语音高频部分以及缺乏迅速跟踪语音清、浊音转换部分的能力的问题,提出了随机码本主轴脉冲法和采用不同加权系数、附加低通滤波的自适应码本的搜索过程,以进一步提高合成语音的质量。同时,提出了一种简化的自适应码本和随机码本的联合优化法。计算机模拟结果表明,采用上述各种方法后,使CELPC的性能较原始算法有不同程度的提高。  相似文献   

19.
利用个人计算机强大的软、硬件平台,设计了一种机器人语音控制的方法,实验表明该方法能对机器人进行高效的语音控制.  相似文献   

20.
本分析了语音识别中的特征降维变换方法和特征鲁棒性问题,经实践证明:基于CDN分布的降维方法适合非特定人语音识别,具有突出的优越性,通过调整模型参数并使用含噪特征训练模型,解决特征鲁棒性问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号