共查询到19条相似文献,搜索用时 171 毫秒
1.
基于VQ的说话人识别系统的实现 总被引:1,自引:0,他引:1
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。 相似文献
2.
采用基于听觉特性的Mel频率倒谱系数作为说话人识别特征参数,对概率神经网络进行了描述,并使用该网络进行了文本无关说话人识别研究.实验表明,对20名说话人,用7秒语音训练,3秒语音识别时,该方法可达到96.7%的正确识别率. 相似文献
3.
为了有效提取语音特征,提高说话人识别的准确率,系统采用基于有限状态机的端点检测算法对原始语音做VAD处理,提出了新的特征组合参数:基于人的听觉特性的MFCC参数、基于发音生理特征的基音轮廓特征以及衍生的基音周期一阶差分、基音周期变化率,并将它们作为说话人识别系统的特征参数,建立了基于VQ的识别模型.实验表明:本文系统使用VAD,使系统的识别率提高了5%8%,较单独使用MFCC参数的说话人识别系统的识别率提高了2%3%. 相似文献
4.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。 相似文献
5.
比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。 相似文献
6.
MFCC中的基音频率信息对说话人识别系统性能的影响 总被引:2,自引:0,他引:2
目前对MFCC的应用与研究,一般忽略了基音频率对MFCC的影响.分析发现,基音频率会影响MFCC对声道特性的准确描述,进而影响说话人识别系统的性能;由此提出了一种基于平滑幅度谱的SMFCC(smoothing MFCC),在YOHO说话人识别数据库上的实验表明,SMFCC性能在整体上优于MFCC,而在女性说话人数据集上性能提高尤其明显,并且具有更好的时间鲁棒性. 相似文献
7.
探讨了HMM(隐马尔可夫模型 )在说话人识别领域中的应用 ,并对说话人确认系统中的关键问题———确认阈值的确定 ,提出了一种新的解决方法。实验结果表明 ,该方法较好地解决了不同说话人的确认阈值的确定问题。 相似文献
8.
实现了一个基于双分界面的支持向量机的文本无关说话人识别系统,该系统在建立模型的过程中使用高斯混合模型进行特征提取,有效地减少了数据集的规模。与传统的支持向量机方法相比,该方法不仅达到了更高的识别率,对环境具有良好的鲁棒性,并且降低了算法的时间复杂度。由于该方法对大规模数据集的处理能力,使其比传统的方法更适合应用于实际。在相关实验中,也证实了该方法的有效性。 相似文献
9.
说话人识别中语音特征参数研究 总被引:1,自引:0,他引:1
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。 相似文献
10.
连接数字语音识别系统的DSP实时实现 总被引:2,自引:0,他引:2
:针对各种数字信息,实现了一种基于TMS320C5x 评价模块(EVM)的与特定人无关的连接数字语音识别系统.在分析了连续概率密度的隐马尔可夫模型(CDHMM)基础上,利用LPC倒谱系数、LPC差分倒谱系数、能量归一化系数及其差分系数作为语音特征矢量,训练和识别采用Viterbi算法和Baum -Welch 重估算法,有效地提高了系统的识别率.给出了实现各个阶段所需的时间,比较了简单模板匹配法和隐马尔可夫模型法以及不同语音特征参数对识别率的影响.在具体实现中,着重处理了抗噪及实时实现问题.实验结果表明,本系统在普通机房条件下取得较满意的效果,正确识别率达到92% ,为其实用化提供了较为重要的技术途径. 相似文献
11.
用DSP技术开发的一种新的语音识别系统 总被引:2,自引:0,他引:2
本文介绍了一种基于听觉谱特征参数的语音识别方法和系统.该系统采用高速DSP芯片TMS320C25,实现了语音信号的实时处理.用由此芯片开发的EISA插卡与计算机结合,构成了一个智能化语音输入实时识别系统.实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人和有噪情况下,系统正识率分别为95%和90%以上.通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好 相似文献
12.
针对数字信号处理器(DSP)构成的专用并行处理系统的软件调试存在较多困难这一问题,提出了系统级调试的概念,在层次化总线硬件架构模型的基础上,讨论了系统软件调试的基本方法和任务,并采取层次化数据结构、静态符号表自动生成、可扩展底层接口等关键技术实现了一种专用多DSP系统调试工具.分析表明,此调试工具大大减轻了实时信号处理软件的调试工作量. 相似文献
13.
语音情感识别是人机交互、情感计算中重要的研究方向.目前普遍使用深度神经网络用于语音情感特征的提取,但使用哪种神经网络模型、如何缓解模型过拟合问题还需进一步研究.针对这些问题,提出了一种结合一维卷积(CNN)以及门控循环单元(GRU)的CGRU模型,从原始语音信号的MFCC特征中提取语音的低阶以及高阶情感特征,并通过随机森林对其进行特征选择,在三种公用的情感语料库EMODB,SAVEE,RAVDESS上分别取得了79%,69%以及75%的识别精度.通过添加高斯噪声及改变速度等方法来增加样本量实现数据扩充,进一步提高了识别精度.通过在线识别系统验证了模型在实际环境中的可用性. 相似文献
14.
数字波束合成(DBF)数据基带系统设计中,为了实现实时数据传输和处理功能,需要合理利用各种现代电子开发工具.DSP实现数据运算方便,而FPGA则可以达到较高速度,利用二者各自优势,在DSP中,首先进行波达方向估计,并用直接矩阵求逆算法计算权值;而在FPGA中,则完成输入数据的缓存和加权求和,从而实现系统功能.实验结果表明,该方法可以实现波达方向估计,权值求解,加权求和功能,并满足实时性要求. 相似文献
15.
陈燕 《华侨大学学报(自然科学版)》2010,31(2)
研究低密度奇偶校验码(LDPC)的数字信号处理实现,并采用TMS320C5409DSP芯片进行算法实现.优化和积算法中的具体运算,调整译码顺序,将硬判决放入变量节点中运算,校验和放入校验节点运算中,避免重复寻址,给出与现场可编程门阵列的通信方法.在时钟频率为20 MHz,译码迭代次数为10次时,测试得到的速率为20.4 kbit.s-1. 相似文献
16.
为实现小波包多载波调制,设计了小波包多载波调制的DSP实现方案.采用一种等效结构,将小波包多我波调制转化为串/并变换、小波包综合和脉冲成形3个环节,小波包综合和脉冲成形由小波包快速算法(Mallat算法)实现.以高速浮点DSP为硬件平台,编程采用软件流水优化和DMA技术.利用Mallat算法的特点,采用交替组合法使算法中乘法的运算量减半.所设计的软件在TMS320C6701EVM评估板上成功实现实时运行.CCS环境下的实测结果表明:软件流水方法产生目标代码的运行效率已接近该DSP的最高性能. 相似文献
17.
18.
基于通用DSP的数字电视信源解码器硬件实现 总被引:2,自引:1,他引:2
针对目前国际上数字电视信源解码器主流解决方案即专用芯片方案缺乏广泛适应性和功能改变的灵活性等。提出了基于通用数字信号处理器TMS320C6415的标准清晰度数字电视信源解码器的总体设计方案和硬件实现方法.该方案可用软件实时实现传送流解复用、音频和视频解码,系统运行稳定可靠,音、视频输出质量良好. 相似文献
19.
CDPD( 蜂窝数字分组数据)是利用模拟蜂窝电话网实现分组数据传输的一种网络技术,其数据链路层的功能主要是提供一条可靠、高效的逻辑连接。以DSP( 数字信号处理器) 为处理平台,用汇编语言实现了移动终端系统(MES) 的数据链路层软件功能。对该实现过程中采用的一些方法和技术进行了较深入的探讨 相似文献