排序方式: 共有34条查询结果,搜索用时 31 毫秒
21.
一种改进的新型说话人确认算法 总被引:1,自引:0,他引:1
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。 相似文献
22.
基于交叉熵顺序统计滤波的语音端点检测算法 总被引:2,自引:0,他引:2
为提高语音端点检测在强噪声环境下的准确率,提出了一种基于交叉熵顺序统计滤波(OSF)的语音端点检测算法。该算法以子带交叉熵为语音/非语音的区分特征,首先将每帧语音的频谱划分成若干个子带,估计出每个子带能量与背景噪声之间的交叉熵,然后把相继若干帧的子带能量交叉熵经过一组顺序统计滤波器,最后根据各帧交叉熵的值对输入的语音进行分类。实验结果表明:该算法能够有效地区分语音和非语音。特别是在强噪声环境下依然能够保持很高的检测率,具有鲁棒性。通过实验结果比较,该算法在性能上优于最近提出的基于能量顺序统计滤波和单纯交叉熵判别的两种方法。 相似文献
23.
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。 相似文献
24.
高性能汉语数码语音识别算法 总被引:13,自引:0,他引:13
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% . 相似文献
25.
为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母2部分建立的半音节隐含M arkov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。 相似文献
26.
基于多路线性预测技术的时延估计 总被引:1,自引:0,他引:1
很多麦克风阵列时延估计算法在噪声和混响环境下性能都会下降。该文提出一种基于多路线性预测(multi-ple linear prediction,MLP)的时延估计算法。通过传递函数比估计来消除通道间传递函数的非对称性,提高信号相关程度;空间预测技术引入了阵列冗余信息,并以相关系数矩阵作为时延搜索的目标函数,提高时延估计的可靠性。实验结果显示了多路线性预测算法的估计准确率更高,性能更加稳健。与几种经典算法相比,在噪声和混响环境下MLP算法的估计正确率分别提高了5%和30%以上。 相似文献
27.
An English speech recognition system was implemented on a chip,called speech system-on-chip (SoC).The SoC included an application specific integrated circuit with a vector accelerator to improve performance.The sub-word model based on a continuous density hidden Markov model recognition algorithm ran on a very cheap speech chip.The algorithm was a two-stage fixed-width beam-search baseline system with a variable beam-width pruning strategy and a frame-synchronous word-level pruning strategy to significantly reduce the recognition time.Tests show that this method reduces the recognition time nearly 6 fold and the memory size nearly 2 fold compared to the original system,with less than 1% accuracy degradation for a 600 word recognition task and recognition accuracy rate of about 98%. 相似文献
28.
基于鉴别性i-vector局部距离保持映射的说话人识别 总被引:1,自引:0,他引:1
为了进一步提高i-vector说话人识别系统的性能,该文提出了一种鉴别性i-vector局部距离保持映射(discriminant i-vector local distance preserving projection,DIVLDPP)的流形学习算法。该算法以i-vector间的Euclid距离作为度量准则,并以最小化同类点间距离同时最大化异类近邻点间距离的鉴别性准则作为优化目标函数,利用求解广义特征值的方法,得到最终的投影映射矩阵。在美国国家标准技术局2008年说话人识别核心数据集上的实验结果表明:该算法可以明显提高目前i-vector说话人识别系统的性能。 相似文献
29.
为了提高哼唱检索旋律匹配的速度和精度,提出了一种基于帧-音符方式的匹配算法。该算法针对旋律曲线的形状特点,采用基频序列表示哼唱片段,采用音符序列表示模板片段,根据累积权重估计基频跳变点位置,然后计算哼唱片段和模板片段之间的编辑距离。在MIREX08数据库上进行的实验结果表明:该算法检索时间为动态时间规整算法的0.013倍;与动态时间规整算法结果进行融合,最终平均排序倒数精度指标可以达到91.2%。 相似文献
30.
太原市早春开花植物的初步研究 总被引:4,自引:0,他引:4
对太原市的早春开花植物进行了初步研究,共计有39科,82属,148种。此外,还对太原市早春开花植物的资源利用进行了讨论。 相似文献