期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

非特定人普通话孤立数字音识别系统

王舟谢锦辉《华中科技大学学报(自然科学版)》1994,(11)

通过分析汉语语音及非特定人语音特点，选择过零率、能量、基音周期和前两个共振峰作为语音特征，用音素分类的方法构造判决树，在此基础上，给出了一个非特定人普通话孤立数字音（０～９）识别系统，识别率大约为９６．６％。相似文献

2.

利用声调提高中文连续数字串语音识别系统性能 总被引：2，自引：0，他引：2

章文义朱杰徐向华《上海交通大学学报》2004,38(2):185-188

采用平均幅度差法、自相关函数法和简单逆滤波器跟踪法相结合的方法计算语音信号的基音频率。根据声调模式的不同，采用基于规则的方法对声调进行识别，对连续数字串识别中一些易混淆的数字对进行区分，从而达到提高数字串识别系统性能的目的。相似文献

3.

语音识别和说话人识别中各倒谱分量的相对重要性 总被引：37，自引：0，他引：37

甄斌吴玺宏刘志敏迟惠生《北京大学学报(自然科学版)》2001,37(3):371-378

采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度,在标准英文数字语音库上的实验表明,最有用的语音信息包含在MFCC分量C₁到C₁₂之间,最有用的说话人信息包含在MFCC分量C₂到C₁₆之间。MFCC分量C₀和C₁包含有负作用的说话人信息,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。相似文献

4.

一种新型的与文本相关的说话人识别方法研究

下载免费PDF全文

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献

5.

基于分类识别的隐马尔可夫模型语音识别技术

魏明哲《山西师范大学学报：自然科学版》2014,(3):26-29

通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围. 相似文献

6.

用于SOM神经网络语音识别的自适应局部搜索算法 总被引：1，自引：0，他引：1

胡光锐吴硕《上海交通大学学报》1996,30(7):130-133

采用一种基于自组织特征映射（ＳＯＭ）神经网络和隐马尔柯夫模型（ＨＭＭ）法结合的语音识别方法．根据语音信号的相关性，提出了一种自适应局部搜索算法．结果表明，该算法相对于全搜索算法而言，计算量小而又不降低识别率相似文献

7.

英汉语音翻译系统的关键技术分析

魏茂盛章森张冯厚《济南大学学报(自然科学版)》1998,(3)

介绍了国内外语音翻译系统的研究现状,分析了语音翻译系统的基本特点和工作原理,并结合作者在汉语语音识别与合成、英汉机器翻译等方面的工作,探讨了英汉语音翻译系统的设计与实现中的一些关键问题。相似文献

8.

一种抗噪声语音识别方法 总被引：2，自引：0，他引：2

胡光锐王昀《上海交通大学学报》1995,29(3):6-11

本文提出了一种抗噪声语音识别新方法，并以这种方法为基础，在ＳＵＮ工作站上实现了这一系统，实验结果表明，本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。相似文献

9.

一种基于奇异值分解的带噪语音识别方法 总被引：3，自引：3，他引：0

徐金甫韦岗梁树雄《华南理工大学学报(自然科学版)》2001,29(1):91-93

提出了一种抗噪声的语音识别方法,用于训练和用于测试的语音信号在提取特征之前,均需经过相同的奇异值分解滤波,本文还提出了一种滤波参数的选取方法,实验证明,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声性能。相似文献

10.

一种新型前向神经网络用于汉语四声识别 总被引：3，自引：0，他引：3

孙放胡光锐《上海交通大学学报》1997,31(5):36-38

提出了一种新型的前向神经网络，并研究了其在语音识别中的应用。该神经网络为只含一层非线性隐层的前向神经网络，以线性的输出层代替一般ＢＰ网络的非线性输出层，可以更准确地，范围更大地完成非线性函数估值功能。该神经网络采用了包括反向传播算法及最小均方算法的混合算法进行训练，可以减少落入局部最小点的概率以及提高收敛速度。相似文献

11.

语音信号非线性特征的研究 总被引：4，自引：0，他引：4

下载免费PDF全文

陈亮张雄伟《解放军理工大学学报(自然科学版)》2000,1(2):11-17

随着研究的深入,语音信号的非线性特征逐渐被人们发现,传统的基于分段线性的语音信号处理方法存在局限性,因此用非线性方法对语音信号进行处理对于提高处理质量相当重要。文章介绍了非线性理论在语音信号处理中的一些应用,首先采用延时相图法重构语音的混沌吸引子,然后用分形维数、Ｌｙａｐｕｎｏｖ指数等非线性动力学参数反映语音信号的非线性特征,设计计盒维数算法并行运用于语音分割,最后根据语音信号时域波形分形结构设计相似文献

12.

多重分形维数在语音分割和语音识别中的应用 总被引：4，自引：0，他引：4

董远胡光锐《上海交通大学学报》1999,33(11):1406-1408

语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具．由于传统的Ｈａｕｓｄｏｒｆｆ－Ｂｅｓｉｃｏｖｉｔｃｈ维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点．实验表明,多重分形维数语音分割方法明显好于单一Ｈａｕｓｄｏｒｆｆ－Ｂｅｓｉｃｏｖｉｔｃｈ分形维数的语音分割方法相似文献

13.

一种改进的混合型语音识别方法 总被引：2，自引：1，他引：1

胡光锐林昱弘《上海交通大学学报》1994,28(6):77-83

提出了一种改进的ＨＭＭ语音识别方法，其主要特点是引入了加权函数算法，以减少系统的误识率，实验结果表明，这种识别方法不仅能提高系统的识别率，而且所需训练样本少。相似文献

14.

图书数字化的语音检索与识别

丁聿《科技情报开发与经济》2011,21(5):83-85

简要介绍了语音检索的概念,从汉语音韵特征和检索模块两个方面探讨了图书数字化过程中语音检索与识别的处理方法和可能的发展方向。相似文献

15.

高性能汉语数码语音识别算法 总被引：13，自引：0，他引：13

李虎生刘加刘润生《清华大学学报(自然科学版)》2000,40(1)

提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% . 相似文献

16.

基于CDD-SPM算法的语音识别电话的研制

钟明江太辉余英林《五邑大学学报(自然科学版)》1999,13(2):20-24

本文简要介绍了语音识别电话的识别算法CDD—SPM及其硬件结构,并详细介绍了CDD－SPM在语音识别电话上用ALEP2186的汇编语言实现的过程。相似文献

17.

基于DTW的俄语短指令语音识别

王彤马延周易绵竹《山东大学学报(理学版)》2017,52(11):29-36

面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。相似文献

18.

大词汇量环境噪声下的多模态视听语音识别方法

下载免费PDF全文

吴兰杨攀李斌全王涵《广西科学》2023,30(1):52-60

视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。相似文献

19.

一种特定人声道频率响应的精确的提取方法 总被引：2，自引：2，他引：0

卢侃和应民陈立伟《应用科技》2005,32(6):4-6

提出了一种在浊音中切取相当基音长度的一段波形,用傅里叶变换求出谱线,多次填充构造精确声道频率响应函数的新方法.经过实验,证实此方法特别适合特定人的语音识别,也能较好合成出模仿特定人的语音. 相似文献

20.

语音信号基本载体的研究

马明张焱《南京理工大学学报(自然科学版)》1996,20(5):437-440

语音信号特征的提取是语音识别的基础，目前使用的特征提取方法要将语音信息经多次复杂变换后提取特性。这样，往往满足不了实时性要求。该文对原始语音信号做简单处理，的实验，证明了经简单处理后语间信号波形比原始波形简单，直观，计算频域特征和自相关特征等简单方便，实时性好，并有望从中进一步发现新的语音特征提取方法。相似文献