期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘晓峰张雪英《太原理工大学学报》2011,42(1):34-37

利用纠错输出编码的矩阵编码构造出若干个无关的子支持向量机,用来改善分类模型的整体容错性能。使用了一对余、一对一、稠密型随机编码、稀疏型随机编码4种常用的纠错输出编码方法,用于训练集和测试集。实验结果显示,对于韩语非特定人小词汇量孤立词的语音识别,基于纠错输出编码的支持向量机比隐马尔科夫方法具有更高的识别率。其中,一对一编码是效果最好的。相似文献

2.

随机轨迹模型中汉语连续语音识别基元的选取方案

黄心晔施嵘富煜清陆佶人《东南大学学报(自然科学版)》1999,29(4):94

在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元．基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行．相似文献

3.

基于核典型相关分析和支持向量机的语音情感识别模型

《南京理工大学学报(自然科学版)》2017,(2)

为了获得更好的语音情感识别的实时性和正确率,该文提出了基于核典型相关分析和支持向量机的语音情感识别模型。首先提取多种情感识别的特征,采用核典型相关分析对特征进行选择,将选择的特征作为支持向量机的输入向量进行训练,建立情感识别的分类器,最后采用语音情感识别的标准数据库进行验证性和对比实验。实验结果表明,该模型能够准确识别不同类型的语音情感,获得较高的语音情感识别率。核典型相关分析减少了分类器的输入向量数,加快了情感识别速度,获得了理想的实时性。该文语音情感识别结果优于对比模型,具有更高的实际应用价值。相似文献

4.

随机轨迹模型中汉语连续语音识别基元的选取方案要

黄心晔施嵘《东南大学学报(自然科学版)》1999,29(4):48-51

在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。相似文献

5.

语音识别中基于支持向量机的声学模型研究

廖文婧《科技资讯》2009,(19):22-24

在语音识别中,声学模型常常采用聚类后的状态（senone）作为建模单元,其输出的分布大都采用高斯混合模型（GMM）,该模型采用多个高斯分布的加权和,描述复杂的概率分布。然而,由于该模型采用最大似然估计的方法,仅仅考虑了本类样本的概率最大化,而并没有考虑与其他类之间的关系。本文尝试对基于支持向量机的声学模型进行研究,支持向量机（Support Vector Machine,SVM）方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的机器学习方法在利用SVM判别senone类别时,本文对每个senone建立一个一对多模型。然后把SVM模型输出结果中的距离软化为得分,选取得分最高者判决为此senone所属的类别实验证明,利用SVM能够很好地判别senone,区分性要优于GMM。相似文献

6.

多特征和支持向量机相结合的语音端点检测模型

刘妮《重庆邮电大学学报(自然科学版)》2013,25(5):686-689

为提高语音端点检测正确率,提出一种基于多特征和支持向量机相结合的语音端点检测模型。首先提取多种语音特征,并将它们组合在一起,然后将组合特征输入到支持向量机训练建立相应的语音识别模型,最后采用建立模型对语音信号进行检测和识别。仿真结果表明,与其他检测模型相比,多特征融合和支持向量机的检测模型提高了语音端点检测正确率,具有更好的适应性和鲁棒性,对不同信噪比的信号都有较好的检测能力。相似文献

7.

人机语音交互中的情感语音处理

姜晓庆崔世耀殷艳华《济南大学学报(自然科学版)》2008,22(4)

选取三种典型的情感状态,通过对在不同情感状态下大量取样的语音样本的基频、能量、时长及相关韵律特征参数作统计分析,基于统计结果使用PCA方法进行情感状态识别实验,识别准确率达91.67%.结合情感识别结果,使用DTW算法通过模式匹配进行小词汇表的语音识别,提高语音识别正确率;给出输出语音韵律特征参数的调整方法,使人机语音交互得到更加人性化的改进. 相似文献

8.

基于投影中心距离的支持向量预选取

杨晓敏《四川大学学报(自然科学版)》2009,46(6)

支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。支持向量机在选择支撑矢量时却进行了大量不必要的运算, 成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的。投影中心距离算法是一种能够预选取支撑矢量的方法, 该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度。本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性。相似文献

9.

跨语言声学模型在维吾尔语语音识别中的应用

努尔麦麦提·尤鲁瓦斯刘俊华吾守尔·斯拉木热依曼·吐尔逊达吾勒·阿布都哈依尔《清华大学学报(自然科学版)》2018,(4)

对维吾尔语而言,由于数据采集和标注存在各种困难,用于训练声学模型的语音数据不够充分。为此,该文研究了基于长短期记忆网络的跨语言声学模型建模方法,利用汉语庞大的训练数据训练深度神经网络声学模型,然后将网络的输出层权重去掉,用随机化的方式产生与维吾尔语输出层对应的权重值,采用反向传播的方式,利用维吾尔语语音数据更新所有权重来训练维吾尔语声学模型。实验结果表明:该方法使维吾尔语转写和听写识别错误率分别比基线系统相对降低了20%和30%。该方法利用汉语大数据来训练神经网络的隐藏层,使维吾尔语声学模型能在一个较好的初始权重网络上进行训练,增强了网络的鲁棒性。相似文献

10.

基于投影中心距离的支持向量预选取

杨晓敏吴炜陈默何小海《四川大学学报(自然科学版)》2010,47(1):85-90

支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法.支持向量机在选择支撑矢量时却进行了大量不必要的运算,成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的.投影中心距离算法是一种能够预选取支撑矢量的方法,该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度.本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性. 相似文献

11.

Stream Weight Training Based on MCE for Audio-Visual LVCSR 总被引：2，自引：0，他引：2

刘鹏王作英《清华大学学报》2005,10(2):141-144

In this paper we address the problem of audio-visual speech recognition in the framework of the multi-stream hidden Markov model. Stream weight training based on minimum classification error criterion isdiscussed for use in large vocabulary continuous speech recognition (LVCSR). We present the lattice rescoring and Viterbi approaches for calculating the loss function of continuous speech. The experimental results show that in the case of clean audio, the system performance can be improved by 36.1% in relative word error rate reduction when using state-based stream weights trained by a Viterbi approach, compared to an audio only speech recognition system. Further experimental results demonstrate that our audio-visual LVCSR system provides significant enhancement of robustness in noisy environments. 相似文献

12.

组合核支持向量机个人信用评估模型

张玥赵凯黄全生《重庆工商大学学报(自然科学版)》2019,36(5):37-43

针对支持向量机模型在分类问题中的广泛应用,提出了一种新的基于支持向量机的个人信用评估模型,通过对支持向量机直方图交叉核、热核特征核、杰卡德距离核和余弦广义距离核4种核函数的组合处理,构造了投票矩阵;通过实际数据实验,获得了良好的分类结果,同时证明了支持向量机自适应组合核加权模型在信用评分系统中具有良好的性能;因此,这种基于支持向量机的个人信用评估模型可以帮助银行或贷款人做出正确的决策。相似文献

13.

基于GMM-UBM的语言辨识算法研究

陈业仙张歆奕毛杰《五邑大学学报(自然科学版)》2010,24(3):56-60

运用Matlab软件,以自己建立的语音数据库为基础,对与文本无关的基于GMM-UBM的语言辨识系统进行了测试,获得的平均识别率达74%,与传统GMM算法的测试对比,基于GMM-UBM的语言辨识算法能更好地改善语言辨识系统的性能. 相似文献

14.

基于元学习的语音识别探究

王璐潘文林《云南民族大学学报(自然科学版)》2019,(5):510-516

目前,高准确率的语音识别需要在大规模语料库上进行学习才能获得,然而大规模语料库的构建成本较高,某些语言很难采集到充足的语料,因此,基于小规模语料库的语音识别已成为目前挑战性的研究问题.元学习是模仿人类利用已有经验快速学习新知识的机器学习方法,在机器视觉单样本学习任务中表现出明显的优势,已成为新的机器学习研究热点.将元学习应用于单样本语音识别是解决基于小规模语料库语音识别这一挑战性问题的有效途径,在TIMIT和佤语数据库上,开展了基于Reptile元学习算法的单样本孤立词语音识别研究.实验结果表明,该算法能有效地提升模型收敛速度与泛化精度,从而提升了模型的学习能力,说明元学习方法有助于解决小规模语料语音识别这一挑战性问题. 相似文献

15.

连续语音的三音子DDBHMM识别方法

游展肖熙王作英《清华大学学报(自然科学版)》2009,(4)

针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。相似文献

16.

基于语音识别的机车自动过分相装置的研制

马帅旗张伟《陕西理工学院学报(自然科学版)》2014,(6):30-34

针对现有电力机车自动过分相装置成本高、维护不便等问题,提出了一种基于语音识别的电力机车自动过分相装置。利用专用语音识别模块对列车运行监控记录装置输出的语音信息进行识别,主控制模块根据识别结果和机车安全信息检测装置输出的串行数据帧,计算当前位置到达分相标的距离,并对距离进行补偿,当机车通过分相区时,机车受电弓自动断开。试验结果表明,该装置能够准确地识别列车运行监控记录装置输出的语音信息,保障机车安全、可靠地通过分相区,降低现有过分相装置的制造成本和维护费用。相似文献

17.

CHMM语音识别初值选择方法的研究 总被引：1，自引：1，他引：0

刘伶俐王朝立于震《上海理工大学学报》2012,34(4):323-326

针对隐马尔科夫模型用于语音识别时传统的参数初始化方法(随机分布之值、K均值算法)可能导致模型参数收敛于局部最优而非全局最优的问题,提出了先按最大距离选择初值中心,再按最小距离将原始数据分割成小类后去除类内干扰点,使类内相似性更强的K均值方法.实验结果表明,改进后的方法与传统方法相比,更好地平滑逼近语音特征,提高语音的识别率. 相似文献

18.

基于线性均方误差估值的LPC距离量度

谢锦辉黄载禄万发贯《华中科技大学学报(自然科学版)》1990,(4)

本文从LPC系数的统计特性出发,基于线性均方误差估值的思想,提出了一种用于语音识别的新的LPC距离量度——LMSE距离.在一个IBM-PC机语音处理系统和一个VAX-11/750机语音处理系统上,做了大量孤立词识别实俭,证实了这种距离的可行性.文中还将它与著名的Itakura距离进行了比较. 相似文献

19.

基于支持向量机的抗噪语音识别 总被引：3，自引：1，他引：3

白静张雪英《太原理工大学学报》2009,40(1)

阐述了支持向量机的分类机理,采用改进的MFCC语音特征参数,用基于不同核函数的支持向量机(SVM)作为语识别网络,对SVM多类分类问题采用"一对一"分类算法,实现了一个孤立词非特定人中等词汇量的抗噪语音识别系统。通过实验,得到了不同核函数下的识别结果;分析了核参数和误差惩罚参数对SVM推广能力的影响,并将实验结果同基于RBF神经网络的识别结果进行了比较。相似文献

20.

一种新型的与文本相关的说话人识别方法研究

下载免费PDF全文

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献