共查询到18条相似文献,搜索用时 140 毫秒
1.
该文提出了一优化的自组织学习集,基于自组织征映射神经网络和隐马尔柯夫模型法,组成了一种新的语音识别系统。该系统采用SOM网络作为矢量量化器。实验结果表明,该文提出的语音识别方法确实能提高系统的识别率。 相似文献
2.
3.
4.
阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性. 相似文献
5.
描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检... 相似文献
6.
基于自组织特征映射的神经网络的矢量量化 总被引:1,自引:0,他引:1
本文设计了一种神经网络矢量量化编码方法-基于自组织特征映射的神经网络的矢量量化,利用Kohonen网络的自组织聚类功能,设计矢量量化器码书,实现矢量量化。该神经网络速度快,效率高,适用于语音和图象数据压缩,并对SOFM算法应用于图象矢量量化进行系统的研究。 相似文献
7.
针对具有自组织特性的家庭基站(home eNodeB, HeNB) 网络,提出了一种分布式资源分配算法. 该方法首先使HeNB 根据网络状况选择分量载波,而当接收到邻小区的重选请求时,可以重新选择备用载波列表中的载波,释放当前使用的载波给邻居使用,从而提高HeNB 获得可行载波的可能性. 使HeNB 根据优化目标函数自主地进行功率优化,以减少小区间干扰并提高系统容量. 通过蒙特卡罗方法分析该算法的性能,仿真结果表明:该资源分配算法能够提高用户的平均吞吐量并降低中断概率. 相似文献
8.
杨钟瑾 《湖南师范大学自然科学学报》2006,29(3):39-44
介绍了一种加快神经网络学习的改进算法.这种改进算法结合采用快速自底向上构造神经网络算法和动态优化学习参数算法.首先,快速自底向上构造神经网络算法自动地构建神经网络的优化结构;随后,动态优化学习参数算法动态地调整和选取优化的学习参数.实验结果显示,这种改进算法能自动有效地构造网络的优化结构,与其它算法相比,具有更好的分类性能、优化的网络结构和更快的学习速度. 相似文献
9.
语音信号的主分量特征 总被引:7,自引:0,他引:7
利用曲线拟合与主分量神经网络相结合的方法,提出了一种既反映声道变化符合人耳听觉特点和语音识别新特征。与其他神经网络识别特相比,新特征不仅可以提高语音识别准确率,而且具有算法简单,存储容量小,便于实时实现的特点。 相似文献
10.
提出并实现了一种基于STRAIGHT模型的、合成语音质量较高的语音转换系统。一方面STRAIGHT模型可以对语音的基频、时长等参数进行较大幅度的修改而不引起合成语音质量的下降,另一方面引入“预测”谱参数的概念,利用搜索预测码书的方法进行转换,既避免了经典系统中GMM模型谱参数估计的过平滑问题,又克服了经典系统基于LPC模型合成语音时,在帧与帧连接处会产生较大脉冲波形的缺点。语谱图分析、ABX测试和MOS分评价结果表明:提出的语音转换算法在合成语音质量和目标说话人特征映射上都远远好于经典的基于LPC模型的GMM转换系统。 相似文献
11.
12.
MHMM和ANN法结合的语音识别方法 总被引:1,自引:1,他引:1
提出了一种改进的隐马尔柯夫模型(MHMM)方法,并在MHMM方法中结合进人工神经网络(ANN)方法,以这种方法为基础建立了语音识别系统。实验结果表明,与隐马尔柯夫模型方法比较,新系统的识别率有所提高,从而,充分地显示了人工神经网络在语音识别中的可行性和有效性。 相似文献
13.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法. 相似文献
14.
在语占识别系统中,都是通过提取特征向量来计算待识语音与模型之间的概率或距离,然后根据最大概率或最小距离判断待识语爵的类别.对大量实验数据的观察发现:特征向量的各维对语音的表达能力是不一样的,同时特征向星在语音的时间轴上表达能力也不一样。根据这种特性,提出了三种训练算法:在训练中计算出加权矩阵,以此来加强易混淆数字间的本质区分特征,减弱随机特征,在汉语数字串识别实验中,得到了比较理想的实验结果,错误下降40.8%,系统识别率上升到94.08%。 相似文献
15.
16.
讨论了一种新型的模糊MLP神经网络及其在清浊音判决中的应用,该网络实现了多参量的综合评判,而且有效地处理了语音信号的模糊性,从而获得了较高的判决准确率。 相似文献
17.
18.
针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory, LSTM)网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明:所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。 相似文献