期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡光锐吴硕《应用科学学报》1997,15(1):55-60

该文提出了一优化的自组织学习集，基于自组织征映射神经网络和隐马尔柯夫模型法，组成了一种新的语音识别系统。该系统采用ＳＯＭ网络作为矢量量化器。实验结果表明，该文提出的语音识别方法确实能提高系统的识别率。相似文献

2.

王龙杨俊安陈雷林伟刘辉《应用科学学报》2015,33(3):253-261

计算复杂度高导致循环神经网络语言模型训练效率很低,是影响实际应用的一个
瓶颈. 针对这个问题,提出一种基于批处理(mini-batch) 的并行优化训练算法. 该算法利用
GPU 的强大计算能力来提高网络训练时的矩阵及向量运算速度,优化后的网络能同时并行处
理多个数据流即训练多个句子样本,加速训练过程. 实验表明,优化算法有效提升了RNN 语
言模型训练速率,且模型性能下降极少,并在实际汉语语音识别系统中得到了验证. 相似文献

3.

基于邮政信息网的IP语音系统的设计与实现

王刚张媛媛何刚张羽《河南科技》2013,(19):19-21

在邮政企业已有的网络资源基础上,进一步优化网络结构、充分发挥现有设备的最大效能,是信息化建设的一项重要工作。遵循快速原型模式与V模式组成的混合模型的原则,对IP语音系统的设计原则、功能、以及IP语音通信系统移植、抖动处理、网守等关键技术进行分析研究,提出了系统实现的整体网络架构。相似文献

4.

离散变换算法在关键词检测系统中的研究

马晓梅王国权高辉王伟《哈尔滨师范大学自然科学学报》2013,(4):44-47

阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性. 相似文献

5.

语音增强技术在关键词检测系统中仿真研究

马晓梅韩娜《哈尔滨师范大学自然科学学报》2011,27(3):52-54,62

描述了一个机票定制系统,在强噪声环境的公共场所针对汉语小词汇量非特定说话人的连续无限制语音流中检测出其中的关键词语音.为增强其关键词语音信号提出建立一种新的基于行为模式分解的语音增强算法.对同一噪声环境下增强关键词语音信号的HMM与未增强关键词语音的HMM进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检... 相似文献

6.

基于自组织特征映射的神经网络的矢量量化 总被引：1，自引：0，他引：1

曹春红《松辽学刊》2001,(4):88-90

本文设计了一种神经网络矢量量化编码方法－基于自组织特征映射的神经网络的矢量量化,利用Kohonen网络的自组织聚类功能,设计矢量量化器码书,实现矢量量化。该神经网络速度快,效率高,适用于语音和图象数据压缩,并对SOFM算法应用于图象矢量量化进行系统的研究。相似文献

7.

家庭基站网络分布式资源分配算法

王双叠王江徐景滕勇 HORNEMAN Kari 《应用科学学报》2012,30(5):487-492

针对具有自组织特性的家庭基站(home eNodeB, HeNB) 网络,提出了一种分布式资源分配算法. 该方法首先使HeNB 根据网络状况选择分量载波,而当接收到邻小区的重选请求时,可以重新选择备用载波列表中的载波,释放当前使用的载波给邻居使用,从而提高HeNB 获得可行载波的可能性. 使HeNB 根据优化目标函数自主地进行功率优化,以减少小区间干扰并提高系统容量. 通过蒙特卡罗方法分析该算法的性能,仿真结果表明：该资源分配算法能够提高用户的平均吞吐量并降低中断概率. 相似文献

8.

自底向上加快神经网络学习的算法

杨钟瑾《湖南师范大学自然科学学报》2006,29(3):39-44

介绍了一种加快神经网络学习的改进算法.这种改进算法结合采用快速自底向上构造神经网络算法和动态优化学习参数算法.首先,快速自底向上构造神经网络算法自动地构建神经网络的优化结构;随后,动态优化学习参数算法动态地调整和选取优化的学习参数.实验结果显示,这种改进算法能自动有效地构造网络的优化结构,与其它算法相比,具有更好的分类性能、优化的网络结构和更快的学习速度. 相似文献

9.

语音信号的主分量特征 总被引：7，自引：0，他引：7

何振亚顾明亮《应用科学学报》1999,17(4):427-437

利用曲线拟合与主分量神经网络相结合的方法,提出了一种既反映声道变化符合人耳听觉特点和语音识别新特征。与其他神经网络识别特相比,新特征不仅可以提高语音识别准确率,而且具有算法简单,存储容量小,便于实时实现的特点。相似文献

10.

高合成质量的语音转换系统

徐宁 YANG Zhen 《应用科学学报》2008,26(4)

提出并实现了一种基于STRAIGHT模型的、合成语音质量较高的语音转换系统。一方面STRAIGHT模型可以对语音的基频、时长等参数进行较大幅度的修改而不引起合成语音质量的下降,另一方面引入“预测”谱参数的概念,利用搜索预测码书的方法进行转换,既避免了经典系统中GMM模型谱参数估计的过平滑问题,又克服了经典系统基于LPC模型合成语音时,在帧与帧连接处会产生较大脉冲波形的缺点。语谱图分析、ABX测试和MOS分评价结果表明：提出的语音转换算法在合成语音质量和目标说话人特征映射上都远远好于经典的基于LPC模型的GMM转换系统。相似文献

11.

基于二阶差分耳蜗模型的语音识别新方法

余小清万旺根陶安袁京贤《应用科学学报》2000,18(1):80-84

采用二阶差分耳蜗模型对语音信号进行特征参数提取,获得了基于听觉谱的语音识别前端特征参数,同时根据听觉谱特征提出了一种"幅和频差积"距离测度,识别算法采用端点放松两帧,路径斜率限制在1/2到2之间的改进型DTW算法.在小词汇量非特定人(SI)的识别环境下,计算机模拟结果表明此法在对0~9十个数字以及小词汇量的SI识别时,其正识率可达98%以上,且具有较好的鲁棒性. 相似文献

12.

MHMM和ANN法结合的语音识别方法 总被引：1，自引：1，他引：1

胡光锐周浩《应用科学学报》1995,13(3):314-318

提出了一种改进的隐马尔柯夫模型（ＭＨＭＭ）方法，并在ＭＨＭＭ方法中结合进人工神经网络（ＡＮＮ）方法，以这种方法为基础建立了语音识别系统。实验结果表明，与隐马尔柯夫模型方法比较，新系统的识别率有所提高，从而，充分地显示了人工神经网络在语音识别中的可行性和有效性。相似文献

13.

基于高斯相似度分析的最大后验非线性变换HMM自适应算法

刘海滨吴镇扬赵力曾毓敏《应用科学学报》2004,22(4):433-437

由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法. 相似文献

14.

训练方法对汉语数字串识别率影响的研究

汤霖蔡莲红《湘潭大学自然科学学报》2003,25(3):16-20

在语占识别系统中，都是通过提取特征向量来计算待识语音与模型之间的概率或距离，然后根据最大概率或最小距离判断待识语爵的类别．对大量实验数据的观察发现：特征向量的各维对语音的表达能力是不一样的，同时特征向星在语音的时间轴上表达能力也不一样。根据这种特性，提出了三种训练算法：在训练中计算出加权矩阵，以此来加强易混淆数字间的本质区分特征，减弱随机特征，在汉语数字串识别实验中，得到了比较理想的实验结果，错误下降40．8％，系统识别率上升到94．08％。相似文献

15.

基于MAP算法的无教师讲者自适应的研究

赵力邹采荣吴镇扬《应用科学学报》2003,21(4):353-356

提出了一种基于MAP算法的连续语音识别无教师讲者自适应方法,给出了简单有效的渐进自适应公式.通过识别实验结果表明,提出的方法能利用少量的自适应数据达到满意的学习效果,是一种实用和有效的讲者自适应方法. 相似文献

16.

基于模糊MLP网络的清浊音判决

毛六平唐艳王耀南《湖南师范大学自然科学学报》2003,26(4):27-30

讨论了一种新型的模糊MLP神经网络及其在清浊音判决中的应用，该网络实现了多参量的综合评判，而且有效地处理了语音信号的模糊性，从而获得了较高的判决准确率。相似文献

17.

识别LSB和USB的门限自适应算法 总被引：1，自引：0，他引：1

方晓青纪勇徐佩霞《应用科学学报》2003,21(1):1-4

基于语音谱的统计特性提出了一种从模拟话音SSB信号中自动识别出LSB或USB调制方式的算法.该算法简单,计算量小,非常适合用DSP来实时实现;门限自适应处理使得该算法鲁棒性较好.仿真结果表明该算法在低信噪比时仍有令人满意的识别效果. 相似文献

18.

融合音频、文本、表情动作的多模态情感识别

贾宁郑纯军《应用科学学报》2023,41(1):55-70

针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆（long short-term memory, LSTM）网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明：所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。相似文献