期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

汉语方言民族语言语音材料处理软件设计 总被引：1，自引：0，他引：1

海柳文《广西民族大学学报》2005,11(3):60-64

语音材料是最便于用计算机程序进行的.该文设计的软件可以方便地处理《方言调查字表》、《壮语方言调查提纲》以及用户自制的调查表中的语音材料.并且可以随意将处理结果输出为DBF、TXT、XLS等格式的文件. 相似文献

2.

汉语方言民族语言语音材料处理软件设计

海柳文《广西民族大学学报》2005,11(3):60-64

语音材料是最便于用计算机程序进行的.该文设计的软件可以方便地处理《方言调查字表》、《壮语方言调查提纲》以及用户自制的调查表中的语音材料.并且可以随意将处理结果输出为DBF、TXT、XLS等格式的文件. 相似文献

3.

基于深层神经网络(DNN)的汉语方言种属语音识别

景亚鹏郑骏胡文心《华东师范大学学报(自然科学版)》2014,(1)

将深层神经网络(Deep Neural Network)应用于汉语方言种属语音识别.基于优化的QuickNet软件,为方言识别实现了一种有监督的DNN逐层预训练方法.在训练时,从3层开始逐层做有监督的神经网络训练,每增长一层的初始权值包含前一层训练好的部分权值和输出端的随机权值.在得到最大层的初始权值后,再进行传统的BP网络训练.该方法和普通神经网络相比识别率有较大提升,可用于移动互联网标准语音识别人口、方言口音鉴识等领域. 相似文献

4.

汉语连续语音理解系统

龚一凡《东南大学学报(自然科学版)》1990,20(4):132-137

相似文献

5.

高性能汉语数码语音识别算法 总被引：13，自引：0，他引：13

李虎生刘加刘润生《清华大学学报(自然科学版)》2000,40(1)

提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% . 相似文献

6.

神经网络在汉语语音识别中的应用

吴谨王绍纯《北京科技大学学报》1998,20(4):372-375

论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于３层ＢＰ神经网络的汉语语音识别系统,对汉语１０个数字（１￣１０）进行识别实验,获得了较满意的识别结果。相似文献

7.

一个基于汉语单音节的讲话者识别系统的设计

侯丽敏张吉庆《兰州大学学报(自然科学版)》1996,32(4):77-81

结合汉语字单音节的特点，以０－９十个数字的音节设计局部码本，提出了在训练和识别过程中的ＦＳＶＱ算法，使讲话者识别系统的正识率达到９５％。相似文献

8.

汉语方言中的“崽”后缀

邹妍《长沙大学学报》2009,23(6):65-67

“崽”后缀主要分布在湖南、湖北、江西、广西、贵州等省的汉语方言中。随着“崽”由实词逐渐演变为名词后缀,部分方言点中“崽”作名词后缀时的语音发生了弱化现象。“崽”后缀的语音弱化主要表现在声母、韵母和声调上。汉语方言中“子”、“崽”后缀的语音弱化既有共性又有差异。相似文献

9.

强噪声环境下汉语语音识别的模糊分类算法 总被引：2，自引：0，他引：2

下载免费PDF全文

苏广川《北京理工大学学报》1997,17(6):686-690

论述了强背景噪声环境下利用模糊分类算法对大词汇量的汉语语音进行了分类识别,根据噪声的汉语语音特点,采用有边界的交叉分类和无边界的模糊分类相结合的措施,较成功地解决了强噪声环境下的汉语语音分类。相似文献

10.

面向情感变化检测的汉语情感语音数据库 总被引：3，自引：0，他引：3

徐露徐明星杨大利《清华大学学报(自然科学版)》2009,(Z1)

该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中。对该数据库进行主观评价和情感变化检测的结果表明:语音情感状态自然、情感变化真实,能够满足语音情感识别和语音情感变化检测研究的双重需求。相似文献

11.

Chinese Speech Recognition Model Based on Activation of the State Feedback Neural Network

李先志孙义和《清华大学学报》2001,6(4)

IntroductionIn recentyears,speech recognition has made greatprogress.Commercial systems such as Via Voice( IBM Company) and Naturally Speaking 1 .0( Dragon System Company ) lead the field.Although the recognition ratio has greatlyimproved,many issues still need further research,such as,real- time in processing,systemcomplexity[4 6] ,very large scale integrated circuit( VLSI) implementation,etc.Among these issues,the implementation in VLSI is the most criticalchallenge for wide use of s… 相似文献

12.

智能视听信息处理的新策略

阮秋琦袁保宗《北京交通大学学报(自然科学版)》1996,(2)

综述了计算机听、视觉信息处理目前的研究状况及已取得的成果,并阐述了各国在信息处理领域的发展战略,结合＂超级智能视听信息处理系统的研究＂提出的集声、象、图、文计算机信息处理于一体的多信息处理系统研究的新思路,介绍了该研究的详细内容。指出该研究有可能开僻的一条新的信息处理途径。同时,指出智能化听、视觉信息处理技术将是多媒体计算机、多媒体通信乃至＂信息高速公路＂技术的基础。相似文献

13.

基于声学特征凸显的汉语疑问句检出

李爱真徐明星蔡莲红《中国科技论文在线》2014,(7):826-829

疑问句在语音交际中占有重要地位,检出语音交际中的疑问句对把握语义重心和分析话语结构具有重要作用。在分析疑问语气凸显的声学特征的基础上,提出了一种基于声学特征凸显的汉语疑问句检出方法。该方法用支持向量机(SVM)对小时间粒度的疑问语气凸显进行建模,通过基于加窗机制的后处理方法判决语音是否为疑问句。在面向电话客服应用环境录制模仿的和真实的汉语对话语音库上进行了算法测试。实验表明该方法对汉语疑问句具有较好的检出性能。相似文献

14.

汉语语音音素分割的一种新方法 总被引：3，自引：0，他引：3

王宁万旺根余小清《上海大学学报(自然科学版)》2002,8(2):116-118

音素分割在大词汇量连续语音识别的过程中起着重要的作用 .该文提出了一种简单实用的音素分割方法 ,比较好地解决了这个问题 ,并在大词汇量汉语语音识别中得到了应用 ,取得了较好的结果相似文献

15.

A novel visualization tool for manual annotation when building large speech corpora

SHE Kun CHEN Shuzhen YANG Shen ZOU Lian 《武汉大学学报:自然科学英文版》2006,11(2):381-384

相似文献

16.

一种低比特率中文语音信息编码传输技术

赵平史浩山《华南理工大学学报(自然科学版)》2003,31(7):95-97

研究一种中文语音信息编码技术.通过采用语音小波分析识别处理和语音信息特征编码,包括中文语音小波包分解、语音音素和音节声调识别、口音特征参数提取、语音信息和特征参数组合编码,这种低比特率编码技术理论上可将传输效率提高1倍. 相似文献

17.

辅助语音评分系统中一种流利度自动评分方法

黄申李宏言王士进梁家恩徐波《清华大学学报(自然科学版)》2009,(Z1)

流利度评分是目前计算机辅助自动发音评分系统中一个重要组成部分。为了解决流利度特征表述中和内容、韵律等高级表述技巧相关的广义流利问题,该文提出了一种能够全面客观地评价口语流利度通顺性和韵律性的评分方法。该方法除了通顺性之外,可以提取停顿、韵律、连读和失去爆破等特征;评分过程中,系统采用多层次融合方法,分别从句子级和篇章级提取流利度特征,其中篇章级得分由句子级加权得分和篇章级特征进行融合得到。在实验中,分别以机器得分和人工平均分的相关度、均方差等指标比较了多元线性回归(LR)、BP神经网络、支持向量回归机(SVR)3种算法的性能。结果表明:基于非线性建模的BP神经网络和支持向量回归机拟合的得分模型要好于多元线性回归;该方法可以作为一个重要指标,应用在计算机辅助语音评分系统中。相似文献

18.

主观汉语语言清晰度与客观声学参数C50的关系

彭健新《华南理工大学学报(自然科学版)》2007,35(B10):43-46

采用室内声场仿真软件ODEON获取房间脉冲响应，然后将脉冲响应和消声室录制的语言清晰度测试信号卷积后通过耳机重放，进行汉语语言清晰度主观评价实验，建立和验证了主观汉语语言清晰度得分与客观声学参数C50之间的关系．结果表明：在双耳有差别听闻条件下C50（500～4000Hz）与主观汉语语言清晰度得分之间具有高相关性，采用C50（500～4000Hz）能较好地预测厅堂的主观汉语语言清晰度得分．相似文献

19.

应用声能比评价小学教室中的汉语语言清晰度

彭健新严南杰《华南理工大学学报(自然科学版)》2014,42(8):1-5

针对2、4、6年级学生(7~12岁儿童)在9所小学的28间教室进行汉语语言清晰度主观评价,并测量听音位置的房间脉冲响应和背景噪声,计算不同听音条件下不同听音位置的不同早期声能时间限值的有益有害声能比Ut,从而得到不同年龄段儿童的主观汉语语言清晰度得分与有益有害声能比之间的关系.结果表明:对不同年龄段的儿童而言,早期声能时间限值为50 ms和80 ms时的有益有害声能比(U50、U80)均能较好地评价儿童教室室内汉语语言清晰度;在相同的有益有害声能比条件下,儿童主观汉语语言清晰度得分随着年龄增加而增加;2、4、6年级儿童在教室内达到95%的汉语语言清晰度得分需要的U50值分别为7.4、4.5、2.8 d B. 相似文献