首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

2.
针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报(WSJ)语料库的连续语音识别实验表明:该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大地提高了所得新词及发音的精度;在词错误率指标下,字典扩展后系统的识别性能相对基线系统提高约13.4%。  相似文献   

3.
黏着性语音的元辅音区别性特征对口语环境下的连续语音识别影响很大.通过维吾尔语和谐语音现象下的发音规律及其规则,采用语言学、实验语音学技术和数字语音信号处理等方法,研究和谐发音现象下的元音、辅音区别特征系统,建立扩展元辅音集,并以此为基础,开展基于扩展元辅音集的连续语音识别研究,进一步通过其声学模型比较研究,构建连续语音识别模型,为维吾尔语口语环境下的连续语音识别提供一种新方法.  相似文献   

4.
该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合,从而提高了重构后的声学模型的效率。实验表明:该方法在不降低对标准普通话的识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了9.25%和9.21%。  相似文献   

5.
将深层神经网络(Deep Neural Network)应用于汉语方言种属语音识别.基于优化的QuickNet软件,为方言识别实现了一种有监督的DNN逐层预训练方法.在训练时,从3层开始逐层做有监督的神经网络训练,每增长一层的初始权值包含前一层训练好的部分权值和输出端的随机权值.在得到最大层的初始权值后,再进行传统的BP网络训练.该方法和普通神经网络相比识别率有较大提升,可用于移动互联网标准语音识别入口、方言口音鉴识等领域.  相似文献   

6.
将深层神经网络(Deep Neural Network)应用于汉语方言种属语音识别.基于优化的QuickNet软件,为方言识别实现了一种有监督的DNN逐层预训练方法.在训练时,从3层开始逐层做有监督的神经网络训练,每增长一层的初始权值包含前一层训练好的部分权值和输出端的随机权值.在得到最大层的初始权值后,再进行传统的BP网络训练.该方法和普通神经网络相比识别率有较大提升,可用于移动互联网标准语音识别人口、方言口音鉴识等领域.  相似文献   

7.
语音数据资源是语音识别研究的基础。当前国内只有为数不多的开放的语音数据库供研究者免费使用,特别是在维吾尔语等少数民族语音识别方面,数据资源更为贫乏。该文发布一个完全免费的维吾尔语连续语音数据库,该数据库包括约20h的训练数据和1h的测试数据,同时介绍了构建维吾尔语语音识别系统所需要的音素集、词表、文本数据等相关资源,以及用于构建基线系统的脚本。给出了该基线系统在纯净测试数据和噪声测试数据上的识别性能。该数据库为维吾尔语语音识别研究提供了可以借鉴的标准数据库。  相似文献   

8.
维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。  相似文献   

9.
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。  相似文献   

10.
为了解决已有语音活动检测方法在噪声条件下性能急剧下降的问题,提出了一种基于稀疏编码的语音活动检测方法.该方法在训练阶段为语音和每种可能的噪声训练字典;在识别阶段首先识别环境噪声类型,然后将语音字典和对应环境噪声字典拼接形成一个大字典用于稀疏分解,最后用语音字典上的稀疏表示实现语音和非语音的判断.该方法一方面引入了噪声类型识别,可以有针对性地选择噪声字典;另一方面引入噪声开集识别机制,能识别新的噪声类型并且为之训练模型.实验结果表明所提方法比传统方法具有更强的噪声鲁棒性.  相似文献   

11.
论英语交际口语的特点   总被引:1,自引:0,他引:1  
大学英语教学中仍存在“聋哑、低效、费时”的尴尬局面。多数学生在口语学习中总是求助于书面转换。把书面语的用词准确、语法规范、语句流畅、语音正确等要求生硬地套在自己的口语表达中,其结果却导致学生心理负担加重,不敢轻易开口,即使不得已开口讲出来的话,也不再是生动活泼的交际口语。正确认识和把握英语交际口语的特点,乃是改革英语口语教学的前提。  相似文献   

12.
黎锦熙先生是杰出的教育家,培养了毛泽东这样杰出的学生,毛泽东在蔡元培、黎锦熙等一大批人的影响下支持文字改革。毛泽东正确的语文政策里有黎锦熙的影响和功劳。黎先生毕生从事语文现代化事业,在确定国语语音标准、现代汉语语法、汉语词典编纂、反对滥用英文、维护汉语地位、制定和推行国语罗马字、汉语拼音方案、汉字简化方案等方面做出了卓越的贡献。我们要继承黎锦熙先生遗志,维护汉语地位,继承黎锦熙先生的事业,促进语言文字科学发展。  相似文献   

13.
本文按意义列出了15美兰考话与普通话有不同说法的词语,并按国际音标注音。  相似文献   

14.
为了在大词汇量连续语音识别(LVCSR)系统中能够利用段长信息,该文按树状组织发音词典,利用语言模型预测技术,基于最大似然状态序列(M LSS)算法,给出了采用基于段长分布的隐含M arkov模型(DDBHMM)的LVCSR系统的二元文法语言模型的单步搜索算法。实验结果表明,尽管单步搜索的替代错误率高于双步搜索,但单步搜索的插入和删除错误率都比双步搜索要低,总体性能上单步搜索要好于双步搜索。同时,DDBHMM能较准确地利用了语音信号中的状态段长信息,采用DDBHMM的LVCSR系统比采用经典的齐次HMM的系统有更好的识别性能。  相似文献   

15.
新加坡英语是现代英语的一种地域变体并且被新加坡国人认为是国家特色的一个重要体现。尽管新加坡英语和英国英语之间有着深刻的历史渊源,但是作为现代英语的一种地域变体。它和英国英语在发音、语法和词汇方面都存在着明显的差别。了解这些差异不仅能够帮助人们更好地认识新加坡英语,而且也具有跨文化交际的意义。  相似文献   

16.
孝感话的“把”字句   总被引:4,自引:0,他引:4  
孝感市位于湖北省东产经部,属楚语区。孝感话与普通话较接近,但他存在一些差异,如“把”,在孝感话里用法广泛,可用为动词,介词,作介词用于工具语,处置式,被动向,与普通话与有很大的不同,在普通话中有不同的对应形式。这些用法同出一源,孝感话“把”的特点,显示了“把”在地域上的共域上的共时差异,反映了语言历史演变的轨迹,研究孝感话“把”的用法,有助于汉语史和现代汉语的研究。  相似文献   

17.
李萍 《科技资讯》2009,(21):244-244
日语作为一种交际语言在当今世界起着越来越重要的作用,但通过调查,结果发现大学生的口语交际能力欠缺,其主要原因在于缺乏语境意识及文化意识。为了提高口语表达能力,必须从语音入手,加强听力训练,以说为主,全面提供各方面的素质。笔者指出,这只是初步的研究,教学方法的有效运用还有待于进一步的实践。  相似文献   

18.
语音迁移是第二语言习得过程中较突出的迁移现象。以语言迁移理论为理论基础,结合实证研究分析普通话对英语语音学习的正迁移作用,提出尽快提高学习者普通话水平、充分发挥正迁移效应、客观看待负迁移作用是提高英语语音教学效果的有效途径。  相似文献   

19.
新闻传媒作为影响最广泛的大众传播载体在语言规范的教化中,起着潜移默化的重要作用,针对新闻传媒语言质量不高,语言差错较多的问题,从分析口语和书面语在语体风格上的差异入手,提出口语和书面语的使用,应有不同的规范标准。具体论述了在语言表达时,应解决的主要问题是信息的组合手段在口语同书面语两个层面的混淆,以及书面语规范受口语习惯的干扰。  相似文献   

20.
阐述了中文信息处理技术在几何作图等动态几何领域内的应用现状。鉴于几何语言其本身相较于一般自然语言的特点,介绍了利用中文分词技术及其他自然语言处理技术来实现基于自然语言输入的动态几何作图的方法,主要包括GMMM算法和基于"分词词典"的分词方法及建立同义词库、使用语模匹配和语模词典等方法来形式化和规则化几何命题等内容,并提出在该领域的研究展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号