首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

2.
母语是任何第二语言系统未建立的情况下建立的第一语言系统,根据“迁移”理论的观点,母语对外语学习的影响是不可避免的,从学生的语用错误的视角来分析,中国的英语初学者在学习过程中,母语在语音、语法、词汇方面存在着诸多干扰现象。  相似文献   

3.
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.  相似文献   

4.
提出一种方法,用以实现自然语言理解系统的自动词汇扩展,以模拟人的词汇学习能力.该方法的基本要点是:(1)用语法制导切词实现生词的自动辨别;(2)用反复试探句法分析来确定生词的句法功能;(3)简化词典的词义表示形式,使词义隐含在知识库系统中.  相似文献   

5.
英语阅读是英语语言教学的核心内容之一,对于阅读材料的难度调控、定级分类是英语教学中必须面对的问题。本文以大学英语阅读为例,介绍了一种阅读材料生词率探测技术:通过利用多个语料库作为数据支撑,构建囊括中学英语词汇和大学英语四六级词汇的参照词汇语料库,采用语料库软件及相关功能构建基于阅读材料的目标词汇语料库,最后将目标词汇语料库与参照词汇语料库对比,从而探测出大学英语阅读材料的生词率。  相似文献   

6.
词汇形式错误是非英语专业大学生英语写作中最为突出的语言错误。词汇形式错误主要有字母误写、错误造词和形式误选三种。造成词汇形式错误的原因主要是:英语本身的特点,以及非英语专业大学生英语语音水平和词汇学习策略方面存在的问题。因此,教学中,教师应加强非英语专业大学生的语音教学和词汇策略训练,减少英语写作中的词汇形式错误,提高英语写作质量。  相似文献   

7.
祝丽丽 《科技信息》2010,(12):133-133
在英语教学中,词汇教学占据了很重要的地位,如何有效地开展词汇教学也成为众多学者研究的课题之一。二语词汇习得普遍受到母语影响。有效地防止母语干扰,对提高学习者二语能力具有重要作用。利用心理词汇理论探索词汇教学的新路径,强调指出重组英语心理词汇的重要性,并提出相关的英语词汇教学策略。  相似文献   

8.
第二语言习得研究表明,母语迁移是影响第二语言习得的重要因素之一。本文指出了迁移中的负效应,并通过英汉两种语言的对比与分析,从语音,词汇,语法等方面阐述了母语(汉语)负迁移对第二语言(英语)习得的影响。本文也探索了如何在英语的教与学中尽量避免母语的负迁移,从而提高第二语言习得者的语言能力。  相似文献   

9.
杨丹丹 《科技资讯》2009,(2):190-190
在差错分析及中介语理论的基础上,文章将对中国英语学习者的写作词汇错误进行了讨论。研究中使用了“中国英语学习者语料库”(CLEC),调查了134篇大学英语四级写作语料中的词汇错误。通过归类分析,发现词汇错误主要有词类错误、替代错误、省略型错误和冗余型错误,其原因既有母语干扰,又有对目的语规则不完整的学习。  相似文献   

10.
双语者大脑中存在母语和第二语言两个心理词典,第二语言的词汇通达是双语研究的热点.实验使用大脑事件相关电位技术,基于语音判断任务考察中日双语者日文词汇语音通达的时间进程及大脑机制.实验材料为以与中文词的关系而定义的3类不同日文词:同形同义词、同形异词义和非中文词.结果表明:在被试通达日文3种不同词型的语音时,在大脑的额叶存在200ms出现的词形竞争和400ms出现的词义竞争.这种竞争反映了大脑额叶在日文词汇通达中的重要作用.  相似文献   

11.
Stream Weight Training Based on MCE for Audio-Visual LVCSR   总被引:2,自引:0,他引:2  
In this paper we address the problem of audio-visual speech recognition in the framework of the multi-stream hidden Markov model. Stream weight training based on minimum classification error criterion isdiscussed for use in large vocabulary continuous speech recognition (LVCSR). We present the lattice rescoring and Viterbi approaches for calculating the loss function of continuous speech. The experimental results show that in the case of clean audio, the system performance can be improved by 36.1% in relative word error rate reduction when using state-based stream weights trained by a Viterbi approach, compared to an audio only speech recognition system. Further experimental results demonstrate that our audio-visual LVCSR system provides significant enhancement of robustness in noisy environments.  相似文献   

12.
秦嘉  侯广旭  金夏  李莉  顾丽娜  王琳琳 《科技信息》2009,(33):T0039-T0040
本文探讨了语料库检索软件Word Smith Tool4.0、AntConc32.1、ReadabifiWAnalvzer1.0对分析评价大学英语教材的词汇覆盖、复现、排列、生词密度、词次、词形、词目、平均词长,词汇学特征以及篇章难度上的循序渐进性等方面的用途及价值。  相似文献   

13.
一种基于听觉模型的抗噪语音识别特征提取方法   总被引:5,自引:2,他引:5  
提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过计算语音的上升过零率作为频率信息并通过非线性幅度加权相结合来获取语音特征。仿真实现了中小词汇量、孤立词的语音识别,得到了较好的实验结果,证明了此方法具有较强的抗噪声性能。  相似文献   

14.
在大词表孤立词语音识别中,Viterbi搜索是时间消耗的主要因素。为改善基线系统性能,根据汉语孤立词识别的特点,提出了一种基于音节切分的束搜索算法,在音节层和词条层进行剪枝。该算法不增加内存开销。实验结果表明:在词表规模为10 000时,该算法以0.23%的识别率下降率为代价,将Viterbi搜索的时间消耗降低为基线系统的26.73%;相对于小词表,该算法在大词表情况下对系统性能的改善尤为明显。  相似文献   

15.
王成平 《科学技术与工程》2012,12(10):2328-2332
自动分词是彝文信息处理中一项不可缺少的基础性工作,彝文信息处理只要涉及到检索、翻译、校对等,就需要以词为基本单位。本文根据彝文的特点,介绍了彝文分词规范与分词词表的设计,提出了实现基于既定词表的彝文自动分词技术的算法选择、系统结构,以及实现流程,而且进行了抽样测试,其分词准确率和速度都比较令人满意。最后结合彝文的特点对实现彝文自动分词的难点进行了分析。  相似文献   

16.
运用比较方法论的基本原理,选取汉语和英语词汇在发展过程中所呈现出的最显著的特点进行对比分析,从而证明:词汇系统发展的过程,是词汇系统自组织的过程。词汇的发展,一方面是词汇系统以外的各种因素和环境通过词汇系统的结构自身的改变而发生作用的结果;另一方面,是词汇系统内部各种要素的相互作用和影响的产物。  相似文献   

17.
本文探讨了一种特定人的汉语全音节语音识别方案,介绍了一种基于人耳听觉特性的语音参数的提取方法,对以1/3倍频程分布的16个通道滤波器组的对数能量输出用非线性时域归正方法归正到定长,然后求出相邻通道间频谱的变化量,即得到一组新的特征参数——频变参数.这组参数能够较好地反映语音中与感知有关的特性,如高音、音强、音调等.音节被选用来作为识别的基本单位,以400个汉语无调音节作为字表.最后给出了识别结果.  相似文献   

18.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

19.
口语对话系统中,集外词的存在会引起很多识别错误,为了有效地发现并拒绝集外词,提高系统性能,研究利用置信度打分进行语音确认的方法,发现并拒绝识别错误。提出上下文相关的置信度特征,充分考虑当前待确认词与其前序词和后序词之间的相关性。实验结果表明:上下文相关的置信度特征能够很好地提高拒识性能,对符合识别文法的句子,错误拒绝率为2.5%或5%时,对比没有使用上下文相关的置信度特征时,错误接受率分别下降了29%和36%;基于置信度打分的语音确认策略在拒识性能上优于系统已有的在线垃圾模型。  相似文献   

20.
本文介绍了我们开发的“汉语声控电脑打字机”的结构、功能以及系统实现中的一些关键技术,本系统是一个特定人、孤立词、大词汇量的汉语语音识别与理解系统,其最终识别率可达95%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号