首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据.  相似文献   

2.
藏语语音合成语料库的好坏对合成语音质量有很大的影响。本文介绍了藏语拉萨话语音合成语料库的设计过程,语料的设计考虑了内容上和语义上的完整性,利用Greed算法实现对语料的选取,同时严格按照标准的录音过程对语料进行录制,最后设计了一套韵律标注规则对语料库中的语音数据进行了音段特征和超音段特征的标注,基本完成了藏语拉萨话语音合成语料库的建立。  相似文献   

3.
随着计算机和网络技术的发展,语料库语言学逐步成为语言学和语言教学研究的重要领域.针对传统语音教学中学生语料摄入不足和教学手段单一的问题,利用BS网络技术建立的网络语音语料库最大限度地弥补了传统语音教学的不足;实现了教学资源共享和以学生为中心的教学目标;使语音教学多样化、语境化、趣味化和个性化.有助于提高学生的自主学习能力,从而最终提高学生的语音和语言水平.  相似文献   

4.
新疆少数民族学生英语语音语料库的设计研究是建立在数据驱动学习理论的构建上进行的。我们首先通过对研究的基本框架、思路、工具和步骤的论证,阐明了建立新疆少数民族学生英语语音语料库设计方案,并通过实验语音学语音录音、语音分析软件的操作程序和分析层面和Delphi7.0语音语料库管理系统,提出构建新疆少数民族学生英语语音语料库的可行性,以便能更好的把新疆少数民族学生语音语料库运用到外语教学和研究中去。  相似文献   

5.
建立了一个兰州方言语料库.利用<方言调查字表>设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究.  相似文献   

6.
关于语音合成语料库管理系统的开发   总被引:1,自引:0,他引:1  
本文所介绍的语料库管理系统的主要用于语音合成语料库的管理工作。在Windows下,以Visual foxpro3.0为开发工具,对语音合成语料库的各种语音数据进行综合有效地管理。  相似文献   

7.
语音处理上如何逐渐减少对具体语料的依赖?   总被引:1,自引:0,他引:1  
为解决语音处理上对大量具体语料的依赖及其繁重处理的问题,该文首先通过对语音处理的根本目标与语音技术的当前现状的分析,指出了这种依赖性的根源。接着通过对语音多变的不可避免性与声学不变量的相对性的阐述,说明语音的变化并非完全不可知,进而指出解决问题的关键在于充分认识语音变化的规律性和在处理系统中综合利用这些规律。最后,提出一个解决策略,基本原则就是通过完善语料库建设来促进知识与语料的有机结合,逐步以相对关系上的声学不变量来取代具体语料的作用。并对相关语料库的建设提出了初步设想。  相似文献   

8.
建立中国少数民族濒危语言语音语料库的目的在于使濒于消失的少数民族语言的声音永久而系统地保存下来,并能使国内外语言学习、研究者方便地进行大规模语音资料的查询、检索和统计。语料库的特点和作用、工作步骤及建库过程中遇到的难点与汉语或非濒危语言语音数据库有所不同。  相似文献   

9.
基于(PACCEL-S)语料库中2003年的汉译英语料,文章对英语专业汉英口译考试失误的语言因素(语音、语法和停顿)进行了分析,研究发现语音错误,频繁的停顿现象是导致学生口译失误的两大因素,而学生对语法问题的处理得相对较好。此外笔者还相应地提出了一些对策以提高学生的汉英口译能力。  相似文献   

10.
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性.  相似文献   

11.
教学型医学英语语料库是用于医学英语教学及相关研究的专用语料库,可以根据不同的应用目的来收集,处理和存储语料,从而产生不同类型子库。建库的过程中应该考虑语料的真实性、代表性、适应性、共时性、分层性和不侵权性,以此来保证发挥其在医学英语教学中应有的作用。  相似文献   

12.
文章以维吾尔文为对象,提出了一种汉维对齐的维文语料库获取方法,通过对照汉维特点,首先对维文进行词干切分,并在此基础上借助词干表和词频表进行词性标注,然后对汉维进行对齐,从而实现汉维双语语料库的获取,对维文及其他少数民族语言的分析及研究提供一种可行的方法.  相似文献   

13.
CUCBNC:一个引入播音学知识的广播新闻语音库   总被引:1,自引:0,他引:1  
该文描述了广播新闻语音库CUCBNC的构建过程。建设该语音库的目的是为了能将播音学相关知识应用到言语工程中。为此,通过解读播音学相关论述,提出了新的韵律特征,包括声音表达特征、语篇重音、意合群和复合韵律短语,并融入到CUCBNC语音库的韵律和文本标注规范中,目前已标注了约14h的语音数据。最后,通过观察相关韵律特征在标注数据中的统计分布,来检验融入了新特征的韵律标注规范是否合适。实验结果表明所提出的韵律特征是科学合理的。  相似文献   

14.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

15.
胡改平  郭晓晖 《科技信息》2007,(33):202-203
语料库语言学在近30年来随着计算机的发展而兴起,为语言研究提供了一种新方法。本文试图以布什关于9.11恐怖主义袭击的演讲为语料,利用多维度语料分析法进行多方面的分析,以描写布什在此篇演讲中的语言特点。  相似文献   

16.
徐春 《科技信息》2011,(17):I0104-I0105
平行语料库研究是近年来语料库语言学横向发展的新趋势。人们清楚的认识到大规模的高质量汉英平行语料库在自然语言处理、比较语言学研究和第二语言教学等众多领域中的巨大价值。文章介绍了一个大规模汉英双语平行语料库的构建系统,利用互联网上存在的海量多语言文本资源,通过网页的内容分析和链接分析,实现了一个双语语料挖掘的自动获取系统,包括其总体规划、实施模型和流程细节。目的是通过学习国内外资料。最终建设一个基于互联网的平行语料库自动构建系统。  相似文献   

17.
面向信息处理的突发事件新闻语料库建设与应用研究   总被引:1,自引:0,他引:1  
研究了突发事件新闻语料库建设的过程、意义和典型应用,提出了突发事件新闻语料的分类体系和编码方案.研究结果对突发事件新闻语料库的建设、突发事件新闻信息处理、国家相关部门对突发事件应急处理方案制定以及对流行病学的医学研究等领域具有一定的理论意义和应用价值.  相似文献   

18.
语料库是按照一定语言学规则收集而成的电子资料库。文本语料库以日语教学为目的,用于提高学生的自主学习能力。提出语料库应用在日语教学中的必要性,并通过采集语料、设计数据库和创建语料库等步骤自主制作了小型语料库。  相似文献   

19.
基于 FoxPro for Windows 的汉语语料库系统的构造   总被引:1,自引:0,他引:1  
探讨了一个基于FoxProforWindows的汉语语料库系统。该系统由语料库和语料库管理系统组成;前者经过了分词和语法标注,后者具有系统维护、语料统计和检索功能。结果表明,该系统直观、明了、通用,具有较大的实用价值。  相似文献   

20.
名词标注是语料库加工的重点和难点问题。兼顾形式和意义的句法语义一体化处理策略,是名词深加工的重要原则。把对大多数组合具有普遍解释力的语义特征构建成层级体系,并确立相应的形式识别标准,就可以将名词进行有效的分类与归类。我们对大量名词所做的组合特征标注实践证明,“特征即关系”,名词组合属性的细致标注,对揭示双名直接组合模式与搭配规则能够起到很好的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号