首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 258 毫秒
1.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。  相似文献   

2.
提出了一种将基音同步叠加技术用于汉语文语转换系统的方法。主要介绍了系统的基本组成、语音基元选择、语音库的结构和检索、文本的预处理、合成规则、基音同步叠加技术等。该系统在语言学处理中采用了分词精度较高的基于词形统计的汉语文本切分算法 ;韵律处理采用了能有效控制合成语音韵律的语音合成规则 ;声学处理采用了基音同步叠加技术进行语音合成 ,易于调整合成语音的音高、音长和音强。测试表明 ,本系统语音输出清晰度达 95 % ,自然度达 8.1分 (按 10分制 ) ,基本达到实用的要求  相似文献   

3.
以时域基音同步叠加 (TD PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音合成 ,合成的语音清晰度和自然度很高 .但是这样的系统语音库太大 ,不利于在小型设备中实现 ,影响了语音合成的进一步应用 .本文针对此问题 ,在研究A律压缩的基础上 ,采用自适应量化和自适应预测的技术 ,以较少增加合成运算量复杂度为代价 ,对语音库的编码实现压缩 ,使压缩后的语音库减小了约一半 ,大大减小了所需的存储空间 .并且利用压缩后的语音库合成语音 ,基本上不影响合成后的语音质量 ,从而进一步扩展了语音合成的应用 .  相似文献   

4.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

5.
介绍了一个基于PSOLA合成技术的蒙古语文语转换系统,系统针对蒙古语自身的特点,采用了语音合成领域比较成熟的波形编辑合成技术,也建立了实用的蒙古语语音合成音库,音库基元都进行了基音标记,在韵律修改中也做了尝试。  相似文献   

6.
协同发音是音素在语流中受前后音素的影响,而使2个以上音素的发音特征同时出现的现象.大语料库语音拼接算法获得的语音合成效果最好,但录制语料困难、算法复杂、耗费时间,需要占用很大的存储空间,在应用中存在困难.为此,针对小语料库语音合成,提出参数修改和波形拼接相结合的语音合成方法,通过参数修改方法合成协同发音段,再与自然语音进行波形拼接.实验表明,该算法合成的语音效果较好,而且对语料库内容要求较低.  相似文献   

7.
以时域基音同步叠加(TD-PSOLA)技术和一个全汉语单音节库为全成单元进行汉语语音合成,合成的语音清晰度和自然度很高,但是这样的系统语音库太大,不利在于小型设备中实现,影响了语音合成的进一步应用,本文针对此问题,在研究A很压缩的基础上,采用自适应量化和自适应预测的技术,以较少增加合成运算量复杂度为代价,对语音库的编码实现压缩,使压缩后的语音库减小了约一半,大大减小了所需的存储空间,并且利用压缩后的语音库合成语音,基本上不影响合成后的语音质量,从而进一步扩展了语音合成的应用。  相似文献   

8.
提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语境特征下决策树叶子结点中基元的语境特征F′.统计F′中每一个语境特征相对于F*的变化,根据语境特征变化的概率对权重进行调整.实验结果表明,这种方法能够训练出合理的语境特征权重,使得合成语音的自然度有一定提高.同时,利用这种方法还可以对语音合成系统进行实时优化.  相似文献   

9.
讨论以蒙古语的词干和词缀作为语音基元,使用硬拼接和软拼接相结合的方法进行拼接,然后采用时域基音同步叠加(TD-PSOLA)和频域基音同步叠加法(FD-PSOLA)对合成语音的韵律进行调整的蒙古语语音合成思路和方法.  相似文献   

10.
纳西语语音合成的初步研究   总被引:1,自引:0,他引:1  
本文初步建立了一个纳西语按规则语音合成系统,该系统采用共振峰语音合成技术,以350个左右的无调单音节和4种声调模式为合成基元,该系统不仅适用于纳西语文-语转换系统,而且也是一个研究纳西语语音的有力工具。  相似文献   

11.
樟树方言的词缀有"子"、"仔"、"叽"、"牯"、"婆"等近20个,其中"叽"是一个使用频率较高,能产性很强也最为特殊的跨类词缀.通过考察,"叽"可附于名词、动词、形容词和量词等词根后面,意义虚化,表示数量少、小称、动作随意等语法功能.  相似文献   

12.
层次化蒙古语统计语言模型   总被引:1,自引:0,他引:1  
蒙古文具有典型的构词、构形词缀的特点,一个蒙古语单词往往可以切分成词干和词缀等若干个部分.根据蒙古语的特点,提出了一种层次化的蒙古语语言模型,将蒙古语语言模型分为词干和词干、词干和词缀、词缀和词缀三个层次.在这三个层次上分别计算出独立的语言模型.把这种层次化的蒙古语语言模型方案应用到了一个统计汉蒙机器翻译系统中,实验证明所构造的层次化的蒙古语语言模型能够有效地提高汉蒙机器翻译的效果.  相似文献   

13.
用HD38880语音合成芯片构成的汉语合成器   总被引:1,自引:0,他引:1  
数字语音合成技术作为语音智能的一部分有着广泛的应用前景,它是利用语音的参数模型,从语音信号中提取若干个参数,存放在固定的内存中,再生时用语音合成芯片还原成语音的,我们的工作是将日语专用的语音合成芯片HD38880移植到汉语上来,获得了满意的效果。本文介绍的汉语合成器是用合成芯片 HD38880以及参数EPROM 等少量硬件制成,合成声音清晰自然,且具有体积小結构简单的特点,在仪器仪表语音智能化、计算机自动应答等方面都可以应用。汉语合成器中参数EPROM的制作直接影响合成声音的自然度。文中将对参数EPROM的研制过程,汉语合成器的硬件結构和软件流程作详细描述,同时对其应用实例“报时时钟”作简要介绍。  相似文献   

14.
本文利用历史比较法和内部拟构法证明上古汉语存在一个构词中缀 l 。这个中缀可以使一个动  词转换为名词 ,或可以使一个名词变成另一个意义有所不同的新名词  相似文献   

15.
根据英语语言所具有的一些特性对HMM模型进行改进,设计出适合英语语音合成的上下文属性集以及用于模型聚类的问题集,提高了其建模和训练效果。此外,借助HTK和Festival等工具,以基频和声道谱参数为训练参数,最终实现此英语语音合成系统。从所合成语句的效果来看,合成语音整体稳定流畅,而且节奏感比较强。  相似文献   

16.
为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算法流程,并进行了动物语音识别实验.实验结果表明,该全卷积神经网络深度学习算法是一种语音自动识别的有效方法,解决了蛙声识别问题,为动物语音识别提供参考.  相似文献   

17.
介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人的语音对话和语音控制。  相似文献   

18.
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。  相似文献   

19.
针对传统减噪方法在处理自给式呼吸器通信时语音音质不清晰、噪声干扰严重的问题,提出了一种基于自给式呼吸器的语音减噪改进方法,并进行了实验验证。在该改进方法中,先定义一个新的判决变量为相关函数能量,利用该变量进行语音端点检测,然后根据检测结果,分别对有话段语音信号采取声压差值减噪处理,对无话段噪声信号采用静默处理。实测实验结果表明,对于自给式呼吸器采集到的语音信号,改进方法的准确性与鲁棒性要优于传统语音减噪方法。  相似文献   

20.
介绍一种嵌入式语音识别系统的设计与实现,整个系统以TI公司的双核(ARM DSP)处理器芯片OMAP5912为控制核心,采用SENSORY公司的RSC364语音芯片来实现语音的识别与合成,并进行语音信号的采集和播放,整个系统结构简单,集成度高.驾驶员利用该系统可通过语音命令控制车上设备及获得语音反馈信息,系统也可以作为一嵌入式语音设备使用,具有较大的市场应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号