首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
This paper describes the design of a unified framework for a multilingual text-to-speech (TTS) synthesis engine – Crystal. The unified framework defines the common TTS modules for different languages and/or dialects. The interfaces between consecutive modules conform to the speech synthesis markup language (SSML) specification for standardization, interoperability, multilinguality, and extensibility. Detailed module divisions and implementation technologies for the unified framework are introduced, together with possible extensions for the algorithm research and evaluation of the TTS synthesis. Implementation of a mixed-language TTS system for Chinese Putonghua, Chinese Cantonese, and English demonstrates the feasibility of the proposed unified framework.  相似文献   

2.
在SYN6658的中文TTS基础上,结合改进的英文合成技术,经过分析比较中文TTS和英文TTS的特性之后,提出了一种构建简单快速、占用空间小的中英文语音合成系统的方法。构建的系统能够实时快速地合成出中英文语音,系统简单、易实现且合成效果较好,是中英文语音合成产品的较好选择。  相似文献   

3.
语音合成中基于听辨指导的权重训练算法   总被引:1,自引:0,他引:1  
针对语音合成的基元选取中权重设定的问题提出了一种基于人工听辨指导的权重自动训练的方法。该方法首先通过人工听辨对现有的基元选取结果进行评测打分,然后采取韵律逼近的方法对人工评测的结果进行学习,进而对权重进行调整修正,从而实现权重的自动训练。实验表明:该方法较好地解决了权重设定的问题,使得合成语音的自然度听辨得分由3.49提高到4.02。同时,该方法还使得语音合成系统在使用过程中根据用户反馈自动进行优化成为可能。  相似文献   

4.
In this paper, a novel concept of multilayer synthesis and a general framework for texture synthesis method are presented. Within this framework, we first decompose the texture into the supposed pattern layer and material layer in the frequency domain by an E-texton extracting algorithm, then manipulate and extend them respectively according to their own personalities, and finally merge the newly synthesized pattern layer and material layer again to generate the final output. Experiment results show that our method not only greatly improves the synthesis quality for those cases that single-layer synthesis cannot handle well but also provides an ability of achieving various special synthesis effects.  相似文献   

5.
A kind of Web voice browser based on improved synchronous linear predictive coding (ISLPC) and Text-toSpeech (TTS) algorithm and Internet application was proposed. The paper analyzes the features of TTS system with ISLPC speech synthesis and discusses the design and implementation of ISLPC TTS-based Web voice browser. The browser integrates Web technology, Chinese information processing, artificial intelligence and the key technology of Chinese ISLPC speech synthesis. It's a visual and audible web browser that can improve information precision for network users. The evaluation results show that ISLPC-based TTS model has a better performance than other browsers in voice quality and capability of identifying Chinese characters.  相似文献   

6.
现代有机合成的新概念和新方法   总被引:1,自引:0,他引:1  
概念和方法是有机合成化学发展的基础,新的概念和方法的产生和发展可为有机合成开拓新的研究领域和发展方向.介绍现代有机合成中一些新概念和新方法,结合具体的有机合成反应实例阐述有机合成在这些概念和方法方面取得的新成果和进展,现代有机合成发展方向和应重视的研究领域.  相似文献   

7.
潘强  张钢  王春茹 《科学技术与工程》2012,12(30):7931-7936
提出了一种考虑包中样本在概念空间中重要度的多示例核学习方法。引入了包中示例对整个样本空间所包含概念的权重向量。通过数量化的手段表示出每个示例从属于每个概念的重要程度。主要步骤如下:a)通过对所有示例进行聚类,得到能够反映多示例包中所含概念的簇;b)借用文本分类中的r-pattern计算得到每个示例对于概念空间中每个概念的权重向量;c)在多示例核中通过余弦相似度结合示例的权重,得到更能反映概念空间特性的多示例概念核。该方法同时考虑了包层次的概念和示例层次的权重,能够有效度量包中示例对于最终包标记的影响,且本身建立在多示例核的基础上,适用于多种多示例学习的场合。在标准数据集和图像数据集上的实验表明,该算法是有效的。  相似文献   

8.
汉语语音合成的研究进展   总被引:2,自引:0,他引:2  
为解决如何让机器像人那样说话的问题,综述了近年来汉语语音合成技术的进步和发展;描述了汉语语音合成系统的设计方法;对基于汉语语音特点的语音合成过程中的一些关键技术和原理进行了详细的分析和比较;阐述了语音合成在多媒体等方面上的应用以及目前评价语音合成系统性能的一些新方法,并对当前语音合成技术的研究热点和语音合成技术存在的问题进行了分析,为语音合成技术的进一步研究提供了借鉴作用。  相似文献   

9.
在线性阵列天线方向图正交综合方法基础上引入约束条件实现阵列方向图的约束正交综合。此方法保持了非约束正交化方法中因采用了正交化处理而使得计算更为简便的优点,能实现均匀或非均匀直线阵的综合。实验结果表明,约束正交综合法能很好实现在主波束导向约束、零点约束、旁瓣电平约束等约束条件下的线性阵列方向图的综合,并且此方法只通过解析计算就能实现与需经多次迭代计算的自适应综合法相当的性能。  相似文献   

10.
为解决非均匀照明条件下彩色图像亮度不均、细节丢失、对比度低等问题,提出一种非均匀照明彩色图像自适应校正方法研究非均匀照明图像的自适应增强.首先,提出一种双伽马校正直方图均衡(bilateral Gamma adjustment histogram equalization,BIGAHE)算法处理HSV颜色空间的V通道,来调整图像全局对比度和亮度,同时使用构建的自适应拉伸函数对S通道进行非线性拉伸以提高图像整体饱和度,然后利用对比度受限的自适应直方图均衡算法(contrast limited adaptive histo-gram equalization,CLAHE)对L?a?b?颜色空间中L?通道进行局部对比度增强,得到最终增强图像.实验结果表明,与现有流行的图像增强方法相比,该算法的平均梯度(mean gradient,MG)、熵(entropy)指标为所有对比算法中最优,对比度改善指数(contrast improvement index,CII)在所有方法中排名第二.可见该算法能够有效提高非均匀照明图像亮度和对比度,提供更多的细节增强,同时避免过度增强,保持图像的自然性,获得更好的增强效果.  相似文献   

11.
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.对于韵律的研究是语音合成技术中的重要研究课题.通过介绍语音韵律控制技术及其在TTS中应用的一些情况,内容包括语音韵律研究的基本情况及今后的工作重点,语音合成技术中韵律调整的方法,以及TTS中的韵律生成模型和声学模块.  相似文献   

12.
Improved Grapheme-to-Phoneme Conversion for Mandarin TTS   总被引:1,自引:0,他引:1  
Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a text-selection method was designed to cover as many G2P text corpus contexts as possible. Then, various data-driven modeling methods were used with comparisons to select the best method for each polyphonic word. Finally, independent models were used for some neutral tone words in addition to the normal G2P models to achieve more compact and flexible G2P models. Tests show that these methods reduce the relative errors by 50% for both normal polyphonic words and Chinese neutral tones.  相似文献   

13.
为进一步降低基于可靠度的(Low Density Parity Check, LDPC)译码算法复杂度,提出一种基于量化修正的低复杂度LDPC译码算法,该算法在对信道信息预处理时引入量化信息修正处理策略,从而避免在译码迭代过程中进行译码信息修正处理操作,在保持译码性能的同时,较大幅度地降低译码复杂度。针对均匀和非均匀量化方案,本文实现了基于修正系数的均匀量化和基于列重修正的非均匀量化两种译码方案。仿真实验结果表明,所提出的两种译码方案在算法复杂度明显较低的情况下,仍然与MRBI-MLGD译码算法具有相同的译码性能与收敛速度。特别地,在基于列重修正的非均匀量化方案中,只需3-4 bits的低比特量化即可达到均匀量化中高比特量化(8 bits)相同的迭代次数和误比特率性能。  相似文献   

14.
提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语境特征下决策树叶子结点中基元的语境特征F′.统计F′中每一个语境特征相对于F*的变化,根据语境特征变化的概率对权重进行调整.实验结果表明,这种方法能够训练出合理的语境特征权重,使得合成语音的自然度有一定提高.同时,利用这种方法还可以对语音合成系统进行实时优化.  相似文献   

15.
基于改进的自组织映射网络的化工过程故障分类辨识   总被引:2,自引:0,他引:2  
将自组织映射网络(SOM)应用于化工过程故障数据的分类辨识,并采用粒子群优化(PSO)算法优化权重失真指数(LW D I),代替SOM的启发式训练算法,形成粒子群优化的SOM(PSO-SOM)分类算法。以某工厂甲醇合成反应器数据为研究对象,研究结果表明:对比基本SOM算法,PSO-SOM算法对复杂的故障数据能够得到较优的分类辨识结果,对甲醇合成生产中的故障诊断有非常显著的指导作用。  相似文献   

16.
In order to improve the performance of block adaptive quantization (BAQ) when the output of the analog to digital converter (ADC) is saturated, this paper proposes an anti-saturation BAQ algorithm. First, the concept of the standard deviation of the output signal (SDOS) of the ADC is proposed. Also, unlike traditional normalization processing, SDOS is used and the mapping between SDOS and the average signal magnitude is deduced. Second, the saturation term is introduced to the Lloyd–Max quantizer and an optimal non-uniform scalar quantizer for saturated SAR raw data quantization is proposed. After this, the implementation scheme for the proposed algorithm using an FPGA is analyzed in detail. Third, the relationships among the saturation degree of the signal, the peak-topeak value of the ADC, standard deviation of the input and output signal of the ADC and the average signal magnitude are deduced. Based on these relationships, a power compensation decoder is designed for encoding. Numerical experiment results based on ERS-1 and the simulated data show that the performance of the proposed algorithm is better than that of BAQ.  相似文献   

17.
提出一种新型高阻硅(电阻率ρ>8kΩ.cm)衬底MOS(metal-oxide-semiconductor)结构的凸起式共面波导。给出了其在50MHz~40GHz频段的插入损耗和回波损耗测试结果,以及在-40V~+40V直流偏压下散射参数的变化。结果表明,随着偏压的变化,回波损耗在Ka波段极值点的频率和幅值均会产生偏移,插入损耗极值点的频率基本没有偏移,只存在幅值偏移。共面波导的损耗偏移与MOS结构的Si-SiO2界面效应有关,在凸起式共面波导损耗的偏压实验中,观察到与传统MOS结构共面波导相反的曲线,并尝试给出了理论解释。该文设计的共面波导在35GHz下实现了小于-0.010dB/mm的损耗,优于Ka频段硅衬底共面波导已报道的结果。  相似文献   

18.
Logic functions can be implemented in either AND/OR/NOT-based traditional Boolean (TB) logic or AND/XOR-based Reed–Muller (RM) logic. To the majority of logic functions, it will be beneficial to be partially implemented in both TB logic and RM logic, called dual-logic. In this paper, a detection condition favoring dual-logic synthesis is proposed. A corresponding detection algorithm is developed and implemented in C. The algorithm is applied to test a set of MCNC91 benchmarks for verifying the algorithm. The results show that the proposed algorithm is more efficient than published ones.  相似文献   

19.
语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用.韵律的研究是语音合成技术中的重要研究课题.藏语语音韵律控制技术及其在藏语TTS中的应用,内容包括藏语语音韵律研究的基本情况及今后的工作重点,藏语语音合成技术中韵律调整的方法以及藏语TTS 中的韵律生成模型和声学模块.  相似文献   

20.
浅谈利用最新TTS技术进行语音图书馆建设   总被引:1,自引:0,他引:1  
介绍了利用最新语音合成TTS技术,通过文本数据挖掘、人工语音文件生成和音频数据压缩三部分的功能模块,把图书馆馆藏资源制作成有声资源的技术要领。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号