共查询到20条相似文献,搜索用时 0 毫秒
1.
提出了一种基于决策树的语音合成基元的语境特征权重训练算法.对语音数据库中的每个带调音节,利用语境相关的问题集和候选基元的频谱距离建立决策树.对每个要合成的音节,根据其语境特征,获得语音合成系统选择的基元的语境特征F*和该语境特征下决策树叶子结点中基元的语境特征F′.统计F′中每一个语境特征相对于F*的变化,根据语境特征变化的概率对权重进行调整.实验结果表明,这种方法能够训练出合理的语境特征权重,使得合成语音的自然度有一定提高.同时,利用这种方法还可以对语音合成系统进行实时优化. 相似文献
2.
纳西语语音合成的初步研究 总被引:1,自引:0,他引:1
杨鉴 《云南大学学报(自然科学版)》1995,17(1):105-109
本文初步建立了一个纳西语按规则语音合成系统,该系统采用共振峰语音合成技术,以350个左右的无调单音节和4种声调模式为合成基元,该系统不仅适用于纳西语文-语转换系统,而且也是一个研究纳西语语音的有力工具。 相似文献
3.
This paper describes the design of a unified framework for a multilingual text-to-speech (TTS) synthesis engine – Crystal. The unified framework defines the common TTS modules for different languages and/or dialects. The interfaces between consecutive modules conform to the speech synthesis markup language (SSML) specification for standardization, interoperability, multilinguality, and extensibility. Detailed module divisions and implementation technologies for the unified framework are introduced, together with possible extensions for the algorithm research and evaluation of the TTS synthesis. Implementation of a mixed-language TTS system for Chinese Putonghua, Chinese Cantonese, and English demonstrates the feasibility of the proposed unified framework. 相似文献
4.
提出一种针对任务实例的授权规则TlAR.在RBAC的权限基础上,介绍权限组的概念及流程中应该被授予相同角色的权限集,并给出权限组实例的定义,以保证权限组中的所有权限授予同一个动态确定的受权者. 相似文献
5.
本文设计了一个基于格型网络的语音合成算法,采用格型网络输出合成语音,通过对语音参数进行线性内插等措施来提高合成语音的自然度、清晰度。 相似文献
6.
以多示例学习(Multiple Instance Learning,MIL)目标跟踪方法为代表,基于自适应辨别模型的视频目标跟踪算法近年来得到广泛重视,这些算法用分类器对图像进行处理,将使分类器置信最大的采样样本作为当前帧的跟踪结果.在此基础上,基于加权多示例学习(Weighted Multiple Instance Learning,WMIL)的目标跟踪算法提出在分类器学习阶段对正样本进行重要性采样,加大正包内正样本的贡献,达到更好的跟踪效果.然而,当前一帧输出结果不准确时,会使得分类器学习性能下降,从而引起目标漂移或跟踪失败.本文基于WMIL算法,提出用目标匹配约束预判断当前帧是否存在目标漂移,从而对下一帧采样中心位置进行矫正,达到抑制目标漂移以及避免跟踪失败的效果.仿真结果表明,本算法在标准视频测试集上都取得了较优的结果. 相似文献
7.
针对已有神经网络方法采用示例决定标记从而导致多示例学习(MIL)中包结构信息丢失的问题,提出了一种新的RK_BP多示例学习方法.在示例空间,首先采用粗糙集对其进行属性约简;然后进行K均值聚类,利用聚类点构造新包空间;在新空间中,利用误差反向传播神经网络算法进行分类.在多个测试数据集上对算法进行测试,结果表明该算法可有效解决已有神经网络方法包结构信息丢失问题,明显提高分类性能. 相似文献
8.
近年来,在汉语语音合成的研究中,如何提高合成语音的自然度越来越引起人们的关注。其中的关键问题是设计一个能灵活有效地调节汉语韵律特征的语音合成器。进行韵律调节的基本原理是基于源/滤波器理论,采用同态处理的方法,对汉语文语转换系统进行研究,并对韵律调节部分进行分析和实验。实验结果显示,这种方法要胜于PSOLA方法,下一步,一块基于DSP芯片“TMS320C54x”的PC卡将用来实现上述目标,从而期望建立一个实时的语音合成器,并使其得到广泛的应用。 相似文献
9.
计算机自动查号系统已在我国大部分县级以上城市开通。在这些系统中,话务员是通过键盘与计算机进行对话的。实现了基于PARADOXENGINE的大容量语音输入式电话查询系统。对于这一系统,话务员可以利用话筒输入待查内容。 相似文献
10.
利用正弦模型设计一个音乐合成系统 .由于正弦模型具有高效性和灵活性 ,它能够修改合成单元的基音频率、时长等 ,因此本合成系统利用波型拼接的方法来合成音乐 .合成系统中的合成单元由专业歌手发音来形成 相似文献
11.
郭天石 《四川理工学院学报(自然科学版)》2006,19(1):42-45
给出了基于LabVIEW的虚拟信号合成图示仪的设计方法。利用该图示仪可以方便地研究信号特征量的变化对合成信号波形的影响以及对特征量的定量测定方法。 相似文献
12.
文章采用了一种以可变长音素序列为拼接单元的维吾尔语语音合成系统的技术方案,阐述了维吾尔语的语言特点及语音合成中必须考虑的语音协同发音等现象,给出了语音库的设计思路及其句子、短语、词语、音节以及音素等多级语音库结构,以便直接从语音库中找到拼接单元,还考虑了怎样合成语音库中没有拼接单元的情况。该方法能更好地利用自然语流的原始信息,提升了系统合成语音效果的自然度。 相似文献
13.
陈在 《重庆邮电学院学报(自然科学版)》1991,(2)
矢量量化(VQ)是近年来发展迅速的新型的高效信源编码技术,被广泛地应用于移动通信、卫星通信和保密通信等领域。而在矢量量化中,码本的优劣直接影响到 VQ 技术的性能。本文在研究了几种传统的建本算法的基础上,提出了一种高质量的量化方式——非均匀矢量量化(NUVO),并在此基础上提出了适应 NUVO 的建本算法——多级阈值聚类算法(Multi—Stage Threshold Clustering Algorithm——MSTC)。该方案主要建立在矢量自身的概率密度函数(pdf)之上,因此,在质量上有了较大的提高。 相似文献
14.
本文采用语音信号的正弦表示方法并利用耳蜗模型提取了语音信号的基本物征参数,建立了一个语音分析/合成系统。 相似文献
15.
基于短时综合叠接相加法的语音盲信号分离研究 总被引:1,自引:0,他引:1
独立分量分析(ICA)在频域中进行语音盲信号分离(BSS)时,将产生频谱分辨率降低和信号源间频谱相互干扰的矛盾,矛盾的任何一方突出时都会影响分离效果。为了解决这一矛盾,我们把短时综合的叠接相加法引进到BSS中,这一方法有效地缓解了这对矛盾,并且分离性能得到了明显的改善。仿真实验表明,这一方法简单可行并产生了很好的分离效果。 相似文献
16.
非均匀网格上求解对流扩散问题的高阶紧致差分方法 总被引:1,自引:0,他引:1
基于非均网格上函数的泰勒级数展开,推导出求解一维对流扩散问题的高阶紧致差分格式.对于离散化得到的代数方程组,采用BiCGStab(2)迭代法求解.数值实验表明,该格式对于扩散占优、对流占优及边界层问题都有很好的适应性,对于数值模拟待求物理量的大梯度变化具有很高的分辨率,计算结果明显优于传统的均匀网格上的差分格式.在具体的数值模拟中,可根据实际物理量的变化规律,选取适当的网格生成变换函数,合理地调整非均匀网格的疏密分布,从而获得比在含相同结点数的均匀网络系统中更为精确的数值结果. 相似文献
17.
多点广播技术已日益广泛应用到多媒体通信网络之中,多点广播路由策略是该项技术的关键部分。文章针对现有的多点广播路由策略存在的问题,提出了改进方法并给出了一种基于树型结构的冗余路由信息剪裁算法。 相似文献
18.
顾启泰 《清华大学学报(自然科学版)》1987,(4)
本文推导了受扰系统在调节对象参数发生变化时仍保持抗干性和渐近跟踪的充要条件.并提出适合于工程应用的、采用动态补偿器和状态反馈相结合的“鲁棒”调节器综合方法,给出了应用实例。 相似文献
19.
田芳 《宁夏大学学报(自然科学版)》2012,33(2):144-147
利用降维法推导出非均匀网格上三维对流扩散方程的高精度紧致差分格式,对于离散得到的代数方程组采用BiCGStab(2)迭代法求解.数值算例表明,在网格节点数相同的情况下,基于非均匀网格的计算格式较均匀网格格式具有高精度、高分辨率的优点,对于合边界层的对流扩散问题有很好的适应性. 相似文献
20.
传统的汉语语音理解方法主要有两种:语言学方法和统计学方法,它们在过去的研究工作中已经取得了许多成果,但是用这两种方法建立的系统都是开环系统,对在理解中发生的错误没有自校正能力。本文提出了一个具有语言的预生成能力和反馈自校正能力的闭环汉语语音理解方案,它可以克服传统的开环系统的不足。为了证实本方案的可行性,本文最后还给出了一个汉语地名的识别理解实验的结果。 相似文献