首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。  相似文献   

2.
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能.  相似文献   

3.
计算机语音信号处理与语音识别系统   总被引:1,自引:0,他引:1  
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达986%,说话人识别率达到922%。  相似文献   

4.
为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。  相似文献   

5.
基于SQLite技术的汉语语音识别数据库的建立   总被引:1,自引:1,他引:0  
建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明:一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。  相似文献   

6.
汉语语音识别研究中,识别单元的选取是很重要的。该文提出一种基于声韵母分割的,以韵母为基本识别单元的大词汇量孤立词的语音识别方法,并与以汉语词为基本识别单元的语音识别方法进行比较识别实验。结果表明,基于韵母为基本识别单元的语音识别性能优于以汉语词为基本识别单元的语音识别方法。  相似文献   

7.
汉语语音的声调是个人语气与情感状态最直接的表达,是体现汉语语言状态最重要的特征之一。为了使得语音合成的逼真度得到有效的提高,讲话者的话语更加具有区分度,通过加入声调参数特征实现语音语调变换,以期成为情感识别和语音识别的准确度最有力的助推剂,弥补语音合成结果在情感特征以及语音演唱方面的不足。分别对汉语阴平、阳平、上声、去声采用基频提取的方式进行声调的分析、研究,将得到的基频曲线采用多项式函数拟合的方法对汉语4种声调进行重新构建,从数学角度对汉语声调进行分析、重构,采用三角函数曲线模拟随时间变化的语音基频曲线,根据共振峰频率将曲线进行叠加,达到了95.91%的满意的识别结果。结果表明:采用多项式函数拟合方法实现汉语4种声调的语音合成,更好地还原了语音的数学本质,使得抽象化的语音表现得更直观可控。  相似文献   

8.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元.基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行.  相似文献   

9.
在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。  相似文献   

10.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率  相似文献   

11.
论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于3层BP神经网络的汉语语音识别系统,对汉语10个数字(1 ̄10)进行识别实验,获得了较满意的识别结果。  相似文献   

12.
高性能汉语数码语音识别芯片系统   总被引:1,自引:0,他引:1  
在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。  相似文献   

13.
介绍了国内外语音翻译系统的研究现状,分析了语音翻译系统的基本特点和工作原理,并结合作者在汉语语音识别与合成、英汉机器翻译等方面的工作,探讨了英汉语音翻译系统的设计与实现中的一些关键问题。  相似文献   

14.
本文介绍了我们开发的“汉语声控电脑打字机”的结构、功能以及系统实现中的一些关键技术,本系统是一个特定人、孤立词、大词汇量的汉语语音识别与理解系统,其最终识别率可达95%以上。  相似文献   

15.
设计并实现了一个基于LabVIEW与ZigBee无线通信模块的语音遥控机器人系统.操作者通过话筒将语音指令传入到上位PC机,利用Lab VIEW编程实现语音识别及串口通信控制指令发送.机器人端利用基于CC2530的Zigbee无线通信模块的控制与通信功能,根据接收到的指令,驱动电机,完成运动控制,同时可以利用红外传感器实现自主避障功能.  相似文献   

16.
简要介绍了语音检索的概念,从汉语音韵特征和检索模块两个方面探讨了图书数字化过程中语音检索与识别的处理方法和可能的发展方向。  相似文献   

17.
利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的分类超平面,并且自动优化参数,结合实际的识别结果文本集测试了改进的SVM性能,同时实现了KNN和贝叶斯分类算法,对3种分类性能进行了评价.  相似文献   

18.
一种新型汉语单音节识别方法   总被引:1,自引:0,他引:1  
介绍了一种新型字基 VQ/HMM语音识别方法: VQ与 HMM分级识别算法。 使得 VQ部分可用作语音识别的第一级处理, HMM部分作第二级识别。在第一级识别中 可引进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字汇表的实时语音识 别,存贮量、计算量均大大减少。用此方法把汉语四声作一个 HMM模型,使汉语 400 个基本音节的识别率达 96%以上.若加上精确四声识别则可识别汉语的 1200种声音。  相似文献   

19.
由于诱人的应用前景,语音识 多年来一直是人们研究的重大课题,讲话人的计算机识别(Speaker Recognition)则是语音计算机识别的一重要内容,作者根据汉语发音的特点,成功地研制出一个适合汉语讲话者的计算机识别系统,得到较高的识别率和语音压缩率,本文介绍了此识别,文中着重讨论应用时间域归正当解决汉语发音动态变化问题,并对系统的研制心得,实验结果作简单总结.  相似文献   

20.
通过对语音和唇形的信号采集,设计了12个外唇线关键点和9个内唇线关键点的提取方案,同时建立起语音、唇形数据库,并对其进行参数提取和统计分析,从而建立了汉语普通话语音、唇型之间的关联模型,在此基础上实现了语音驱动的唇形合成系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号