期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李冰锋谢磊周祥增付中华张艳宁《清华大学学报(自然科学版)》2011,(9)

该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。相似文献

2.

基于Power builder的语音数据库设计与实现

李鑫《新疆师范大学学报(自然科学版)》2007,26(3):126-128

文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能. 相似文献

3.

计算机语音信号处理与语音识别系统 总被引：1，自引：0，他引：1

朱学芳徐建平《南京邮电大学学报(自然科学版)》1998,(Z1)

对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对１０个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性（主要是短时帧能量、短时过零率和帧能量差）,并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达９８６％,说话人识别率达到９２２％。相似文献

4.

基于语音学分类的汉语三音子识别单元的算法

李春王作英《清华大学学报(自然科学版)》2003,43(1):16-19

为提高语音识别系统的性能,针对汉语语音的单音节结构的特点,提出了建立三音子识别单元的方法。这种方法完全利用语音学知识对上下文进行分类从而实现参数共享,而不同于传统的数据驱动的聚类共享。提出并实现了采用三音子单元的识别系统的训练算法和识别搜索算法。实验表明:基于语音学分类的三音子单元对识别性能有明显的改善,系统的首选误识率相对基线系统降低了28%。相似文献

5.

基于SQLite技术的汉语语音识别数据库的建立 总被引：1，自引：1，他引：0

刘祥楼《科学技术与工程》2011,11(14)

建立一个适合于特定说话人识别系统的汉语语音识别数据库,对推动说话人识别技术的研究和应用具有重要意义。本文基于支持向量机的说话人识别系统研究和开发过程中,构建了一个基于SQLite技术的汉语语音识别数据库,通过LabVIEW平台来实现对数据库控制操作。采用无序列样本和语音数据库样本分别进行比对实验。测试结果表明：一方面,无论是采用该语音识别数据库样本还是无序样本对说话人识别系统的识别率没有改变,这充分说明本系统建立的汉语语音识别数据库具有高稳定性和可靠性;另一方面,采用语音识别数据库样本其系统识别时间却明显缩短,这是改善基于支持向量机的说话人识别系统性能的有效途径。相似文献

6.

一种基于声韵母分割的汉语语音识别方法①

钟明辉《科技咨询导报》2014,(18):249-249

汉语语音识别研究中，识别单元的选取是很重要的。该文提出一种基于声韵母分割的，以韵母为基本识别单元的大词汇量孤立词的语音识别方法，并与以汉语词为基本识别单元的语音识别方法进行比较识别实验。结果表明，基于韵母为基本识别单元的语音识别性能优于以汉语词为基本识别单元的语音识别方法。相似文献

7.

多项式函数拟合实现汉语声调的语音合成

《西安科技大学学报》2021,(3)

汉语语音的声调是个人语气与情感状态最直接的表达,是体现汉语语言状态最重要的特征之一。为了使得语音合成的逼真度得到有效的提高,讲话者的话语更加具有区分度,通过加入声调参数特征实现语音语调变换,以期成为情感识别和语音识别的准确度最有力的助推剂,弥补语音合成结果在情感特征以及语音演唱方面的不足。分别对汉语阴平、阳平、上声、去声采用基频提取的方式进行声调的分析、研究,将得到的基频曲线采用多项式函数拟合的方法对汉语4种声调进行重新构建,从数学角度对汉语声调进行分析、重构,采用三角函数曲线模拟随时间变化的语音基频曲线,根据共振峰频率将曲线进行叠加,达到了95.91%的满意的识别结果。结果表明:采用多项式函数拟合方法实现汉语4种声调的语音合成,更好地还原了语音的数学本质,使得抽象化的语音表现得更直观可控。相似文献

8.

随机轨迹模型中汉语连续语音识别基元的选取方案

黄心晔施嵘富煜清陆佶人《东南大学学报(自然科学版)》1999,29(4):94

在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元．基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行．相似文献

9.

随机轨迹模型中汉语连续语音识别基元的选取方案要

黄心晔施嵘《东南大学学报(自然科学版)》1999,29(4):48-51

在比较各种汉语语音识别基元的基础上,结合汉语语音和随机轨迹模型的特色,提出了以音素类单元作为汉语连续语音识别系统的识别基元,基于音素基随机轨迹模型的汉语连续语音识别系统的实验结果表明,该方案可行。相似文献

10.

基于词组输入方式的汉语大词汇语音识别系统的研究

江辉王仁华《中国科学技术大学学报》1997,27(1):17-24

研究了汉语大词汇词组语音识别算法的实现问题，提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略，对其中一些关键问题做了比较性实验，得出了一些有益的结论．针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型（ＦＨＩＦ），实验证明ＦＨＩＦ的确优于普通的声韵母模型（ＩＦ）．随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统，该系统原则上可以识别无限的汉语词组，通过对汉语中最常用的５０００词的测试结果表明，该模拟系统首选词条在特定人下已达到了约８７％的识别率相似文献

11.

神经网络在汉语语音识别中的应用

吴谨王绍纯《北京科技大学学报》1998,20(4):372-375

论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于３层ＢＰ神经网络的汉语语音识别系统,对汉语１０个数字（１￣１０）进行识别实验,获得了较满意的识别结果。相似文献

12.

高性能汉语数码语音识别芯片系统 总被引：1，自引：0，他引：1

董明刘加刘润生《清华大学学报(自然科学版)》2003,43(9):1257-1260

在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。相似文献

13.

英汉语音翻译系统的关键技术分析

魏茂盛章森张冯厚《济南大学学报(自然科学版)》1998,(3)

介绍了国内外语音翻译系统的研究现状,分析了语音翻译系统的基本特点和工作原理,并结合作者在汉语语音识别与合成、英汉机器翻译等方面的工作,探讨了英汉语音翻译系统的设计与实现中的一些关键问题。相似文献

14.

汉语语音识别与智能音字转换系统的研究

邱伟徐秉铮钟文青《华南理工大学学报(自然科学版)》1996,(4)

本文介绍了我们开发的“汉语声控电脑打字机”的结构、功能以及系统实现中的一些关键技术，本系统是一个特定人、孤立词、大词汇量的汉语语音识别与理解系统，其最终识别率可达９５％以上。相似文献

15.

基于LabVIEW与Zigbee的无线语音遥控机器人系统

徐攀峰李丽娜梁德骕黄志刚郭恒开《辽宁大学学报(自然科学版)》2015,42(2)

设计并实现了一个基于LabVIEW与ZigBee无线通信模块的语音遥控机器人系统.操作者通过话筒将语音指令传入到上位PC机,利用Lab VIEW编程实现语音识别及串口通信控制指令发送.机器人端利用基于CC2530的Zigbee无线通信模块的控制与通信功能,根据接收到的指令,驱动电机,完成运动控制,同时可以利用红外传感器实现自主避障功能. 相似文献

16.

图书数字化的语音检索与识别

丁聿《科技情报开发与经济》2011,21(5):83-85

简要介绍了语音检索的概念,从汉语音韵特征和检索模块两个方面探讨了图书数字化过程中语音检索与识别的处理方法和可能的发展方向。相似文献

17.

改进的SVM在语音识别文本分类中的应用

赵培牛纪桢史金艳《广西师范大学学报(自然科学版)》2009,27(1)

利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的分类超平面,并且自动优化参数,结合实际的识别结果文本集测试了改进的SVM性能,同时实现了KNN和贝叶斯分类算法,对3种分类性能进行了评价. 相似文献

18.

一种新型汉语单音节识别方法 总被引：1，自引：0，他引：1

曹洪《清华大学学报(自然科学版)》1990,(4)

介绍了一种新型字基ＶＱ／ＨＭＭ语音识别方法：ＶＱ与ＨＭＭ分级识别算法。使得ＶＱ部分可用作语音识别的第一级处理，ＨＭＭ部分作第二级识别。在第一级识别中可引进汉语的音素知识，使ＶＱ／ＨＭＭ性能进一步提高，并可用于大字汇表的实时语音识别，存贮量、计算量均大大减少。用此方法把汉语四声作一个ＨＭＭ模型，使汉语４００个基本音节的识别率达９６％以上．若加上精确四声识别则可识别汉语的１２００种声音。相似文献

19.

一个适合汉语讲话者的计算机识别系统

黄李庚云冠民《华南师范大学学报(自然科学版)》1991,(1):1-32

由于诱人的应用前景,语音识多年来一直是人们研究的重大课题,讲话人的计算机识别(Speaker Recognition)则是语音计算机识别的一重要内容,作者根据汉语发音的特点,成功地研制出一个适合汉语讲话者的计算机识别系统,得到较高的识别率和语音压缩率,本文介绍了此识别,文中着重讨论应用时间域归正当解决汉语发音动态变化问题,并对系统的研制心得,实验结果作简单总结. 相似文献

20.

语音驱动的唇型合成系统的实现

丁丽娟王晓曦杨阳蕊于洪志《长春工程学院学报(自然科学版)》2010,11(2):109-112

通过对语音和唇形的信号采集,设计了12个外唇线关键点和9个内唇线关键点的提取方案,同时建立起语音、唇形数据库,并对其进行参数提取和统计分析,从而建立了汉语普通话语音、唇型之间的关联模型,在此基础上实现了语音驱动的唇形合成系统. 相似文献