期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨莉莉李燕徐柏龄《南京大学学报(自然科学版)》2005,41(3):311-317

耳语音的识别和转换是个全新的课题,可应用于公共场合下的通讯和公安司法工作的某些特殊需要等方面.首先建立了一个包含1172个字和98个近音词的单人女声的汉语耳语音库.通过对两个听觉测试实验数据的统计分析,研究了人耳对汉语耳语音字和近音词声调的辨认率特征,得出人耳对孤立字四个声调的辨认率由高到低的排序为三声>四声>二声>一声.同时也得出人耳对词声调的辨认能力比字要强得多.幅值包络和音长这两个特征参量能够反映出汉语耳语音声调的特性,基于此参数对汉语耳语音字进行声调识别实验,其声调识别率已达到了人耳的平均辨认率,为连续耳语音声调识别研究打下了基础. 相似文献

2.

A new frequency scale of Chinese whispered speech in the application of speaker identification 总被引：1，自引：0，他引：1

LIN Wei YANG Lili XU Boling 《自然科学进展(英文版)》2006,16(10):1072-1078

In this paper, the frequency characteristics of Chinese whispered speech were investigated by a filter bank analysis. It was shown that the first and the third formants were more important than the other formants in the speaker identification of Chinese whispered speech. The experiment showed that the 800?1200 Hz and 2800?3200 Hz ranges were the most significant frequency ranges in discriminating the speaker. Based on this result, a new feature scale named whisper sensitive scale (WSS) was proposed to replace the common scale, Mel scale, and to extract the cepstral coefficient from whispered speech signal. Furthermore, a speaker identification system in whispered speech was presented based on the modified Hidden Markov Models integrating advantages of WSCC (the whisper sensitive cepstral coefficient) and LPCC. And the new system performed better in solving the problem of speaker identification of Chinese whispered speech than the traditional method. 相似文献

3.

一种新型汉语单音节识别方法 总被引：1，自引：0，他引：1

曹洪《清华大学学报(自然科学版)》1990,(4)

介绍了一种新型字基ＶＱ／ＨＭＭ语音识别方法：ＶＱ与ＨＭＭ分级识别算法。使得ＶＱ部分可用作语音识别的第一级处理，ＨＭＭ部分作第二级识别。在第一级识别中可引进汉语的音素知识，使ＶＱ／ＨＭＭ性能进一步提高，并可用于大字汇表的实时语音识别，存贮量、计算量均大大减少。用此方法把汉语四声作一个ＨＭＭ模型，使汉语４００个基本音节的识别率达９６％以上．若加上精确四声识别则可识别汉语的１２００种声音。相似文献

4.

汉语普通话话音间隙统计特性的初步研究

胡修林《华中科技大学学报(自然科学版)》1988,(5)

本文提出了一种利用计算机测量话音间隙持续时间的方案和对测得的间隙进行统计的算法,在实测的基础上,对汉语普通话的话音间隙进行了分析研究。文中指出,在保持时间为200ms时,独白式汉语普通话话音间隙近似服从以其平均值的倒数为参数的指数分布。相似文献

5.

TD-PSOLA技术在汉语语音波形编码合成中的应用 总被引：1，自引：0，他引：1

吴耀中《福建师范大学学报(自然科学版)》1999,15(1):40-43

以时域基音同步叠加（ＰＳＯＬＡ）技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。相似文献

6.

基于短时和长时特征的语音情感识别研究

林奕琳韦岗《科学技术与工程》2006,6(4):450-454

基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。相似文献

7.

基于小波变换的汉语三字词语音基音频率提取 总被引：2，自引：0，他引：2

王义元赵黎明《吉林大学学报(信息科学版)》2005,23(1):22-26

声调是基音频率的轮廓,为准确提取基音频率,进行具有汉语特色的连续语音识别,提出了具有汉语特色的清浊音切分方法.与常用的阈值法相比,该方法能更好地找到清浊音的切分点,尤其是在字与字连接紧密时更有效(在这种情况下阈值法往往失效).在此基础上,利用小波变换的多分辨分析特性进行了汉语三字词语音基音频率的提取.实验结果显示,该算法能有效地将三字词语音分开,且得到的基音频率曲线符合汉语三字词语音的声调模式. 相似文献

8.

基于Power builder的语音数据库设计与实现

李鑫《新疆师范大学学报(自然科学版)》2007,26(3):126-128

文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能. 相似文献

9.

基于小波变换的语音基频检测

吴谨刘振兴《武汉科技大学学报(自然科学版)》2000,23(2):190-192

用小波变换法对语音基频进行检测。结果表明 ,小波变换法比传统方法更准确地提取基频 ,并具有相当的稳健性和适应性。对汉语而言 ,有利于语音四声的识别相似文献

10.

连续语音的三音子DDBHMM识别方法

游展肖熙王作英《清华大学学报(自然科学版)》2009,(4)

针对目前连续语音识别中广泛使用的齐次HMM(hidden Markov model)模型识别精度低的现状,该文提出了三音子DDBHMM(duration distribution based HMM)识别方法。根据汉语的特点,设计了适用于连续语音识别的三音子。描述了识别中使用的MLSS(most likely statesequence)准则。设计了识别网络并阐明了用于三音子识别的帧同步识别算法。将三音子DDBHMM识别方法与三音子齐次HMM识别方法和双音子DDBHMM识别方法进行了实验对比,结果表明:采用三音子DDBHMM可以使得识别错误率分别下降0.95%和2.29%。说明该方法能够显著地改进连续语音识别性能。相似文献

11.

连续语流中韵律层级和调型组合对重音感知的影响

李雅卢颖超许小颖陶建华《清华大学学报(自然科学版)》2011,(9):1239-1243,1248

由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。相似文献

12.

基于状态驻留时间的汉语语音分段概率模型 总被引：1，自引：0，他引：1

贾宾朱小燕罗予频胡东成《清华大学学报(自然科学版)》2000,40(1)

为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。相似文献

13.

PMC在噪声环境下的语音识别中的应用

下载免费PDF全文

金连斌丁庆海陈显治《解放军理工大学学报(自然科学版)》2001,2(2):42-45

今天的语音识别正处于由实验室技术走向实用化,产品化的关键时期,然而,现有的绝大我数语音识别系统在噪声环境中的性能都不可避免地急上降,环境噪声已经成为语音识技术商品化的一个主要障碍,因此在语音识技术逐渐走向实用化的过程中,噪声语音识别日益成为一个重要的研究领域,遗憾的是,由于噪声语音识问题本身的复杂性,至今还没有一种方法可以圆满地解决这一问题,拟从模型补偿方面,对噪声环境下的孤立词语音识别进行一些探索,重点研究一个在噪声环境下的语音识别算法－－并行模型组合方法（PMC）,详细论述了其原理以及在噪声环境下的语音识别中的应用。实验中,我们使用汉语的数字语音,分别在3种不同噪声不同信噪比条件下对这一方法进行了识别率测试,结果显示,该方法有着令人振奋的识别效果。相似文献

14.

语音情感特征提取和识别的研究与实现 总被引：9，自引：0，他引：9

詹永照曹鹏《江苏大学学报(自然科学版)》2005,26(1):72-75

针对语音情感识别的实时性与可用性问题,提出了利用汉明窗提取语音信号中情感特征的方法,从说话者中采集带有快乐、愤怒、惊奇、悲伤情感的语句,并从语句中提取8个情感特征参数．同时提出采用贡献分析法确定情感特征参数的权值,利用加权欧氏距离模板匹配识别语音情感．实验表明该方法识别率有提高,更适合实时识别的应用。相似文献

15.

一种实时说话人身份识别系统的设计

杨毅明陈东华《华侨大学学报(自然科学版)》2009,30(5)

设计一种以TM S320VC5402为核心,外围扩展语音编解码器、程序存储器、语音存储器等集成电路,基于定点数字信号处理器的实时说话人身份识别的系统.通过为每个语音命令设置3个模板的预留空间,使每个语音命令可以有3个模板参与识别,避免说话人语气和语调的变化产生的影响.在比较嘈杂的环境下,系统的正确识别率超过87%.处理器VC5402从识别中断并响应中断到CPU进入中断服务程序的第1条指令,需要20个时钟周期,系统的平均处理时间小于0.2 s. 相似文献

16.

中文微博观点句识别及评价对象抽取方法

胡默之姚天昉《山东大学学报(理学版)》2016,51(7):81-89

根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。相似文献

17.

FCNN深度学习模型及其在动物语音识别中的应用

石鑫鑫鱼昕刘铭《吉林大学学报(信息科学版)》2021,39(1):60-65

为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算... 相似文献

18.

融合词性与双向时间卷积网络的中文命名实体识别方法

张鹏周志强《重庆邮电大学学报(自然科学版)》2023,35(4):662-670

针对目前中文命名时实体识别方法中存在的中文边界识别困难、模型梯度、文本特征不够充分等问题,提出了一种融合词性特征与双向时间卷积网络的中文命名时实体识别模型。该模型提出使用XLNet预训练语言模型生成对应的词嵌入表示,融合后使用双向时间卷积网络提取文本前向特征与后向特征。实验中对时间卷积网络的空洞因子、卷积层数和卷积核数进行参数实验并分析其影响原因,结果表明,该模型与其他模型相比,能够更准确且有效地提取文本中的实体。相似文献

19.

An approach to offline handwritten Chinese character recognition based on segment evaluation of adaptive duration

Li GH Shi PF 《浙江大学学报(自然科学英文版)》2004,5(11):1392-1397

This paper presents a methodology for off-line handwritten Chinese character recognition based on mergence of consecutive segments of adaptive duration. The handwritten Chinese character string is partitioned into a sequence of consecutive segments, which are combined to implement dissimilarity evaluation within a sliding window whose durations are determined adaptively by the integration of shapes and context of evaluations. The average stroke width is estimated for the handwritten Chinese character string, and a set of candidate character segmentation boundaries is found by using the integration of pixel and stroke features. The final decisions on segmentation and recognition are made under minimal arithmetical mean dissimilarities. Experiments proved that the proposed approach of adaptive duration outperforms the method of fixed duration, and is very effective for the recognition of overlapped, broken, touched, loosely configured Chinese characters. 相似文献

20.

《中州全韵》声调探析

孔永《长春师范学院学报》2011,(1):85-89

《中州全韵》是范善溱所作一部北曲性质的韵书,是关于近代汉语语音的重要著作。其中去分阴阳为本书最大特色,在很大程度上反映了当时的实际语音状况。相似文献