期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

田新宇李军辉《厦门大学学报(自然科学版)》2022,(4):682-688

传统的机器翻译模型均基于无噪声环境,即输入的数据是无错误的.但在实际同声传译中,语音识别不可避免会存在错误,这些错误在机器翻译过程中会直接影响其他内容的翻译.因此,统计分析语音识别错误的种类及产生的影响对提高机器翻译的鲁棒性具有指导意义.为了模拟真实语音识别错误,本文通过人工朗读NIST汉英实验测试集,并采用讯飞语音识别系统获取其语音识别结果进行统计分析,主要包括：1)语音识别错误的词性分析;2)语音识别错误的类型分析;3)语音识别错误对翻译性能的影响;4)语音识别错误对其他词翻译的影响.得出的主要结论为：名词和动词出现语音识别错误的次数较多,人名最易出现语音识别错误;同音异形字的语音识别错误出现次数最多;长度较小的句子在翻译时受到语音识别错误影响的程度更加明显;与语音识别错误词距离更近的词的翻译更易受到影响. 相似文献

2.

监控系统的语音识别与语音提示 总被引：3，自引：0，他引：3

刘科斌韩佳玲李国宾《辽宁师专学报(自然科学版)》2002,4(3):19-20,80

介绍一种以PIC16C58单片机为控制核心的电话自动报警器，电路设计合理，结构紧凑，发号，检测和放音自动循环，报警过程迅速准确，它可方便地连成报警网络，而且可以扩充报警内容，是一种用于家庭或办公室的安全防范设备。相似文献

3.

高性能汉语数码语音识别芯片系统 总被引：1，自引：0，他引：1

董明刘加刘润生《清华大学学报(自然科学版)》2003,43(9):1257-1260

在嵌入平台上实现高性能的汉语数码语音识别(MDSR),对于电话通讯、工业控制等都具有极高的实用价值。该文描述了一个在16bit定点DSP芯片上实现的高性能汉语数码语音识别系统。识别模型采用连续隐Markov模型(CHMM),识别特征采用Mel频标倒谱系数(MFCC)。在模型的训练中引入MCE区分性训练进一步提高了系统的识别性能。识别过程采用单级识别框架,降低了芯片上系统部分的复杂性,同时保证了很高的识别性能与稳健性。实验证明该系统对11汉语数码发音可以达到98.3%的识别正确率,在58.5MIPS的16bit定点DSP上进行一次识别只需要35ms。相似文献

4.

一种面向语音识别的新型神经网络 总被引：1，自引：0，他引：1

王晓明郑宝玉《南京邮电大学学报(自然科学版)》1998,(4)

提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。相似文献

5.

英语语音错误的反弹性

吕兰《长春师范学院学报》2007,(9)

为了改变长久以来我校英语专业语音教学的形式,促使学生打下扎实的语音基础,促进其交际能力的提高,因此,语音教学形式的改革在2005级的一个班中进行。在实施改革的过程中,学生先后接受了三次语音考试。第三次语音考试结果显示学生的语音错误有明显的反弹现象。造成学生语音错误反弹的原因是:母语及方言对语音学习产生的负迁移、中学英语教材不合理的音标编排和学生消极的语音学习态度。一些建议及设想有助于解决学生语音错误的反弹。相似文献

6.

基于电话的语音对话系统质量研究

刘丽《国外科技新书评介》2007,(3):9-10

越来越多的电话服务是通过语音技术以全自动的方式完成的。这个被称作通话系统的自动化系统由话音识别、话音理解、通话管理以及语音发生能力四个部分组成，并且能够与人类进行比较自然的互动对话。然而由于人机交互的局限性，这种互动的原理与通过电话互动的人与人之间的对话是有区别的。倘若双方的对话行为以合作的方式进行，人们通常能够应对这种局限从而达到通话的目的。本书针对这些通话质量的革新技术提出了系统的估价、评估和预测方法。相似文献

7.

数据库恢复系统的设计

邹永贵《重庆邮电学院学报(自然科学版)》1998,10(2):36-39

计算机系统就象任何其他机械或电子设备一样,也会发生错误。发生错误的原因多样,例如磁盘故障、电源故障、软件故障、机房火灾,甚至人为破坏,在任一情况下,信息都可能会丢失。因此,数据库系统必须事先采取措施,以使得即使发生错误时能确保事务的原子性与持久性。完整的数据库系统设计之一便是恢复系统设计,其负责恢复数据库到错误发生前存在的一个一致状态。相似文献

8.

基于DTW的语音识别应用系统研究与实现 总被引：10，自引：0，他引：10

万春《集美大学学报(自然科学版)》2002,7(2):104-108

DTW算法在实现小词汇表孤立词识别系统时既简单又有效，在特定的场合下获得了广泛的应用。通过对语音识别数学模DTW的研究和改进，实现了一个特定人孤立词，连接词的语音识别系统。相似文献

9.

基于ADSP2186的语音识别电话

李作友江太辉《五邑大学学报(自然科学版)》1997,11(4):23-26

对基于ＡＤＳＰ２１８６的语音识别电话的硬件结构作了简明的介绍，并阐述了程序设计和内存空间管理的思想和方法。最后对语音识别电话的实用性进行了探讨。相似文献

10.

基于语音识别的电子秘书手机 总被引：1，自引：0，他引：1

尹航王慧锋《华东理工大学学报(自然科学版)》2008,34(6):892-896

将嵌入式系统和语音识别技术结合起来,设计并制作了一款基于语音识别的新型电子秘书手机.系统在硬件上以基于PXA270处理器的XScale平台为控制核心,经RS232串口外扩语音识别和GSM/GPRS模块.以Linux作为操作系统,通过对XScale平台和语音识别模块的编程,实现了录音、语音设定闹钟时间、自动播放以及自动群发短信等功能.测试结果说明:系统特有的图形化界面以及基于语音的人机交互方式可以方便地将重要信息准时通知给多人,实现了电子秘书的功能. 相似文献

11.

一种人机交互语音切分系统

《云南民族大学学报(自然科学版)》2016,(1):87-91

对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率. 相似文献

12.

段长在汉语语音识别系统后处理阶段的应用

李曜刘加《清华大学学报(自然科学版)》2009,(Z1)

针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。相似文献

13.

嵌入式中等词汇量英语语音识别片上系统 总被引：1，自引：0，他引：1

王国梁梁维谦刘加刘润生《清华大学学报(自然科学版)》2005,45(10):1393-1396

针对目前嵌入式英语语音识别系统中识别性能较差或硬件资源占用较大的问题,提出了一个在16 b定点数据信号处理语音芯片上实现的非特定人、中等词汇量英语命令字识别系统。该系统采用基于连续隐含M arkov模型(con tinuous dens ity h idden M arkov m ode l,CDHMM)的两级识别网络,通过应用改进的音素体系、B ayes ian信息准则模型参数选择算法、决策树和数据驱动相结合的状态聚类方法、最小互信息改变准则特征选择算法,在保证识别率的前提下,大大降低了模型的存贮空间和计算复杂度。实验表明,对1 235词的英语短句的识别率为96.41%,识别时间为0.46倍实时。相似文献

14.

中英双语混合语音识别研究

张晴晴潘接林颜永红《重庆邮电大学学报(自然科学版)》2008,20(4):391-396

介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题：①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法（TCM）,并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明：利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率（PER）相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。相似文献

15.

嵌入式语音识别中一种高效的图搜索算法

黎塔蔡尚赵庆卫潘接林颜永红《东南大学学报(自然科学版)》2009,(Z1)

为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可以使语音识别的解码过程更加紧凑有效.在对比实验中,传统的基于前缀合并的状态树搜索算法的大词表嵌入式单词拼读系统作为基线系统.实验结果表明,与基线系统相比,所提出的双层图搜索算法在系统解码速度相对提高10%的情况下,系统的动态内存占用仅为基线的8%.通过使用所提出的双层图搜索算法,大大提高了大词表嵌入式单词拼读系统的效率,使其更适用于大多数嵌入式平台. 相似文献

16.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献

17.

用于语音识别的空间相关性变换

苏腾荣吴及王作英《清华大学学报(自然科学版)》2009,(10)

针对经典隐含Markov模型忽略了语音信号之间的依存关系的问题,提出一种线性特征变换——空间相关性变换,利用同一个说话人的不同语音单元之间的相关性(空间相关性)得到鉴别性能更好的新特征。该变换的最优变换矩阵在最小协方差准则下得到。识别系统采用新特征及其模型参数代替原特征及其模型参数进行Viterbi搜索。实现空间相关性变换的关键是最优变换矩阵的计算,提出了两种相应的算法。实验结果表明:该方法在说话人无关识别系统上取得了比自适应方法更好的性能,同时该方法与自适应方法结合应用可进一步提高系统性能。相似文献

18.

用于语音识别的鲁棒自适应麦克风阵列算法 总被引：1，自引：0，他引：1

赵贤宇王作英《清华大学学报(自然科学版)》2004,44(10):1433-1436

对现实环境中存在的混响以及非平稳干扰语音信源等因素导致的算法性能下降,提出了一种用于语音识别的鲁棒旁瓣对消算法。讨论了旁瓣对消算法在自适应麦克风阵列中的应用,分析了算法在不同的混响条件下、不同的干扰源的噪声抑制能力。该算法通过分帧处理将输入信号划分为一系列短时平稳的信号片段。根据当前帧的信噪比决定自适应滤波器的权系数更新方式。采用一定的范数约束来限制自适应滤波器权系数的误调整。实验结果表明该麦克风阵列在混响的现实环境中能够有效抑制平稳噪声源和交叠谈话背景干扰,提高了语音识别器的抗噪性能。相似文献

19.

改进的智能机器人语音识别方法(英文)

张毅李艳花刘全杰杨红梅曾莉《重庆邮电学院学报(自然科学版)》2009,(6)

作为一种人机信息交互技术,语音识别技术得到了广泛的应用。介绍了基于凌阳十六位单片机SPCE061A的语音识别系统,并且采用了以传统的线性预测倒谱系数(LPCC)与分形维数相结合的混合参数作为特征参数的语音识别方法。LPCC方法是体现说话人特定的声道共振特性的线性预测方法,而分形维数则可以定量的描述语音气流中的非线性混沌特征。实验结果表明,基于LPCC与分形维数混合参数的语音识别方法要比单一的LPCC参数语音识别方法识别效果好。相似文献

20.

基于DTW改进算法的孤立词语音识别仿真

刘静王儒曲金玉李东荣《山东理工大学学报：自然科学版》2013,(1):63-66

为提高识别率和识别效率,采用双门限过零率和短时能量作为端点检测的依据,提取Mel频率倒谱系数作为语音特征参数,并使用DTW算法进行模式匹配．由于传统DTW算法计算量大,所以采用局部路径约束和区域约束进行改进,并用Matlab对改进后的DTW算法进行了仿真．实验证明该算法对孤立词语音识别能够达到较好的识别结果．相似文献