首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于云南境内说话人母语为纳西语、僳僳语的汉语普通话语音,采用隐马尔可夫模型(HMM),由标准普通话语音库训练得到基线系统的声学模型(HMMSTD).然后以基线系统的声学模型为初始模型,分别用母语为纳西语、傈僳语的汉语普通话语音训练得到各自的声学模型(HMMNX和HMMLS),对于未知语音,根据各识别系统的概率得分。采用最大概率准则进行口音的分类判决.实验表明,基于HMM的口音识别系统,其正确识别率达93%。  相似文献   

2.
说话人识别的参量研究和语音库建设   总被引:4,自引:0,他引:4  
本文对说话人识别中的几个基本问题进行了研究。语音参量是说话人识别的基础,用矢量量化方法,使用自建的语音库中的材料,研究了说话人识别中的各种参量的效果。实验表明,所采用的参量中,一种混合参量MC最好,倒谱系数CE次之。  相似文献   

3.
在说话人识别系统中,训练语音与测试语音的话机类型失配会使说话人识别系统识别性能显著下降。为了提高说话人识别系统的稳健性,在说话人模型合成和话机归一化的基础上提出一种新的信道补偿方法HNSSM(handsetnormalizationinsynthesizedspeakmodel),综合模型和分数两个方面对系统进行信道补偿。1999年美国国家标准技术局说话人识别评测语音库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4%和20.9%,而且优于只采用说话人模型合成或话机归一化补偿的系统。  相似文献   

4.
基于大学生的汉语说话人识别语音库设计   总被引:3,自引:0,他引:3  
本文设计了一个基于在校大学生的说话人识别语音库UMSD,其目的主要是用于研究说活人个体特征变迁、文本有关和文本无关的说活人识别。该语音库包含24名说话人的12期录音,相邻录音间隔从1天到60天不等,在同一间安静的办公室环境下录制完成。录制语料包括:孤立数码,数码串,长度从1到10的词句,汉语拼音表,古诗词和短文。为了便于提取感兴趣的音段,本文还基于Matlab和Ms—Access设计了相应的语音库管理系统。  相似文献   

5.
主要对文本无关的说话人识别技术进行一些探讨。与语音识别不同,说话人识别技术必须提取说话人依赖特点,而语音特征量的选取是利用说话人声音的频谱通过分离傅立叶变换(DCT)获得的。在训练阶段,每一个说话者通过矢量量化产生一个码书(语音数据库)。在认识阶段期间,通过对欧几里德距离代表VQ的计算来减少失真。在一定范围的说话人的语音库中,测试结果表明有很高的识别率,可以达到96%。  相似文献   

6.
在借鉴和改进了一种新的语种辨识方法———基于高斯混合模型(GMM)符号化和语言模型方法———的基础上,建立了一个汉语方言自动辨识系统.实验使用了一个多说话人、非特定文本、连续语音汉语方言语音库进行系统测试.在3种主要汉语方言的辨识中,15 s语料测试平均辨识率达到了90.7%.  相似文献   

7.
一种量子神经网络说话人识别方法   总被引:1,自引:1,他引:1       下载免费PDF全文
针对说话人语音特征空间边界存在模糊性的特点,构建了一种量子神经网络识别分类器,用于说话人识别,以改善存在交叉数据的语音特征参数的分类效果。提出了一种基于人工免疫算法的量子间隔训练方法,以改善传统量子神经网络训练算法的不足。以TIMIT语音库为测试语音,与传统BP网络和基于常规梯度下降量子间隔训练算法的量子神经网络做对比实验。实验证明,算法能有效提高说话人识别系统的识别率,同时与高斯混合模型相比,具有更好的抗噪声性能。  相似文献   

8.
为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。  相似文献   

9.
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。  相似文献   

10.
基于VQ的说话人识别系统的实现   总被引:1,自引:0,他引:1  
王吉林 《高等职业教育》2004,13(6):39-42,48
系统以语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,运用矢量量化(VQ)技术实现了与文本有关的说话人识别。在一个10人,1800个语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。系统用于实时识别也收到了较好的效果。  相似文献   

11.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

12.
首先,建立基于方音的二语发音数据库,并分析发音数据的音韵特征;然后,基于隐马尔可夫理论,提出了一种识别特定方音背景的外语学习者的语音产出的可行性方案.性能试验显示,系统可以较为准确地自动识别出以河南方音为背景的学习者的外语语音产出,并形成诊断性评价,进而提升其外语语音水平.  相似文献   

13.
以汉语为研究对象,提出构建大规模高质量汉语复述平行语料的方法.基于翻译引擎进行复述数据增强,将英语复述平行语料迁移到汉语中,同时人工构建汉语复述评测数据集.基于构建的汉语复述数据,在复述识别和自然语言推理任务中验证复述数据构建及其应用方法的有效性.首先基于复述语料生成复述识别数据集,预训练基于注意力机制的神经网络句子匹...  相似文献   

14.
基于卷积神经网络的连续语音识别   总被引:3,自引:0,他引:3  
在语音识别中,卷积神经网络( convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络( deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸。本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别性能的影响情况,并与目前广泛使用的深层神经网络模型进行了对比。在标准语音识别库TIMIT以及大词表非特定人电话自然口语对话数据库上的实验结果证明,相比传统深层神经网络模型,卷积神经网络明显降低模型规模的同时,识别性能更好,且泛化能力更强。  相似文献   

15.
近年来,神经网络语言模型的研究越来越受到学术界的广泛关注.基于长短期记忆(long short-term memory,LSTM)结构的深度神经网络(LSTM-deep neural network,LSTM-DNN)语言模型成为当前的研究热点.在电话交谈语音识别系统中,语料本身具有一定的上下文相关性,而传统的语言模型对历史信息记忆能力有限,无法充分学习语料的相关性.针对这一问题,基于LSTM-DNN语言模型在充分学习电话交谈语料相关性的基础上,将其应用于语音识别系统的重评估过程,并将这一方法与基于高元语言模型、前向神经网络(feed forward neural network,FFNN)以及递归神经网络(recurrent neural network,RNN)语言模型的重评估方法进行对比.实验结果表明,LSTM-DNN语言模型在重评估方法中具有最优性能,与一遍解码结果相比,在中文测试集上字错误率平均下降4.1%.  相似文献   

16.
语音听写机中语音、语言模型是两个非常重要的部分,而语音模型的好坏直接影响语言模型和听写机的性能。文中在一个大型数据库上对语音识别基元、语音模型、模型的输出观察向量的计分方法进行了大量的比较实验。实验表明,采取以音节为识别基元、基于中心距离正态分布的中心距离连续概率模型,和基于最近邻原则的输出观察向量计分方法即嵌入式多模板方案,可以取得很好的识别效果。  相似文献   

17.
以双向长短期记忆网络(Bi-LSTM)为核心,结合多层卷积神经网络以及单向长短期记忆网络构建了多层面隐喻识别模型.基于多特征协同作用的思想,利用依存关系特征、语义特征、词性特征等多特征融合输入方法,丰富了模型的学习信息.为降低信息干扰,利用基于统计学的规范化文本输入方法提升模型识别效果.在英文语料词层面和句层面实验中,各个特征均表现出明显的正向作用.裁剪和填充处理及多特征协调作用在英文语料词层面研究中使F_1值分别提升2.5%和5.1%,在句层面研究中F_1值分别提升3.1%和1.9%.在中文语料句层面实验中,最优效果的F_1值可达88.8%.  相似文献   

18.
阿尔茨海默病DT-MRI脑图像的识别   总被引:2,自引:0,他引:2  
利用脑部的扩散张量磁共振图像(d iffus ion tensorm agnetic resonance im ag ing,DT-M R I),探索对阿尔茨海默病计算机辅助诊断方法,提出了一种线性识别方法。对9例阿尔茨海默病患者和9例正常人脑部在1.5 T磁共振成像系统上作DT-M R I扫描。测量胼胝体膝部、胼胝体压部和海马的表观扩散系数和各向异性分数。对这些参数进行了统计,以训练识别器。用留一法估算,得到识别正确率为83.33%。结果表明,DT-M R I图像可以反映阿尔茨海默患者脑部的受损情况,该识别方法能为阿尔茨海默病的临床诊断提供帮助。  相似文献   

19.
针对利用远程监督标注文本实体过程中存在实体类别标注错误问题导致模型难以有效区分各实体的类别特征,影响模型精准度的问题,本文提出一种利用原型网络过滤训练语料中标注错误样本的远程监督命名实体识别方法,利用预训练的原型网络编码正确标注实体生成类别原型表示,过滤语料中距类别原型较远的样本.实验表明,使用原型网络有效地提高了语料的标注质量,提升了模型性能.  相似文献   

20.
篇章级句间关系分析包括语义单元的切分和各个单元之间的语义关系识别.已有的研究主要面向英文,到目前为止,尚无可用的中文篇章级句间关系自动分析系统发布.在中文篇章关系语料库的基础上,首次实现面向中文的篇章级句间关系自动分析系统,包括语义单元切分、连词识别、显式语义关系识别以及隐式语义关系识别等.实验结果显示:该系统在显式句间关系识别上F-score为89.8;,隐式句间关系识别上F-score为55.5;.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号