共查询到20条相似文献,搜索用时 93 毫秒
1.
此设计旨在完成语音数据库系统的语音标注工作,定义了标注件的格式和标注系统的主要功能。 相似文献
2.
3.
由于传统语料标注方法耗时耗力,已经难以适应大数据语料的处理,该文提出了大数据语音语料库的社会标注策略。引入了针对语音数据标注的六元组模型,将语音资源的自身特征考虑进去,并将标签对象扩展为更为广义的标记。提出基于"兴趣+收获+报酬"的标注模式,并建立标注质量的3层检验机制。通过工程实现和应用,验证了本文方法在标注效率、质量和成本等方面都具有明显优势。同时,该标注策略可以推广到其他语料的标注,特别是对主观性较强的翻译语料和评价型语料的标注。 相似文献
4.
李鑫 《新疆师范大学学报(自然科学版)》2007,26(3):126-128
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能. 相似文献
5.
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据. 相似文献
6.
本文简要介绍了中文信息处理的主流技术,着重介绍了中文信息处理中的N元模型、语音识别、词性标注和句法分析技术。 相似文献
7.
为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果 表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53%,即可为增强事件实体信息抽取提供实践意义. 相似文献
8.
建立了一个兰州方言语料库.利用<方言调查字表>设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究. 相似文献
9.
面向情感变化检测的汉语情感语音数据库 总被引:3,自引:0,他引:3
该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中。对该数据库进行主观评价和情感变化检测的结果表明:语音情感状态自然、情感变化真实,能够满足语音情感识别和语音情感变化检测研究的双重需求。 相似文献
10.
为了能更好地反映图像标注之间的关系,将叙词查询的概念引人到传统的基于查询的图像标注领域,通过已标注图像的关键词建立标注之间的关系,从而构建了基于叙词查询的图像自动标注方法.最后在Corel图像数据库中对所提出方法的有效性进行了验证. 相似文献
11.
大多数环境声是不和谐的,比语声和乐声更加不平稳。针对传统时频分析的不足,提出一种基于听觉感知的环境声特征提取方法。针对研究的小样本问题,采用支持向量机(Support Vector Machine,SVM)作为分类算法,对环境声进行分类。仿真结果表明所用特征及方法是有效的。 相似文献
12.
《云南民族大学学报(自然科学版)》2019,(2)
端点检测是语音信号处理的过程中非常重要的一个环节,其准确性直接影响语音信号处理的速度和结果.特别是在实际应用中因信噪比较低,使得某些高信噪比下性能好的端点检测算法准确率也比较低.为了提高在低信噪比的环境下佤语语音端点检测的准确率,本文使用了一种基于多窗谱估计谱减法和能熵比法的语音端点检测复合算法.该算法首先利用多窗谱估计谱减法去除语音的背景噪音以提高信噪比;其次再对去噪后的语音使用能熵比算法进行端点检测;最后借助Matlab工具对佤语语音进行仿真实验.仿真结果表明:对于低信噪比的环境下的佤语语音,本文使用的基于多窗谱估计谱减法和能熵比法复合算法同常规能熵比算法相比,端点检测的准确率提高了34%. 相似文献
13.
提出了一种以8031单片机为核心的语音存储与回放系统,介绍了系统的组成及软、硬件设计方法。该系统结构紧凑,具有灵活的录音、放音功能;语音音量自动控制功能。采用体选RAM的方法,扩大了存储空间,使语音存储时间可以达到十几秒。结果表明,在音频信号频率为300Hz至3400Hz范围内,系统噪声小,语音回放效果良好。 相似文献
14.
顾秀玲 《大庆师范学院学报》2005,25(1):98-99
学生在学习英语语音时遇到了很多困惑:“加音”;“吞音”;单词重读定位不准确;语调使用不当;腔不正音 不圆;缺少节奏和语流等。这些困惑导致学生对语音学习产生为难情绪,为以后的听说读写等言语实践能力的培 养种下暗疾,更是学习标准英语的拦路虎。本文对上述困惑进行了分析,并给出了解决的方法和对策。 相似文献
15.
陈雪勤 《苏州大学学报(医学版)》2002,18(1):55-58
运用了一种较为有效的清、浊音判决方法以及基音平滑方法来提高基音检测的准确性 .减小了基音周期不规则的不平稳语音段基音估计的误差 ,改善了在低速率的基础上合成语音的质量 相似文献
16.
提出了一种基于蓝牙技术和单片机技术的无线心音、呼吸音监护系统.经过临床试用,证明了医务人员不用直接接触病人就可及时获得病人准确的心音、呼吸音信息,有效地避免医务人员和病人的交叉感染.本系统尤其适用于烈性传染病人的心音和呼吸音的监护,具有较高的临床实用价值和社会价值. 相似文献
17.
朗读和说话是衡量口语表达能力的重要依据.朗读和说话都涉及普通话节律.进行科学的语音评价,必须重视语言的节律层面.为更好地推行、贯彻2003年教育部、国家语委颁布的新测试大纲,测评研究应重视节律问题. 相似文献
18.
基于盲分离技术的肺音信号中心音干扰的去除 总被引:3,自引:0,他引:3
在分析去除肺音信号中心音干扰重要性和目前几种分离方法局限性的基础上,利用二者之间的相对独立性,首次将盲分离技术应用于分离肺音信号中的心音干扰,实验结果显示,本方法能有效地分离肺、心音混合信号,得到更加干净的肺音信号。 相似文献
19.
文章通过采用两种方法对藏语语音合成语料库中的语音进行音素切分:一种是基于单音素HMM模型的自动切分方法,一种是传统的人工切分方法,并通过实验分析了自动切分与人工切分方法的准确率程度.实验结果表明:在构建语料库时,前者有助于缩短建库周期,尤其对于大语料库的建立会有明显的优势.这种方法既节省了切分与标注的大量时间和人力成本,又提高了语音语料库标注信息的精确度和一致性. 相似文献
20.
王娅 《重庆三峡学院学报》2003,19(6):59-60
在一些声乐初学者中,常由于不科学的技术训练、不良的听觉习惯和错误的审美观,导致出现一些发声毛病,特别是像喉音、鼻音、白声等最为常见,本文通过对形成错误发声原因的分析,提出解决方法,以便歌者能更好的学习歌唱。 相似文献