首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
附加标注信息的语音数据库在语音识别研究中的作用十分重要。本介绍了我们开发的维吾尔语音数据库手工标注系统的功能及其在实现过程中采用的一些技术,并阐明了对语音数据库进行标注的重要性及切分的基本原理。  相似文献   

2.
由于传统语料标注方法耗时耗力,已经难以适应大数据语料的处理,该文提出了大数据语音语料库的社会标注策略。引入了针对语音数据标注的六元组模型,将语音资源的自身特征考虑进去,并将标签对象扩展为更为广义的标记。提出基于"兴趣+收获+报酬"的标注模式,并建立标注质量的3层检验机制。通过工程实现和应用,验证了本文方法在标注效率、质量和成本等方面都具有明显优势。同时,该标注策略可以推广到其他语料的标注,特别是对主观性较强的翻译语料和评价型语料的标注。  相似文献   

3.
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据.  相似文献   

4.
语音语料库的设计研究   总被引:3,自引:0,他引:3  
本文结合一般语料库的建设方法和实地的语言调查,总结出了语音语料库建立的一般步骤,主要包括以下四个主要过程:发音文本的设计;录音及整理过程;语音标注过程;数据库系统和数据库管理系统的建立。  相似文献   

5.
杜璞 《科技咨询导报》2009,(24):172-172
本文简要介绍了中文信息处理的主流技术,着重介绍了中文信息处理中的N元模型、语音识别、词性标注和句法分析技术。  相似文献   

6.
刘继明  孙成  袁野 《科学技术与工程》2021,21(18):7635-7641
为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果 表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53%,即可为增强事件实体信息抽取提供实践意义.  相似文献   

7.
建立了一个兰州方言语料库.利用<方言调查字表>设计了兰州方言的文本语料,包括1 280个单字,2 000个双字词,18个负载句和1 000句语句,录制了4位发音人的兰州方言和普通话平行的语音语料,并标注了音节边界、峰值点、声韵母和声调信息;对于语句,根据词法信息和语法信息,利用TBL算法标注了韵律边界.语料库可用于兰州方言的实验语音学研究以及兰州方言的韵律建模、语音合成、语音转换的研究.  相似文献   

8.
藏语语音合成中语料数据标注规则的设计   总被引:1,自引:0,他引:1  
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。  相似文献   

9.
韵律标注是藏语语音合成语料库建设的重要环节.文章参考汉语韵律标注的研究成果,结合藏语自身的语音特点以及韵律特征,进行了面向藏语语音合成语料库的韵律标注研究,并设计一套包含拉丁转写、声调类型、音节结构、重音类型以及停顿指数的标注规则,为藏语语音韵律特征的研究提供了直观的、科学的方法.  相似文献   

10.
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能.  相似文献   

11.
面向情感变化检测的汉语情感语音数据库   总被引:3,自引:0,他引:3  
该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中。对该数据库进行主观评价和情感变化检测的结果表明:语音情感状态自然、情感变化真实,能够满足语音情感识别和语音情感变化检测研究的双重需求。  相似文献   

12.
为了提取一个类标区别于其他类标的本质特征,增强类标数据集的可解释性,提出了一种面向主属性值的类标特征分析方法.该方法首先建立了一种直观的面向主属性值的类标特征模型,然后设计了对应的类标特征抽取算法,最后给出了一种基于类标特征分析的分类算法.实验结果表明:所建立的类标特征模型能够直观、有效地描述类标数据集中各类标的特征,给出的类标特征抽取算法有较高的执行性能,提出的分类算法在针对类标较少的数据集时有较高的分类准确率.  相似文献   

13.
目前,域外转基因生物标识立法存在自愿标识和强制标识两种类型,我国立法属于后者.我国已建立起转基因生物标识的规范体系,但需要从扩大转基因生物物种的标识区间,细化转基因生物标识的准确度,加强转基因生物负标识使用规范,以及健全转基因生物标识管理体系等角度予以进一步完善.  相似文献   

14.
针对多标签分类问题,提出了一种面向样本不均衡及类属不确定性的多标签分类算法。首先,结合“一对一”分解策略和贝叶斯理论,将多标签数据集分解为单标签数据子集,并利用Parzen窗方法估计子集样本后验概率,对类标签进行了基于概率的不确定性表示。然后,在融合概率类标签和LS-SVM模型的基础上,利用样本差异信息来调节惩罚参数值,建立了考虑样本不均衡的概率LS-SVM子分类器模型。依据正态分布的3σ原理,设计了子分类器决策阈值确定方法。最后,结合实例对算法进行了性能分析,结果证明了新算法的合理性和有效性。  相似文献   

15.
为帮助学习者从大量在线学资源中找到适合自身个性化的学习资源及顺序集合,提出一种基于有向边方向权值的标签传播算法(LPADEW)用于发现适合特定学习者并属于同一学习周期的微学习单元序列簇群。该算法对标签传播算法进行两个改进:根据单元节点的利用度确定标签的更新顺序,降低在节点更新顺序上的随机性;利用当前单元节点的前置邻居和后置邻居的有向边权累加值进行标签更新,并将标签权重引入标签更新策略,既可降低标签更新的随机性,也可避免形成巨型簇群。实验结果表明,LPADEW算法在微学习真实数据集和人工数据集中均取得了较好的结果。  相似文献   

16.
针对ML-GCN中标签共现嵌入维度过高影响模型分类性能和ML-GCN中没有充分发掘标签之间不对称关系的问题,提出一种基于图注意力网络的多标签图像分类模型ML-GAT;ML-GAT模型首先对高维标签语义嵌入矩阵进行降维;然后通过降维后的低维标签语义嵌入表示和标签类别共现图得到标签共现嵌入;与此同时ML-GAT将多标签原始...  相似文献   

17.
绿色产品与绿色标志   总被引:3,自引:0,他引:3  
根据绿色产品及绿色标志的要求与发展,给出了绿色产品的定义和特征,阐明了绿色标志的意义及认证原则,并分析了绿色产品与绿色标志之间的关系,指出绿色标志是绿色产品健康有序发展的保证  相似文献   

18.
一种草莓新鲜度指示标签的研究与设计   总被引:1,自引:0,他引:1  
该文对草莓采后生理特性进行了分析,设计了一种以红萝卜色素溶液作为pH敏感剂的水果新鲜度智能指示标签,主要由pH敏感剂涂层、pH敏感剂载体和透明基材这三部分组成,在包装使用过程中完全避免了指示剂的安全性、迁移性对水果造成污染的问题。基于指示标签的显色理论,详细分析了在草莓成熟和过熟阶段内指示标签的颜色变化情况。  相似文献   

19.
本文介绍一种用于话音内插系统(Speech Interpolation System)的高灵敏度话音检测器,并用该检测器进行了各种话音瞬态参数的统计分析。该话音检测器通过分析输入信号的短时能量和零交叉率等检测话音信号,采用自适应电平门限和释放延迟等措施提高了话音检测器的灵敏度和可靠性。同时,这种方案对于线路中的信令信息有较强的识别能力。采用本话音检测器对话音信号所做的统计分析不仅得到了具有一定价值的汉语活动规律,而且进一步完善了检测方案。同时,通过汉语和英语话音活动规律的比较表明汉语应用话音内插技术的效果要优于英语。  相似文献   

20.
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号