排序方式: 共有43条查询结果,搜索用时 15 毫秒
11.
哼唱识别是音频检索的一个重要应用,其难点是音频歌曲数据的非结构性以及搜索速度和准确率平衡的问题。该文提出了新的数据库构造方法,将音频歌曲集用手工标注方法提取主旋律并且按自然演唱停顿方式进行分段,采用段落结构而不是整首歌作为索引。同时,提出了一种基于VP树的搜索结构以及相应的多级搜索算法,在快速匹配层采用粗搜索算法,在精确匹配层采用基于动态时间规整算法。实验证明,在对检出率影响不大的前提下,识别速度提高了40%以上。 相似文献
12.
基于幅度差平方和函数的基音周期提取算法 总被引:10,自引:0,他引:10
为了在任意采样率下都可以高效、准确地进行基音周期提取,提出基于归一化幅度差平方和函数的基音周期提取算法。导出高效计算幅度差平方和函数的方法,时间复杂度是O(N lbN),给出该函数的归一化定义。归一化幅度差平方和函数的取值反映语音信号的非周期性程度,由此定义了基音周期的状态损失函数和转移损失函数,从而能在后处理过程中利用V iterb i算法,确定最优的基音周期序列。实验结果表明:与通用基音提取算法相比,在保证实时性的基础上错误率降低了9.31%,证明使用该算法提高了基音周期提取的准确率。 相似文献
13.
口语对话系统中的词类概率模型和知识表示 总被引:1,自引:0,他引:1
语言分析和知识库管理是口语理解与对话系统的两个重要组成部分 ,作者在这两方面提出了一些新的方法。一是提出并实现了词类概率模型 ,它具有较高的性能和较低的时间复杂度 ,是基于句法规则的语义分析和语言理解的基础。此外还提出了与数据无关的多叉树层次结构模型的知识表示方法 ,它具有很强的表达能力并易于扩展。在此基础上 ,实现了一个用以提供清华大学地理、办公、商业及其它一些相关信息检索、基于文本的口语对话系统 Easy Nav。实验表明 ,上述模型和方法具有很好的性能 相似文献
14.
针对关键词检出中的置信度可靠性问题,提出了一种基于N-Best候选路径的置信度方法,根据比较候选路径上关键词边界内不匹配帧所占的比例大小,对N-Best的结果进行加权.该方法不但利用了词图搜索上N-Best候选的似然分,而且突出了每条路径中局部匹配的置信度,在上下文相关的中文关键词检出系统上,通过重庆口音普通话数据库的... 相似文献
15.
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。 相似文献
16.
基于小数据量的方言普通话语音识别声学建模 总被引:1,自引:0,他引:1
为在少量数据情况下显著提高方言普通话的识别率,针对标准普通话和方言普通话之间发音差异是连续变化的特点,在少量方言普通话的基础上,提出了基于距离度量的识别基元扩展方法,并将扩展基元与状态相关的基于基元的模型归并方法相结合.采用1 h的上海普通话数据作为开发集,用本方法,使音节错误率降低了17.3%. 另外与自适应方法的结合使用,还可以将音节错误率再降低6.6%, 这比单纯应用自适应方法错误率多降低了5.4%. 相似文献
17.
基于拼音索引的中文模糊匹配算法 总被引:3,自引:0,他引:3
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。 相似文献
18.
意见目标抽取是自然语言处理领域中意见挖掘研究的重要环节。该文提出了一种基于泛化、繁殖和自举的意见目标抽取方法,在泛化过程中提炼原子意见目标和意见目标模式,在繁殖过程中对复合意见目标进行扩展,并采取自举机制实现了意见目标的递增学习。实验结果显示,经过第一轮自举过程后,该方法的F-1 score指标超出基线方法0.078;自举过程完成后,F-1 score指标提高了0.112。这说明,泛化处理对意见目标充分繁殖意义重大,自举过程则有助于充分发挥泛化能力和繁殖能力。 相似文献
19.
浙江乌岩岭7种林分土壤碳密度及碳氮比分布特征 总被引:1,自引:0,他引:1
【目的】探究浙江乌岩岭自然保护区7种林分(松林、杉木林、柳杉林、阔叶林、混交林、竹林、茶园)土壤的总碳(TC)密度、有机碳(SOC)密度及土壤碳氮比(C/N)的分布特征,为提高土壤碳库管理水平提供参考。【方法】用TOC-LCPH总有机碳分析仪测定了该区7种林分土壤TC与SOC含量,核算相应的土壤碳密度及C/N,并分析土壤TC密度、SOC密度及C/N与部分土壤理化参数的关系。【结果】乌岩岭自然保护区各林分0~40 cm土层SOC密度为84.53~183.26 t/hm2,平均值为118.06 t/hm2,以杉木林最高。除杉木林0~10 cm土层C/N高于25外,其余土层及其他林分土壤C/N为8.32~21.88。乌岩岭自然保护区各土层TC密度、SOC密度及C/N在7种林分间均无显著性差异(P>0.05)。土壤TC密度及C/N都呈现出随土层深度增加而减少的规律,具有明显的表聚特征,不同土层间差异显著(P<0.05)。土壤TC密度、SOC密度与土壤速效钾(AK)含量之间存在显著正相关(P<0.05),土壤C/N与土壤有效钾(AK)含量间存在极显著正相关(P<0.01)。【结论】乌岩岭自然保护区土壤AK含量可作为土壤TC密度、SOC密度及C/N共同的重要指示因子。 相似文献
20.
随着半导体技术进步,众核处理器已广泛应用于高性能计算领域.近年来,在国家"863"计划、"核高基"重大专项等项目的支持下,我国高性能众核CPU的研发水平也取得了长足进步.本文介绍一种面向高性能计算的国产片上异构众核处理器结构,通过统一指令系统、统一执行模型和支持一致性的主存共享,实现异构核心的深度融合.本文主要介绍了该处理器面向"存储墙"、"功耗墙"和"可靠性墙"的优化技术体系.该处理器已完成集成了256个运算核心和4个管理核心的原型芯片设计,峰值性能超过1 TFlops. 相似文献