排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
训练数据和测试数据之间由于信道等差异而引起的不匹配会严重影响语种识别的性能。而在实际应用中,通常只能获得少量的和测试数据匹配的标注数据(目标域数据),以及大量的和测试数据不匹配的标注数据(源域数据)。该文利用迁移学习的方法,通过无监督迁移分量分析(unsupervised transfer component analysis,UTCA),可以合理利用上述两种数据寻找到一个低维子空间,在该空间中,源数据和目标数据之间的分布差异最小,而且数据中有利于分类的属性得以保留,从而提高系统识别性能。实验表明:相对于基线系统,该算法对30s和10s语音的识别性能分别有24.7%和8%的提高。 相似文献
2.
基于听感知特征的语种识别 总被引:3,自引:0,他引:3
为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反置等响度曲线模拟人耳对信号不同频率成分的主观响度感受。在基本听感知特征的基础上,还提出了一、二阶差分特征和偏移差分特征用于语种识别。对比实验表明,该文所提的听感知特征性能均优于目前普遍使用的Mel频率倒谱系数(MFCC)特征及其衍生特征。 相似文献
3.
4.
基于鉴别性向量空间模型的语种识别 总被引:1,自引:0,他引:1
传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性向量空间模型(D-VSMs)建模方法。D-VSMs能够自动过滤训练集中信息重叠的数据,使得每一个支持向量机的训练数据都有针对性,从而用较少的训练数据能取得较好的分类效果。在美国国家标准技术局(NIST)2009年语种识别测试中,D-VSMs只用了原训练数据的25%,计算量是传统并行音素识别器后接向量空间模型(PPRVSM)的10%,等错误率在30s、10s和3s的测试条件下分别比传统PPRVSM下降了12.75%、15.89%以及7.33%。 相似文献
5.
国内某厂通过铌微合金化和控冷工艺开发试制HRB500E高强度抗震钢筋,采用金相显微镜、维氏硬度计、闪光焊接、疲劳试验机及力学性能测试,对HRB500E钢筋焊接样力学性能、HV5硬度、金相显微组织、焊接接头强度及疲劳强度进行了试验研究。结果表明:焊接前后焊件和母材强度变化小于5 MPa,强度变化不大,焊件拉伸断口远离焊缝,为延性断口,焊接性能良好;在焊接热循环作用下,焊接接头焊缝、热影响粗晶区、热影响细晶区的表层和芯部经历奥氏体化后再结晶,其组织和硬度变化不大;混晶区至母材表层和芯部则经历不完全奥氏体化后的再结晶,母材芯部组织为F+P+B、表层组织为S,表层硬度HV5高于芯部硬度30 HV5,其组织和硬度变化较大;焊接接头的抗拉断负荷从焊缝到混晶区逐渐减小,焊缝和热影响粗晶区的抗拉断负荷比母材的高;采用国际焊接学会推荐的FAT75疲劳设计曲线对钢筋焊接接头疲劳强度设计是安全的。 相似文献
6.
张卫强 《中国新技术新产品精选》2009,(17):189-189
针对当前居住区公园绿地规划设计中存在的单一配置模式问题,分析了复合式公园绿地植物设计目标,阐述了复合式公园绿地植物层次构成,并相应地提出了满足生态、景观和生物多样性的复合式公园绿地植物配置设计模式。 相似文献
7.
针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。 相似文献
8.
基于鉴别性i-vector局部距离保持映射的说话人识别 总被引:1,自引:0,他引:1
为了进一步提高i-vector说话人识别系统的性能,该文提出了一种鉴别性i-vector局部距离保持映射(discriminant i-vector local distance preserving projection,DIVLDPP)的流形学习算法。该算法以i-vector间的Euclid距离作为度量准则,并以最小化同类点间距离同时最大化异类近邻点间距离的鉴别性准则作为优化目标函数,利用求解广义特征值的方法,得到最终的投影映射矩阵。在美国国家标准技术局2008年说话人识别核心数据集上的实验结果表明:该算法可以明显提高目前i-vector说话人识别系统的性能。 相似文献
9.
为了提高哼唱检索旋律匹配的速度和精度,提出了一种基于帧-音符方式的匹配算法。该算法针对旋律曲线的形状特点,采用基频序列表示哼唱片段,采用音符序列表示模板片段,根据累积权重估计基频跳变点位置,然后计算哼唱片段和模板片段之间的编辑距离。在MIREX08数据库上进行的实验结果表明:该算法检索时间为动态时间规整算法的0.013倍;与动态时间规整算法结果进行融合,最终平均排序倒数精度指标可以达到91.2%。 相似文献
10.
提出一种基于四阶统计量一维切片的LMS算法,并且给出其递推形式.该算法能够有效地抑制相关高斯噪声的影响,性能优于传统的基于相关的LMS算法;递推形式降低了其计算复杂度,能够满足实时处理的要求.采用相关高斯色噪声进行数值仿真,结果表明该方法的有效性.该算法可在雷达、声纳及通信系统中用于多径系数估计. 相似文献