首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 468 毫秒
1.
目前,音乐自动标注模型大多采用手动设计模式,因而存在最佳特征难以选择的问题。提出了一种基于非监督学习的特征学习算法,该算法能自动学习特征的潜在结构而不需要依赖先验知识。首先,预处理阶段主要提取音乐的音级轮廓频率谱并进行PCA白化降维处理;然后,采用深度学习中的降噪自动编码器算法对降维后的特征进行无监督的学习,并采用最大值池化和取均值来聚合得到新的特征向量;最后,将特征向量和标签送入多层感知机中进行有监督的学习。基于Magnatagatune和GTZAN数据库的实验结果表明,本文算法在一定程度上提高了音乐自动标注的准确率。  相似文献   

2.
文章从实验语音学角度对藏语拉萨话元音的声学特征进行了简略探析.主要包括拉萨话五个主要元音(a、i、u、e、o)的共振峰频率、基频时长、声学元音图的数据分析.结果显示:1相对于男生而言,女生在发音时开口度较大,舌头位置较靠后,并且圆唇度也比较高;2从时长平均值来看,元音i的发音时长最长,u则最短.原因跟舌头位置的前后有关;3五个主要元音的开口度与F1呈现出正相关性,表现为a的开口度最大,接着是o、e,i的开口度最小.各元音的圆唇度与F2负相关,即圆唇度随F2的降低而增大,而圆唇度也随着舌位的后移而逐渐提高,表现为a的唇形最圆,舌位最靠后,i则相反.  相似文献   

3.
针对固态硬盘SMART数据包含大量高维数据特征导致故障检测准确率不理想的问题,结合固态硬盘SMART数据的时序特点,基于门控循环单元对传统自动编码器的结构做了改进,提出了一种基于门控循环单元稀疏自动编码器降维的固态硬盘故障检测方法(GAL)。首先利用固态硬盘SMART数据训练GRUAE模型,然后利用GRUAE模型中的编码器作为降维的工具,对固态硬盘的原始高维SMART数据进行降维,减少固态硬盘原始SAMRT数据中噪声特征的影响并突出与数据特点更加相关的特征,以提高故障检测的准确率,最后基于降维过的低维SMART数据利用长短时记忆网络进行故障检测。选取阿里巴巴固态硬盘数据集,对多种人工智能算法在准确率、召回率和F0.5方面进行了比较。实验结果表明:相比于没有采用任何降维手段,采用GAL方法可使两种闪存类型的固态硬盘的故障检测准确率、召回率和F0.5分别提高4%、5%、4%和4%、8%、5%,分别达到97%、95%、97%和97%、96%、97%;GAL方法的故障检测准确率、召回率和F0.5分别超出WEFR对比方法53%、2...  相似文献   

4.
文章用EPG对藏语夏河话3个舌尖后音后接元音/a、、u/进行录音,通过相关软件,提取它们的AC、PC、VC、Ant、Pst、CA、CP、CC、TC、Cog参数进行分析.得出以下结论:舌尖后音发音时舌体表现为两端高,中间低的"马鞍形"特点,对应齿龈后/硬腭前的位置,舌体有抬高的动作.擦音的发音动作与塞擦音成阻时段的动作不同,擦音舌面高度低于塞擦音成阻时段的舌面高度;送气特征对塞擦音的目标腭位没有显著影响;元音不影响舌尖前音的主发音器官的动作,但是舌面高度却受到元音舌位高度的影响,后接低元音的时候舌面下降.使用EPG记录发音时舌腭接触状态能够更客观更精确地记录和描写语音,丰富和修正传统语音学的若干解释和理论.  相似文献   

5.
基于分水岭变换和主动轮廓模型的舌体轮廓图像分割   总被引:2,自引:0,他引:2  
舌体轮廓的图像分割是计算机辅助舌诊系统进行图像分析的前提条件.提出了一种基于分水岭变换和主动轮廓模型相结合的自动轮廓分割算法.采用了分水岭变换的结果作为主动轮廓模型算法的初始曲线.在分水岭变换中,通过引入标记函数和强制最小值技术解决了传统分水岭变换可能导致的过分割问题;同时,在保证分割质量的基础上,通过降采样的方法来提高分割速度.算法对678例临床舌像进行了分割,正确分割率为96.9%.  相似文献   

6.
为了提高滚动轴承故障诊断的准确率,提出一种基于主成分分析(principal component analysis,PCA)和支持向量机(support Vector machine,SVM)模型的滚动轴承故障诊断方法.通过比较不同方法计算的标准差和拉依达准则对数据进行误差分析,利用MATLAB软件中的PCA函数对数据进行主成分分析,将8个原始变量降维成3个综合变量,分别从降维前和降维后的输入属性数据中随机选取70%的数据作为训练集来建立SVM分类模型和PCA-SVM分类模型,而把剩余的30%作为测试集来对模型的性能进行仿真测试.MATLAB仿真测试的结果表明,PCA-SVM模型的分类效果更好,其预测正确率对于绝大多数故障诊断来说是可以接受的,可以作为一种故障诊断的评价标准.  相似文献   

7.
本文提出了一种面向冠心病血检数据的函数型主成分分析(FDCA)方法。首先,利用函数型数据分析(FDA)方法,对冠心病患者的血液检测指标数据进行函数化;然后,利用FPCA的方法对原始血检指标进行降维,并与传统的主成分(PCA)方法进行对比。实验结果表明,相比于传统方法,FPCA方法降维效果更好,降维后得到的新指标能够包含原始指标的绝大部分信息。该方法对于临床冠心病的诊断研究具有现实和理论意义。  相似文献   

8.
堆积降噪自动编码机是一种典型的深度学习模型,它能够刻画数据丰富的内在信息,具有较强的特征学习能力。基于主成分分析(principal component analysis,PCA)技术和堆积降噪自动编码机(stacked denoising autoen-coders,SDAE)模型,提出一种新的表情识别算法PCA+SDAE。该算法对人脸图片进行裁剪及归一化等预处理,采用主成分分析技术对人脸特征进行线性降维,再利用堆积降噪自动编码机逐层进行特征学习并同时实现对人脸表情数据的非线性降维,可以得到更好的、维度更低的表情特征,并据此进行表情分类。对PCA+SDAE算法的仿真测试实验结果表明,其综合性能比其他的基于深度学习模型的表情识别方法更好,同时与传统的非深度学习表情识别方法相比,它具有更高的表情识别正确率。  相似文献   

9.
数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高.  相似文献   

10.
文章就记音时出现的佤语马散土语中的"紧元音"进行了研究,采用声学实验的方法对a-a、ε-ε、i-i、■-■4组元音的区别特征进行了分析,证实了马散土语音点的发音人存在紧元音的例外现象,并通过共振峰的分布验证了语言学家提出的"紧元音舌位略低于松元音"的结论。  相似文献   

11.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

12.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

13.
有效提取特征有利于提高后续人体动作识别的准确率。针对人体动作识别时方向梯度直方图(histogram of oriented gradient,HOG)特征维数过高和相似动作不好区分的问题,提出一种基于特征优选和图像相似度的人体动作识别算法。实验对比三种降维方法主成分分析法(principal component analysis,PCA)、PCA+Pearson、PCA+Spearman处理后的动作识别率,证明PCA+Pearson相关系数的降维效果最佳。同时将全局特征八星模型与降维后的局部特征HOG特征组合在一起全面表征人体动作,并计算相邻两帧图像相似度,自适应分配一个判别周期内单帧支持向量机分类结果的统计权值,最后二次分类人体姿态识别结果。在标准数据集KTH上进行实验,该算法识别准确率为94. 5%,较其他方法有所提高,在视频人体动作识别领域有较好应用价值。  相似文献   

14.
结合粒子群优化算法,提出了一种对人脸进行精确检测与分割的方法,以提高表情识别的准确率。通过肤色分割得到大致的人脸轮廓;通过粒子群优化检测到人脸的精确位置。利用精确的人脸进行PCA降维和特征提取后可进行表情识别。实验结果表明,此方法很好的排除了干扰因素,提高了表情识别的准确率,尤其对于某些单表情效果极佳。  相似文献   

15.
采用语音合成方法完成了汉语人名语音库的设计.声母部分直接采用录音样本,而韵母部分则通过激励声道频率响应函数来合成语音,然后通过声韵母拼接来实现人名语音合成,以此建立人名语音库.可以实现各种可能人名语音的合成,适合应用于多种电子自助系统中.  相似文献   

16.
基于小波分析的梅尔频率倒谱参数?   总被引:1,自引:0,他引:1  
采用HMM模型和MFCC参数的语音识别器对普通话中声母音素的区分度不够理想,而在基于识别的计算机辅助发音教学系统中的辅音的识别具有特别重要的意义.考虑到相同发音位置不同发音方式的声母音素变化较快且高频信息较多,本文将小波分析的方法引入到提取梅尔频率倒谱参数(MFCC)的过程当中,来提高信号高频部分的时域分辨率,提出了基于小波分析的梅尔倒谱参数MFCC_Wavelet.结合高低频不同分帧方式的MFCC_Wavelet参数与HMM模型的语音识别器,本文测试了MFCC和MFCC_Wavelet两种参数在4类发音中的区分性,实验结果表明,在相同发音位置不同发音方式、塞音与不塞音、送气音与不送气音及擦音与不擦音4类发音错误中,MFCC_Wavelet的总体效果好于MFCC.  相似文献   

17.
为了充分利用人脸特征信息更加准确全面地描述人脸,提高现有识别算法的识别率,提出一种融合改进的加速稳健特征和子空间特征进行人脸识别的方法。利用AAM形状模型的训练方法,训练得到41个点的人脸形状模型;对每幅图像进行特征点初歩定位,找到并保留与初歩定位的特征点空间距离最近的SURF特征点。将SURF特征点描述子利用PCA降维,得到改进的SURF局部特征向量。然后利用PCA对图像进行全局特征提取,将局部特征与全局特征进行融合,组成全新的特征向量。最后通过特征向量的匹配实现识別。对包括本算法和PCA-SIFT算法在内的6种不同识别算法进行了验证。实验结果表明,提出的算法在改变ORL人脸库中训练集样本数的情况下,识别率均优于其他算法;在样本数为5的情况下比PCA-SIFT方法提高了4.3%,可见该算法提高了人脸的识别率具有较强的鲁棒性和分类性。  相似文献   

18.
针对运动捕捉获得的数据其维度通常较高,在进行运动片段分割时候需要进行大量计算,人工方法可以对运动捕获数据进行分割,准确率比较高,但是效率偏低的问题.提出KPCA结合PPCA对捕获数据进行降维处理的方法,将56维数据映射到2维空间;以及构造特征函数获得投射误差的导数,分析几何特征的变化,探测运动捕捉数据的分割点的方法,实现运动捕捉数据的自动分割.  相似文献   

19.
在语音识别系统中,易混淆语音是导致系统识别率下降的重要原因。汉语音节是由声母和韵母组成的,在易混淆语音中,其韵母部分的混淆度很大。针对易混淆语音的韵母部分,通过改进特征提取的方法来提高易混韵母之间的区分度,提出了一种基于小波分解和线性预测(WLPC)的特征提取方法,并用局部保持映射(Locality Preserving Projections)算法对提取的特征进行了特征变换。实验结果显示,与传统的MFCC特征相比,该特征能更好的区分不同的韵母。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号