首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
说话人性别识别是语音识别研究中的一个重要分支.通过说话人的语音识别作为说话人性别识别的预分类技术可以降低研究问题的复杂度,提高系统的准确率.文中首先从建立的藏语语音性别库入手,提取语音的特征参数MFCC,进而利用SVM进行训练和识别.实验结果表明:用于说话人识别的MFCC特征能有效地用于藏语说话人性别识别,且与SVM联...  相似文献   

2.
为了有效提取高光谱图像的空间和光谱维特征,获得准确率和分类效率俱佳的方法,利用52个不同方向和频率的3-D Gabor滤波器提取图像的纹理特征,结合梯度优化决策树分类器(GBDT)完成高光谱图像分类.结果表明3-D Gabor+GBDT方法的分类准确率高于CNN算法、Gabor以及EMAP为纹理特征的方法,且高于CNN和以SVM为分类器的方法.虽然3-D Gabor+GBDT建模训练时间长,但是该方法在保持高准确率的前提下,分类效率依然较高,适合大规模高光谱图像的在线分类场景.  相似文献   

3.
建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。  相似文献   

4.
采用提取图像的纹理、几何特征并利用支持向量机(support vector machine, SVM)进行检测和识别的方法,对宝山钢铁现有的连铸坯表面裂纹、凹陷、夹杂物、气孔、划痕等缺陷进行分析,缺陷检测准确率为83%.提出一种基于卷积神经网络(convolutional neural network,CNN)的方法进行缺陷检测.该方法对裂纹缺陷的检测准确率为93%,对其他缺陷(由于凹陷、夹杂物、气孔、划痕等缺陷数据较少,这些缺陷归为一类)的检测准确率为88%.实验结果表明,采用深度学习的方法能够有效检测、识别出具有缺陷的连铸坯,检测准确率较高.  相似文献   

5.
支持向量机(support vector machine,SVM)是分类算法中集高效性、准确率和实时性于一体的分类方案。但由于在SVM分类决策的过程中,无关的分类器也参与了投票,使得方案的实时性和分类可靠性有一定程度的降低。提出了基于相似度的高效SVM网络流量识别方案(efficient SVM based on similarity,ESVMS)。ESVMS通过估算待分类实例可能所属的类别范围,排除SVM中那些无关分类器的投票决策。实验结果表明ESVMS较SVM分类准确度几乎没有降低,但分类实时性进一步提高。  相似文献   

6.
核函数是支持向量机(SVM)的核心,直接决定着SVM的性能.为提高SVM在语音识别问题中的学习能力和泛化能力,文中提出了一种Logistic核函数,并给出了该Logistic核函数是Mercer核的理论证明.在双螺旋、语音识别问题上的实验结果表明,该Logistic核函数是有效的,其性能优于线性、多项式、径向基、指数径向基的核函数,尤其是在语音识别中,该Logistic核函数具有更好的识别性能.  相似文献   

7.
基于支持向量机的抗噪语音识别   总被引:4,自引:1,他引:3  
阐述了支持向量机的分类机理,采用改进的MFCC语音特征参数,用基于不同核函数的支持向量机(SVM)作为语识别网络,对SVM多类分类问题采用"一对一"分类算法,实现了一个孤立词非特定人中等词汇量的抗噪语音识别系统。通过实验,得到了不同核函数下的识别结果;分析了核参数和误差惩罚参数对SVM推广能力的影响,并将实验结果同基于RBF神经网络的识别结果进行了比较。  相似文献   

8.
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力.  相似文献   

9.
模糊支持向量机(FSVM)赋予每个样本一个模糊隶属度,优化了最优分类面,具有好的抗噪性。为提高低信噪比条件下的语音识别准确率,减小传统支持向量机(SVM)中噪声样本对分类精度造成的影响,首先将模糊支持向量机(FSVM)应用于语音识别系统中的识别网络。在此模型的基础上,考虑到语音样本各维特征的影响,计算各维特征的信息增益作为对分类的重要程度,依据此重要程度确定对各维特征的加权系数,构造加权核函数。为了减小一对一分类模式下的时间复杂度,引入了三叉决策树策略。在仿真实验中,采用韩语语料库的耳蜗滤波器倒谱系数(CFCC)作为实验数据,实验结果表明,在低信噪比语音识别中,特征加权模糊支持向量机(FWFSVM)比传统的SVM具有更好的鲁棒性。  相似文献   

10.
音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;其次建立CNN-BGRU模型,利用改进的VGGNet模型提取音素语谱图的特征,再使用双向门控循环单元(BGRU)实现音素语谱图的序列信息表示;最后,通过Softmax分类器实现音素语谱图的分类.实验使用TIMIT英语语音数据集进行音素语谱图识别,准确率达到98.6%,优于CNN(VGG16)、CNN-RNN、CNN-BRNN、CNN-BLSTM这4个模型.  相似文献   

11.
在密集场景中,人流量统计往往因无法可靠地检测行人而使得统计精度不高.针对这一问题,在利用卷积神经网络技术基础上,采用基于头部检测的方法进行人流量统计.该方法采用级联的Adaboost检测器对人头目标进行初步筛选,再用迁移学习技术训练卷积神经网络,并用由卷积神经网络和支持向量机构成的人头分类器模型对初步筛选得到的人头目标进行精细识别,提高检测精度率,利用航迹关联对人头目标进行跟踪统计.实验结果表明,该方法能准确快速地定位到单个行人并具有较高的统计精度.  相似文献   

12.
杨磊  赵红东 《科学技术与工程》2020,20(33):13757-13761
环境声音识别(Eenvironment Ssound Rrecognition ,ESR)在基于情景感知和辅助技术等领域发挥着重要作用。卷积神经网络(CNN)和循环神经网络(RNN)作为两种最具代表性的特征提取方法,在语音和音乐信号处理方面都取得显著效果,然而二者都存在一定缺点,CNN无法有效提取时间特征,RNN在提取空间特征上也存在明显劣势。为了有效的提取并利用时间特征和空间特征,提出一种新模型,利用时间分布卷积神经网络(CNN)从梅尔频谱图中提取城市环境声音特征,然后应用双向长短时记忆网络(BiLSTM)从CNN输出中获取时间信息,最后在BRNN的输出序列上实施注意力机制,从而关注到与城市环境声音最相关的特征进而做出分类判断,注意力机制既提高了分类准确性,又增强了模型的可解释性。实验结果表明,在Urbansound8K数据集中,该模型可获得80.2%的分类准确率,这优于以前在同一数据集的报告结果  相似文献   

13.
作为深度学习的一种有效算法,深度卷积网络已成功应用在处理图像、视频和音频等领域.通过建立一卷积神经网络模型并应用于网络入侵检测,选取的卷积核与数据进行卷积操作提取特征的局部相关性从而提高特征提取的准确度.采集到的网络数据通过多层"卷积层-下采样层"的处理对网络中正常行为和异常行为的特征进行深度刻画,最后通过多层感知机进行正确分类.KDD 99数据集上的实验表明,文中提出的卷积神经网络模型与经典BP神经网络、SVM算法等相比,有效提高了入侵检测识别的分类准确性.   相似文献   

14.
基于支持向量机的皮肤显微图像识别   总被引:3,自引:0,他引:3  
该文针对皮肤显微图像症状识别过程中样本采集困难、数量偏少的实际情况,在皮肤症状识别中引入了一种新的模式识别方法——支持向量机(Support Vector Machines,SVM).该方法基于统计学习理论的原理,较好地解决了小样本的分类问题.文中采用“一对一”的策略解决多类别的SVM分类问题,使用留一法进行交叉验证,并比较了SVM与人工神经网络算法的识别结果.结果表明,SVM算法识别率高(89.35%),且速度快.根据该算法,建立了皮肤症状显微图像识别系统软件的原型.  相似文献   

15.
针对传统LeNet-5卷积神经网络用于交通标志等多种类识别任务中,存在识别正确率低、网络容易过拟合以及梯度消失等问题进行改进。引入Inception卷积模块组来提取目标丰富的特征,同时增加网络的深度。引入BN (batch normalization)层对输入批量样本进行规范化处理;同时改用性能更好的Relu激活函数,并使用全局池化层代替全连接层,合理改变卷积核的大小和数目。研究结果表明,改进LeNet-5网络能够有效解决过拟合和梯度消失等问题,具有较好的鲁棒性;网络识别率达到98. 5%以上,相比CNN (convolutional neural network)+SVM (support vector machine)提高了约5%,比传统的LeNet-5网络提高了3%。可见,改进后的LeNet-5网络图像识别的准确率得到显著提高。  相似文献   

16.
为解决EEG自动检测的错误率非常高的问题,提出了一种基于深层卷积神经网络(CNN)对脑电图进行异常检测的方法:首先,对多个异构数据源按标准进行重构和预处理,生成了有118 716个样本的训练集和有12 022个样本的测试集;然后,构建有快捷连接的深层CNN模型,以自动化学习ECG特征并进行分类识别; 接着,将模型在训练集上进行试验与调参,保存了性能最好的模型参数; 最后,在测试集上进行预测.预测结果显示该模型达到了94.33%的分类准确率.通过所提方法对脑电信号进行处理与分析,能够自动提取EEG特征并进行异常识别,从而达到快速检测与辅助诊疗的目的.  相似文献   

17.
结合机器人的工作原理以及卷积神经网络(CNN)在图像分类中的应用,提出了一种基于卷积神经网络的壁面障碍物检测识别算法.首先,以壁面障碍物准确识别为目标,构建壁面障碍物图像库;然后,通过对VGG-16网络简化后进行优化,得到适合壁面障碍物准确识别的卷积神经网络模型.在此基础上,设计该网络由输入层、4层卷积层、2层池化层、1层全连接层以及输出层组成,进一步利用3×3卷积核对训练样本进行卷积操作,并将所获取的特征图以2×2领域进行池化操作.重复上述操作后,通过学习获取并确定网络模型参数,得到最佳网络模型.实验结果表明,障碍物的识别准确率可达99.0%,具有良好的识别能力.  相似文献   

18.
针对冷轧带钢表面缺陷图像模式识别中存在的问题,提出了基于改进支持向量机的冷轧带钢典型表面缺陷分类识别方法.根据带钢表面缺陷图像识别的特点,对渐进直推式支持向量机在其基本原理基础上加以改进,设计了一种冷轧带钢表面缺陷图像模式识别的分类器.通过实验确定了分类器的结构,给出了相关参数选择的方法.对几种生产现场出现频率较高的典型缺陷图像进行了计算机实验研究.研究结果显示,这种分类器很好地克服了传统支持向量机中存在的推广性能差以及当类别距离过近时准确率下降的问题,具有更好的适应性和准确性.  相似文献   

19.
提出利用挥手行为进行性别识别的方法.使用基于含时切平面的方法检测周期,用平均剪影表征一个周期序列的挥手行为,PCA降维后利用支持向量机进行分类.实验在60人(30男,30女)的数据库上进行.实验结果表明,用提出的算法从三种挥手行为(挥左手、挥右手、挥双手)中识别出性别的正确率达到89.83%或更高.实验还将人体分成5部分:手臂、头肩、腰、臀和腿,研究人体各组成部分对性别识别的贡献.93个对比实验结果表明,去掉手臂部分识别率下降最快;只通过手臂识别正确率达到86.44%或更高;使用两部分识别,手臂+臀部是最优组合;使用三部分识别,手臂+头肩+腰是最优组合.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号