首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
音频分类使机器具有识别音频样本类别的功能,而与传统音频分类模型不同,零样本学习模型可以识别训练期间未出现的音频类别样本。但是,当前的零样本音频分类方法在做类间信息迁移时大多依靠类别标签文本语义信息的先验知识,而语义的先验知识包含大量与音频非相关的冗余信息,所导致的知识转移性能的局限性大大限制了零样本学习模型识别能力。基于此,文中提出将与音频信息高度相关的人工听觉描述子作为类间迁移信息,同时使用合成分类器,构建了零样本音频分类模型。在ESC-50数据集的实验中,与先前的工作相比较,基于人工听觉描述子的零样本音频分类具有更好的分类性能。  相似文献   

3.
针对基元结构描述子在颜色空间的基础上再提取其他特征,导致偏重对颜色信息的描述而降低了图像检索性能的问题,提出一种应用在HSV颜色空间上的三结构描述子(TSD)的特征提取方法。该方法在HSV颜色空间中分别提取颜色和纹理信息,考虑到了颜色和纹理特征的同等重要性,同时避免了颜色信息的过多干扰;在纹理特征提取中,TSD利用像素间的信息变化来表示局部空间结构信息,解决了传统的局部模式方法忽略对局部结构的空间关系描述的问题,获得了更多的空间结构信息。实验结果表明,该方法在3个图像库Corel-1000、Corel-5000和Corel-10000上的检索准确率分别达到78.08%、38.12%和52.12%,与以往基元结构方法相比,检索准确率得到了提高。  相似文献   

4.
提出了一种新的基于轮廓的形状描述子,称为多尺度三元组描述子.对轮廓进行均匀采样,同时根据多边形近似演化算法提取轮廓的关键点,由采样点和其相邻关键点构成三元组,根据多个尺度下三元组的几何特性(包括角度和边长)定义描述子.这些三元组既包含了形状的局部细节,又包含了形状的全局结构信息,是一种稳定而准确的描述.形状匹配阶段使用动态规划算法.将本方法应用在MPEG-7数据库上,检索准确率达到86.30%,具有显著优势.  相似文献   

5.
6.
针对手势识别中人手是复杂变形体,手部特征描述容易受到环境因素影响的特点,提出了一种基于傅立叶描述子-BP神经网络的手势识别方法.首先根据YCbCr和Nrg肤色模型的互补性以及背景模型有效去除复杂背景中的类肤色的特点,利用多特征相融合的手势分割方法提取手势区域;然后结合傅立叶描述子具有较好的轮廓描述能力和BP神经网络较强的自学习能力,利用傅立叶描述子-BP神经网络方法对手势进行识别.实验结果表明此方法具有较好的鲁棒性和较高的识别率.  相似文献   

7.
介绍了在Radon变换下的图像矩特征的抽取方法,并得到图像的矩特征矩阵;进而对矩特征矩阵按行向量进行小波变换组成矩——小波描述子特征矩阵,采用矩阵的加权欧氏距离作为人脸图像的匹配识别的算法,产生较好的结果。  相似文献   

8.
针对电塔图像中重复出现的纹理特征运用全局自相似描述子进行特征描述,进而准确检测巡检图像中的电塔.从巡检图像处理中的实际问题出发,全面分析了自相似描述子的特性,并结合全局自相似描述子的内在机理,分析了选择全局自相似描述子作为电塔特征刻画工具的原因.最后,以各类包含电塔的图像为样本,通过实验验证了全局自相似描述子的准确、高...  相似文献   

9.
针对传统方法直接采用图像特征参与图像分割时存在的特征冗余且分割准确率低的问题,提出了一种基于协方差描述子和LogitBoost的交通场景图像分割方法.采用运动结构特征、纹理和HOG特征描述交通场景,并利用协方差描述子进行特征融合以消除特征冗余;采用多类LogitBoost分类器进行图像分割,提高了交通场景分割的精度.在公共测试视频数据库CamVid中测试和评估了所提出的算法,结果表明了该方法的有效性.  相似文献   

10.
利用RGB-D数据进行三维点云配准时容易陷入局部最优.针对这个难题,提出了一种基于多维特征的PVDAC描述子实现三维点云配准的方法.该方法首先通过ORB特征检测算法提取二维数据的关键点,并计算关键点在2D下的灰度特征,然后构建关键点在3D下的局部像素值距离、点云法线角度以及曲率特征,接着将2D特征和3D特征联合生成全新的PVDAC像素描述子,并利用PVDAC像素描述子描述关键点实现三维点云的粗配准,最后基于ICP算法完成三维点云的精细化配准.实验表明,本文算法在大场景点云配准时总体均方误差约为0.05 m2,在小场景单物体点云配准时达到了0.000 2 m2的较小误差,实现了三维点云的精确配准.  相似文献   

11.
文章研究了基于傅里叶描述子的形状特征匹配方法在机场掩体检测中的应用。本文利用傅里叶描述子对目标旋转、缩放和平移描述的不变性,确定了用基于傅里叶描述子的特征匹配方法来检测掩体目标,井对匹配方法的原理、步骤和方案进行了论述。用仿真数据进行了试验,试验结果验证了文中设计的形状匹配方法对掩体类目标检测的有效性。  相似文献   

12.
针对人工识别轮胎标识点形状效率低、误差大等问题,提出了一种基于傅里叶描述子的轮胎标识点形状识别算法.首先对采集的轮胎标识点图像进行降噪、分割、轮廓提取等图像预处理操作;然后通过对预处理后的轮胎标识点图像进行傅里叶变换,提取轮胎标识点轮廓的傅里叶描述子系数;最后通过计算待识别轮胎标识点图像的傅里叶描述子系数,与轮胎标识点模板库中图像的傅里叶描述子系数的欧氏距离数值,其中与最小欧氏距离相对应的模板库形状即为待识别轮胎标识点轮廓的近似形状,从而实现轮胎标识点的形状识别.实验选取圆形、方形、菱形以及十字形,四种共计200幅轮胎标识点形状图像,进行标识点形状识别准确率测试.实验结果表明,该算法能准确地识别出轮胎标识点形状,四种轮胎标识点形状的平均识别准确率为97.25%,其中圆形和方形轮胎标识点的形状识别准确率达98%.  相似文献   

13.
针对面向唇读的水平集模型在嘴唇分割中存在边界过收敛和过早收敛的问题,文中提出了一种改进的基于先验知识的水平集模型(简称为PS-Level Set)来进行嘴唇几何形状的定位.PS-Level Set模型利用改进的差值能量函数引入嘴唇形状的先验信息.在曲线演化过程中,反复比较演化曲线和先验曲线的差距,使曲线的演化形状逐渐逼近先验模型形状,从而更精确地收敛于目标物体实际轮廓.实验表明,用PS-Level Set模型定位嘴唇几何形状的准确率比用水平集模型提高了8.38%.  相似文献   

14.
基于OpenCV的口唇检测研究   总被引:1,自引:1,他引:0  
唇读技术在提高噪音环境中语音识别系统的识别率和帮助有听力障碍的人更好的理解语言方面起到了一定的辅助作用。由于说话过程中口型变化较大,直接提取口型区域较困难;而在发音过程中鼻子形状不会发生较大变化,且OpenCV自带的人脸检测器可以很好的检测出人脸。提出了一种利用嘴唇与人脸和鼻子的相对位置关系进行检测嘴唇区域的方法。实验证明,该方法可以比较快速,精确地提取出嘴唇区域,从而利于精确的进行口唇分割。  相似文献   

15.
提出了一种两层运动目标检测算法.基于普通模型的第一层检测从当前帧中粗略地分割出运动目标.第二层检测包括两部分:首先,从粗略分割和所有历史分割中提取运动目标的泛化傅里叶描述子,然后基于描述子相似性度量,从历史分割中提取和粗略分割相似程度较高的部分组成新模型,并基于新模型得到第二层检测结果.普通模型与新模型均使用概率建模方法,两层检测均使用图分割技术.实验结果表明了该方法的有效性.  相似文献   

16.
针对单视觉通道唇读系统的唇部特征提取问题,提出了基于唇部灰度能量图的特征提取方法.该方法将表示字或词的图像序列投影到二维灰度能量图上,不但统一了输入数据的维数,而且较好地保留了序列图像的运动信息.针对模板匹配方法对模板的依赖问题,文中将单训练样本唇部灰度能量模板图推广至多训练样本.文中还就唇部定位提出中心定位法.实验结...  相似文献   

17.
基于融合MPEG-7描述子和二次预测机制的视频自动分类算法   总被引:1,自引:0,他引:1  
针对互联网上日益增长的视频数量,提出了一种大量融合MPEG 7描述子并启用二次预测机制的视频自动分类方法.研究了颜色、纹理、形状、运动等9种MPEG 7描述子,从5类视频中提取并融合这些描述子作为视频的整体特征,输入支持向量机(SVM)中进行模型训练和预测.在传统支持向量机的1 1方法中,通过启用二次预测机制来提高分类的准确率.实验结果表明,该方法与其他方法相比有较高的准确率,适合大规模、复杂环境下的视频自动分类任务.  相似文献   

18.
提出了一种基于S变换、加窗插值快速傅里叶变换(FFT)和概率神经网络(PNN)的电能质量扰动检测和分类方法.应用S变换和加窗插值FFT对电能质量多扰动信号进行时频分析,获取信号的特征量.通过训练信号集上获得的特征量,训练了一个概率神经网络用于扰动分类.训练好的网络在测试信号集上的测试结果表明,对正常电压和常见的电能质量扰动,该方法具有较高的分类准确率,在训练样本数较少、噪声影响大和多扰动信号并存时仍能取得较好的分类效果.  相似文献   

19.
稀有类是数据挖掘中一个重要研究课题。将入侵检测作为稀有类来考虑,阐述了现有的稀有类算法,将基于Boosting的成本敏感的朴素贝叶斯算法引入到入侵检测中,经过试验验证该算法与传统分类算法相比具有很大的优势。  相似文献   

20.
传统的耕作过程中,除草剂的施用对环境、人体健康以及其它生物都会产生不利的影响。为了解决这个问题,提出了基于局部模式纹理描述符的简单有效的杂草自动分类算法,首先借助于局部二元模式(LBP)、局部的三元模式(LTP)、局部定向模式(LDP)三种广泛使用的纹理描述算子对杂草图像进行纹理编码,然后通过微观层面的纹理图案将杂草图像分类成阔叶杂草和禾本科杂草,最后利用模板匹配和支持向量机完成了杂草的自动分类。在自己拍摄的400张杂草图像样本上的实验验证了所提方法的有效性,实验结果表明,与最先进的方法相比,所提方法取得了更好的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号