首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高...  相似文献   

2.
为了避免分割缺陷图像造成的误差,提出基于稀疏描述的焊缝缺陷识别方法。将从现场提取的缺陷和噪声图像作为样本,分析圆形、线形和噪声的相关性数据,根据各类X射线焊缝图像的特点,确定稀疏描述中字典矩阵样本图像的数量,然后根据贪心算法求出字典矩阵的局部最优解,用局部解构造全局解组成字典矩阵,将待检测的图像表示为字典矩阵的线性组合,通过求解系数向量可以直接判断缺陷和噪声。实验表明:基于稀疏描述的焊缝缺陷识别方法具有较高的识别度,能够实现对缺陷和噪声的准确识别。  相似文献   

3.
针对当前彩色图像检索技术容易受到色彩干扰,鲁棒性不强等不足,提出了一种字典统计耦合归一化多重距离的彩色图像检索算法.首先,将图像量化并转换成一维信号;然后,引入字典统计,将一维信号进行字典编码,并计算编码后的图像多样值;在归一化字典距离的基础上,嵌入字典编码图像的多样值,从而定义了归一化多重距离(NMD)的相似度量准则,利用NMD对查询图像与数据库图像的多样值进行比较与识别,搜索出与查询图像具有相同特征的最相似图像,完成目标检索.在COREL数据库的实验结果表明:相对于当前常用的检索技术,该检索算法具有更高的查准率和查全率,可对彩色图像完成精确检索,有效减低了色彩对检索性能的干扰.  相似文献   

4.
服装试衣系统中三维模特姿态服饰识别算法   总被引:2,自引:0,他引:2  
提出了基于三维视图的模特姿态服饰识别算法技术。首先基于一元高次多项式最小函数二乘拟合方法,由单视图通过变形生成三维视图的模特姿态服饰图像,然后基于该单视图和生成的三维视图进行模特姿态服饰图像识别。最后根据整个训练数据样本库,通过基于三维视图和融合决策的识别算法进行服饰识别,实验结果表明本算法比仅仅基于单视图作为训练样本库的模特姿态服饰识别算法的正确率有了很大提高。  相似文献   

5.
为了解决判别稀疏邻域保持嵌入(DSNPE)算法中时间复杂度偏高的问题,构造了一种新类间离散度.用各类样本的平均向量组成过完备字典去重构表达每一类的平均向量,然后通过最大间距准则(MMC)构造新的目标函数,更好地展现人脸样本数据库类间的差异,增强了类间判别力和鲁棒性,简化了字典和字典表达,降低算法复杂度.实验结果表明:改进后的算法在保持识别率优势的前提下,极大地减少了识别时间.  相似文献   

6.
为解决鉴别稀疏邻域保持嵌入(DSNPE)算法中类间离散度构造复杂的问题,提出了一个新的维数约简算法即鉴别稀疏局部保持投影的人脸识别算法(DSLPP)。首先利用样本集中各类样本的平均向量构造字典,通过保持各类样本平均向量的稀疏重构关系,提出一个新的无参数类间离散度;再通过同时最大化类间离散度和同时最小化类内紧凑度的准则来寻找最优投影方向;最后采用最近邻分类器进行人脸分类识别。由于所采用的类间离散度最大限度地扩大了不同类别中样本之间的差异,因此DSLPP算法具有更强的类间判别力,其识别率得到了明显提高;此外,字典的简化构造降低了算法的计算复杂度。在Yale、UMIST和AR人脸库上的实验结果表明:DSLPP算法在Yale、UMIST库上的平均识别率及AR库上的最高识别率分别达83.38%、95.72%和83.71%,较其他传统方法的识别率有明显提高;在UMIST库上的实验结果表明,DSLPP算法较DSNPE算法的平均计算时间减少了81.7%。  相似文献   

7.
车牌识别作为智能交通系统中的关键技术,具有十分重要的应用前景.本文提出了一种改进的车牌识别算法.采用K-均值算法对高分辨率车牌图像样本进行聚类,并按类学习相应的子字典,从而有效地减少了字典中原子的数目,提高了算法的运行速度.再采用自适应的正则化参数法和反向投影法对图像进行全局优化,既保留了图像的更多细节特征,又起到较好的去噪效果.仿真实验结果表明,该算法从主观和客观效果上均有效地改善了重建的车牌图像质量.  相似文献   

8.
利用Houbolt逐步积分和向后差分法,推导出多自由度线性振动系统的响应与系统动力学参数及激励的关系递推表达式,进而提出了一种无条件稳定的动载荷识别方法.以一线弹性悬臂梁为例,利用单频和双频单输入激励、双频双输入激励响应的仿真结果,对其激励载荷进行了识别.将识别载荷的时域误差和频谱成分与传统的状态空间法识别结果进行了对比,验证了本载荷识别方法的时域和频域相对误差均更小,且无增频现象,提高了识别精度,且具有良好的抗噪性.  相似文献   

9.
完备的稀疏表示方法近年来应用在人脸识别中并取得较好的结果,它可以仅利用样本的随机投影完成对测试样本的识别。在实际应用中,由于受光照、遮挡等因素的影响,测试样本并不能通过训练样本的线性组合得到很好的稀疏重构。本文提出了基于Metaface字典学习与核稀疏表示的人脸识别方法,借助核技巧,将数据样本和字典集映射到高维的未知空间,以解决特征的非线性相似问题。在核空间对数据样本进行稀疏重构,得到数据在核空间的一种简洁的稀疏表达方式从而提高识别率,而Metaface字典学习框架的引入可以得到更加精炼的字典,从全局上提高识别率。通过在ORL人脸库、Yale人脸库和AR人脸库的实验表明,同等情况下,本文提出的方法优于PCA,SVM,SRC等方法,进一步提高了人脸识别率,具有较好的应用价值。  相似文献   

10.
本系统从形态识别、灰度识别入手,人机结合,快速、方便、准确地分析钢铁金相的光学和电子显微镜组织,而且可以把用户输入计算机的任意一幅金相显微组织的黑白数字图像实时转化成伪彩色图像,显著提高了显微组织的鉴别衬度。  相似文献   

11.
传统基于稀疏表示的人脸识别方法因未充分利用样本包含的信息,而存在较低的鲁棒性和识别率等问题.提出基于小波变换的多字典人脸识别方法.提取人脸图像的多尺度纹理特征,构建多字典,每个字典分别对应样本的原始图像和不同尺度的纹理信息.为提高人脸识别的准确性,在训练阶段利用相同的系数表示将不同字典相关联,深入挖掘了人脸图像与其不同尺度纹理间的共性,探索人脸不同特征的内在联系.较仅聚焦于样本单一特征的传统方法,克服了忽视样本不同特征间联系的不足,更深刻地挖掘训练样本人脸特征且突出了不同类训练样本的个性特征.在多个人脸数据库上的实验结果表明,识别性能有明显的提升.  相似文献   

12.
为提高故障字典法的实用性,提出了一种基于模糊诊断算法的二阶带通滤波器故障特征提取方法。使输入信号频率处于滤波器截止频率之外的衰减边沿,从而使滤波器测试点电压能够灵敏地反映故障元件的变化。使用模糊隶属函数与决策函数计算待诊断电路与每一种电路状态的整体隶属度,从而实现二阶带通滤波器的故障诊断。实验结果表明:该文的故障特征提取方法在构建滤波器故障样本时具有简单快捷的优势,模糊隶属度能够清晰地描述待诊断电路与各种故障状态之间的接近程度,在故障集不重合的情况下,诊断成功率为100%。  相似文献   

13.
针对汉字的多样性和相似性不同于西方字母,识别相对困难的问题,提出了基于ART神经网络的汉字识别方法.在识别前,利用OpenCV(开源计算机视觉库)将汉字进行图像处理,为后续识别提供输入数据;然后经ART神经网络对输入数据进行训练识别.采用8组相似度较高的汉字作为样本进行实验,证明了方法的有效性.  相似文献   

14.
基于模态振型,提出一个用于结构损伤识别的参数-柔度差值曲率,并将之作为神经网络的输入向量。然后通过ANSYS建立了一个平面桁架结构的数学模型,用有限元分析计算结果作为神经网络的学习样本和测试样本,对不同程度的模拟损伤使用该神经网络进行识别。通过验证,表明该方法用于损伤识别简单有效。  相似文献   

15.
针对主成分分析(PCA)未充分利用样本类别信息及线性鉴别(LDA)在小样本时识别率低的问题,提出了一种基于PCA和LDA相融合的人脸识别算法。该算法首先将输入人脸图像进行几何位置规范化和灰度分布均衡化预处理;然后利用PCA算法将人脸训练图像投影到低秩特征子空间,利用LDA算法计算类间离散度大、类内离散度小的特征子空间,从而获得PCA-LDA的人脸融合特征空间;最后将训练样本、测试样本投影至融合的特征空间,并利用最近邻准则实现对测试样本的识别。实验结果表明,该算法能够有效融合PCA和LDA的优势,提高系统识别的鲁棒性和效率。  相似文献   

16.
单桂军 《科学技术与工程》2013,13(14):3908-3911,3916
随着人脸识别技术的不断发展,单样本人脸识别已成为当今的一个热点。针对单样本人脸识别问题,提出了一种基于虚拟样本扩展的人脸识别方法,为给定的单训练样本增加虚拟图像,以增强单训练样本的分类信息,并对原样本及其虚拟样本进行特征变换,划分得到更多的子图像,利用二维主成分分析(2DPCA)实现特征抽取,一定程度上减轻了人脸的表情、姿态、光照等因素对识别效果的影响,提高了识别率。提出的方法分别在ORL及FERET两大人脸数据库上得到了验证。  相似文献   

17.
立场检测任务通过自然语言处理技术,分析出文本内容对目标话题的立场倾向.本文提出的立场检测模块从文件系统取"文本数据",而后根据预先设定的字典,将文本中的文字和文字在字典中对应的数字进行映射,形成数字序列.将数字序列输入已预训练好的RoBERTa模型,得到数字序列的特征表示,将特征表示输入分类器进行立场识别.最后将立场分...  相似文献   

18.
提出了一种新的字典学习法用于图像的超分辨率复原,即双层混合字典。其中,第一层字典采用半耦合字典,确保了复原过程的灵活性和准确性,并结合稀疏表示算法得到第一层复原图像;为了不影响算法的整体运算速度,第二层字典采用分类字典,并利用原始图像与第一层复原图像的差值作为高分辨率样本,以便能恢复更多的高频细节。实验结果表明,本算法与传统的基于单一字典的图像超分辨率算法相比,无论是在视觉效果上,还是峰值信噪比(PSNR)指标,都取得了更为理想的效果,有效地改善了降质图像的质量。  相似文献   

19.
为提高基于稀疏表示的图像超分辨率重建的质量,该文提出了联合稀疏表示与总变分正则化的超分辨率重建算法。首先,在字典训练阶段,从具有相似统计特征的训练图片中获取图像块,作为训练字典的样本,并用K-SVD算法进行字典训练,得到高、低分辨率的字典。在稀疏编码阶段,根据局部稀疏编码模型求解出低分辨图像的稀疏表示系数,再利用稀疏表示系数和高分辨率字典对输入低分辨率图像进行重建,得到高分辨率图像。最后,将重建得到的高分辨率图像进行总变分正则化优化,进一步提高重建效果。仿真实验结果表明,该算法在客观评价指标和主观视觉效果上,图像质量都有明显提高。  相似文献   

20.
通过对合成孔径雷达(synthetic aperture radar,SAR)图像的统计特性分析,提出一种基于特征参数稀疏表示的SAR图像目标识别算法,有效地解决了图像域稀疏表示识别算法存在的高维问题。由低维高精度的广义二维主分量特征构成过完备字典,基于Fisher线性判别准则对该字典进行学习优化,使得类内更紧凑,类间更分开,同时降低了稀疏求解的复杂度。求解测试样本在优化字典下的稀疏表示系数,根据系数矢量的能量特征完成分类识别。MSTAR(moving and stationany target acquisition and recognition)实测SAR图像数据实验的结果表明,该方法稀疏求解复杂度低,并且只需简单的SAR图像预处理即可有效地提高识别的准确率和速度  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号