首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
[目的]传统的蜻蜓目(Odonata)昆虫的鉴别算法是在标本图片上进行人工的特征提取来训练分类器,此类方法所用的数据集包含的蜻蜓目昆虫种类和数量均较少,并且样本背景单一,导致识别率低且只能识别标本图片.针对这些问题制作了一个同时包含蜻蜓目昆虫生态图片和标本图片的数据集,提出一种基于深度学习的蜻蜓目昆虫的识别算法.[方法]采用具备端到端学习优势的网络框架,在上述数据集上,使用在ImageNet上迁移学习的ResNet50进行特征提取,使用新的区域建议网络Imp-RPN进行特征筛选,再使用改进的损失函数来解决样本分布不均的问题.[结果]所提出的识别算法在精确到种的46类分类任务中识别率达到了96.2%,在精确到种并包含性别信息的90类分类任务中识别率则达到了88.7%.[结论]端到端的深度学习网络框架免除了人工标注样本的时间成本,提高了识别准确率,更能满足物种鉴别任务的需求.  相似文献   

2.
在实际监控场景中,运动阴影的存在将对目标检测的准确性产生直接影响.针对此问题,本文提出了一种采用三层码书模型以此来提高阴影检测识别率的算法.该算法首先通过传统码书模型获取前景,然后对前景部分建立备选码书模型,再从备选码书中提取出具备阴影特质的点,构建阴影码书模型,最后通过该模型去除运动阴影.实验结果表明,与传统算法相比,该算法对阴影检测识别率有较大的提高.同时,通过对不同场景的对比,结果说明该算法具备良好的鲁棒性.  相似文献   

3.
本文提出了一种基于深度学习的应急手势识别算法.首先采用深度图像传感器做手势分割获取应急手势数据集,其次采用肤色分割算法和本文提出的应急手势识别算法做实时性测试.与常规算法不同的是,本文构建了一个应急手势数据库,并建立了深度卷积神经网络模型,提出了7种应用于多种场景的应急手势识别算法.实验结果表明,本文应急手势识别算法优于现有的机器学习算法,识别率达99.95%,可广泛应用于人机交互场景.  相似文献   

4.
麻核桃的分类有助于产品销售,传统分类方式仅限于人工操作。为实现麻核桃的自动化分类,设计一种麻核桃分类算法,该算法通过构建核桃像素概率分布模型实现。根据核桃不同视图,利用同类核桃构建像素概率分布模型以及惩戒模型。利用矩阵乘积方式将待测核桃样本与两个模型分别进行对比,并将计算结果作为测试样本种类归属的判据,并以此对核桃进行分类。利用3 000个核桃样本,建立一个包含9 000张图片的数据集,对算法的性能进行评估。经过测试,在3次交叉测试实验中,该算法取得了97.36%的识别率。实验结果表明,在麻核桃分类识别中,该方法具有较好的应用前景。  相似文献   

5.
以真实场景中拍摄的街景门牌号码图像数据集SVHN为研究对象,将卷积神经网络与支持向量机相结合,提出了一种基于改进LeNet-5的街景门牌号码快速识别方法.该方法首先对数据进行图像增强预处理,突出有效特征;然后,省去基本LeNet-5中的第3卷积层,并用SVM分类器代替最后输出层中的Softmax分类器,以简化网络结构的同时提高分类效率.在国际公开的SVHN数据集的实验结果表明,改进LeNet-5可以有效识别街景门牌号码,7h便可训练得出结构稳定的网络识别模型,识别率达到90.35%,提高了算法的综合效率.  相似文献   

6.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

7.
通过传统图像处理方法将航拍图片旋转后进行前景分割、计算轮廓和生成标识框的方法增加训练样本中不同拍摄视角下样本的数量,使得训练样本具有更全的代表性。算法方面针对小目标检测,通过在原有YOLO目标检测算法的基础上加入图像超分辨率功能形成SR-YOLO网络模型,并对原网络模型中的归一化层和残差层层数进行调整。应用SR-YOLO网络模型使用经过旋转扩充后的数据集进行训练,得到"人"的目标检测模型。通过实验数据分析,此模型在航拍场景下目标的识别率较原网络结构有所提升。  相似文献   

8.
图片形式的汉字结构分类问题由人工完成,存在主观分类误差、分类效率低、分类时间长,传统的数字图形图像学知识用于汉字结构分类时,无法做到使用一个模型区分多种复杂汉字结构.针对这些问题,搭建基于卷积神经网络ResNet进行迁移学习的汉字结构分类算法和搭建两层卷积层的卷积神经网络的汉字结构分类算法.在建立的数据集中训练集有19798张汉字图片,测试集使用143张结构风格与训练集相似的汉字图片完成9分类任务.最终通过比较得出一个准确率相对比较高的模型,方便以后更为广泛的工业级使用.  相似文献   

9.
刘凌  高宝成 《科技信息》2007,25(3):11-12
在视频交通监控系统中阴影去除结果与后续的整个监控系统有很大的关系,例如车型分类,车辆跟踪以及车流量统计和测速都会因为阴影产生很大的困难。本文结合车辆监控系统所观测的道路场景的特点,分析了具体情况下阴影的特殊性,提出一种有效的阴影去除算法。该方法将时间信息和道路纹理特征有效的应用于算法中。首先,在序列图片中进行运动物体分割;下来,在前景中应用边缘信息和纹理特征实现车辆和阴影的区分。经过实时系统的应用显示出很好的阴影去除性能。  相似文献   

10.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。  相似文献   

11.
The cartoon animation industry has developed into a huge industrial chain with a large potential market involving games, digital entertainment, and other industries. However, due to the coarse-grained classification of cartoon materials, cartoon animators can hardly find relevant materials during the process of creation. The polar emotions of cartoon materials are an important reference for creators as they can help them easily obtain the pictures they need. Some methods for obtaining the emotions of cartoon pictures have been proposed, but most of these focus on expression recognition. Meanwhile, other emotion recognition methods are not ideal for use as cartoon materials. We propose a deep learning-based method to classify the polar emotions of the cartoon pictures of the "Moe" drawing style. According to the expression feature of the cartoon characters of this drawing style, we recognize the facial expressions of cartoon characters and extract the scene and facial features of the cartoon images. Then, we correct the emotions of the pictures obtained by the expression recognition according to the scene features. Finally, we can obtain the polar emotions of corresponding picture. We designed a dataset and performed verification tests on it, achieving 81.9% experimental accuracy. The experimental results prove that our method is competitive.  相似文献   

12.
针对车标识别过程中匹配阈值难、识别速度慢的问题,提出一种基于尺度不变特征变换(SIFT)的特征匹配车标识别算法.利用SIFT算子对图像的视角、平移、放射、亮度、旋转等不变特性进行提取,并采用BP神经网络算法自主选取车标图像特征进行分类、匹配和识别.仿真实验结果表明,简单车标和复杂车标的识别率平均值均达90%以上,该算法识别速度较快、识别率较高,能满足实际应用的需要.  相似文献   

13.
Classifier learning methods commonly assume that the training data and the testing data are drawn from the same underlying distribution. However,in many practical situations,this assumption is violated. One example is the practical action videos with complex background and the universal human action databases of Kungliga Tekniska Hgskolan (KTH). When training data are very scarce,supervised learning is difficult. However,it will cost lots of human and material resources to establish a labeled video set which includes a large amount of videos with complex backgrounds. In this paper,we propose an action recognition framework which uses transfer boosting learning algorithm. By using this algorithm,we can train an action recognition model fitting for most practical situations just relaying on the universal action video dataset and a tiny set of action videos with complex background. And the experiment results show that the performance is improved.  相似文献   

14.
在分析帧比率控制(FRC)算法的基础上,提出了一种空间扩展FRC算法,将非线性时间混色扩展到显示的屏幕空间,可以保证画面的平均亮度基本不变.从理论上推导了采用该算法时静态图像相邻两帧间图像明像素数的最大差异,并使用基准图形进行了测试.该FRC被实现于一个液晶显示控制器,经实际的制造工艺分析,具有较好的硬件实现特性.  相似文献   

15.
儿童绘本具有简洁的文字、精美的画面、灵活的版式,符合儿童早期阅读的特点和习惯。绘本阅读能够发展儿童的语言能力,培养想象力、观察力和思维能力,增强审美意识,培养丰富情感。为更好地发挥儿童绘本阅读在儿童教育中的作用,既要为儿童选择适合其需要的绘本,也要家长和教师在阅读中加以引导,更要注重家庭教育和学校教育相结合。  相似文献   

16.
介绍了ASP动态网页图片处理的几种方法,总结出获取网页图片地址,获取图片内容并保存,制作缩略图,图片加水印,显示随机图象的过程实现.  相似文献   

17.
B超影像采集工作站及DICOM接口设计与实现   总被引:3,自引:0,他引:3  
为解决医院模拟B超诊断仪能够接入现有PACS系统 ,适应数字化与信息化发展 ,介绍一种基于PACS系统的B超影像采集工作站及其设计与实现 本系统作为B超诊断仪与PACS系统联接钮带 ,重点解决了B超图像的采集 ,存储与传输 在采集方面根据标准视频输入可实现单帧与动态多帧采集 ;在存储方面图像采用了标准DICOM图像格式 ;在传输方面采用了DICOM传输标准 ,实现了B超图像以DICOM规范与PACS系统进行数据传输 ,符合国际医学图像存储与传输标准 ,有利于B超影像工作站方便接入PACS系统 ,推动PACS系统在我国的发展 ,同时工作站增加了图像的后处理算法与数据库的管理 ,有利于医师的临床诊断与数据库管理  相似文献   

18.
近年来,绘本阅读逐渐受到家长、学校和图书馆界的广泛重视。英文原版绘本以其视角多元、绘画优美、富于情趣而更受孩子们的喜欢。对于英文原版绘本阅读,要给予必要的引导,培养孩子们的阅读习惯。  相似文献   

19.
传统的纹理图像识别方法很难同时获得较好的识别精度、实时性和尺度稳健性,不利于实际的工程应用.因此,提出一种快速和尺度稳健的纹理图像识别方法.该方法首先利用高斯滤波构造一个纹理图像的多尺度空间,然后利用完备的局部二值计数(Completed Local Binary Count,CLBC)算法对多尺度空间中的每个图像提取局部二值特征,并跨尺度提取局部二值特征的最大值,再将多个分辨率的特征相结合作为纹理图像的最终特征描述,最后利用最近子空间分类器(Nearest Subspace Classifier,NSC)判定纹理图像的类别.在基准纹理图像数据库上的实验表明,该方法在识别精度、实时性和尺度稳健性方面获得了很好的综合性能,有利于实际的工程应用.  相似文献   

20.
运动图象的扫描方式有2种,即逐行扫描和隔行扫描.这2种扫描方式产生的图象的特性大不相同,从而在压缩编码处理上也出现了很不一致的结果.为适应图象的特性,图象往往采用帧或场的不同方式来组织.文中讨论了图象的扫描格式及图象的组织方式(帧方式或场方式)与图象数据压缩效率的关系,提出了一个简单有效的场/帧决策算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号