首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
改进人体行为识别传统模板匹配方法的算法,提出一种基于运动矢量分析动作识别技术,并对其识别效果进行实验验证.该技术把标准人体动作的百分比运动矢量作为模板,将待识别动作的百分比运动矢量与已知的模板进行对比,从而得到动作识别结果.该技术可以正确识别摆头、点头和摇头动作,动作重复3次的识别率可以达到95%以上.该技术进行实时动作识别具有效果好、算法简单、识别速度快、抗干扰性强等优点.  相似文献   

2.
在计算机视觉中,由于物体的几何特性随视线的变化而变化,从而给三维目标识别带来了困难.在设计识别算法时,关键是理解目标重要特征的变化,如角度、距离等的变化.在视线方向各向同性条件下,投影角度和距离的概率密度在其原值附近具有峰值效应,即投影角度及距离接近于原角度及距离.利用投影角度的联合概率函数可识别多面体.在已知距离时,为了便于识别目标,导出了投影距离的密度函数.实验结果证明了该方法的有效性.  相似文献   

3.
A network that learns to recognize three-dimensional objects   总被引:18,自引:0,他引:18  
T Poggio  S Edelman 《Nature》1990,343(6255):263-266
The visual recognition of three-dimensional (3-D) objects on the basis of their shape poses at least two difficult problems. First, there is the problem of variable illumination, which can be addressed by working with relatively stable features such as intensity edges rather than the raw intensity images. Second, there is the problem of the initially unknown pose of the object relative to the viewer. In one approach to this problem, a hypothesis is first made about the viewpoint, then the appearance of a model object from such a viewpoint is computed and compared with the actual image. Such recognition schemes generally employ 3-D models of objects, but the automatic learning of 3-D models is itself a difficult problem. To address this problem in computational vision, we have developed a scheme, based on the theory of approximation of multivariate functions, that learns from a small set of perspective views a function mapping any viewpoint to a standard view. A network equivalent to this scheme will thus 'recognize' the object on which it was trained from any viewpoint.  相似文献   

4.
为了解决集装箱箱号识别精度差、速度慢的缺点,提出了一种新的识别方法.该方法从字符的边界信息中抽取出其特征向量并利用模板匹配法完成字符的初步识别.然后通过大量的实验确定易混淆的字符集,再利用这些字符的独有特征加以区分识别.实验结果表明此算法不但减少了运算量,而且提高了识别速度和精确度.  相似文献   

5.
【目的】提高现有眉毛识别方法的识别效率。【方法】采用快速正交Haar变换模板匹配算法(FOHT),设计一种基于正交Haar变换的眉毛识别方法;同时,使用最大标准子模板和自适应阈值解决了FOHT算法只能处理标准模板且需要手动设置阈值的缺陷。【结果】所构建的眉毛识别方法比原方法效率提高约32%。【结论】正交Haar变换的眉毛识别方法实时性强,具有一定的实用价值。  相似文献   

6.
使用标准模板匹配识别算法对图像中的字符进行识别时,图像中的背景噪声会导致识别准确率较低.为了提高识别准确率,提出一种基于分布加权的模板匹配识别算法,在获取图像与模板在对应的各个像素点上的匹配情况后,根据点间距分别对匹配点和不匹配点进行聚类,将聚集在一起的点划分到同一个分组中,根据聚类结果对不同组内的点设置不同的权重值,再计算图像与各个模板的匹配度,将匹配度最高的模板代表的字符作为识别的结果.实验结果证明,此算法提高了对有背景噪声的字符图像进行识别的准确率.  相似文献   

7.
吴兰  杨攀  李斌全  王涵 《广西科学》2023,30(1):52-60
视听语音识别(Audio-Visual Speech Recognition,AVSR)技术利用唇读和语音识别(Audio-Visual Speech Recognition,AVSR)的关联性和互补性可有效提高字符识别准确率。针对唇读的识别率远低于语音识别、语音信号易受噪声破坏、现有的视听语音识别方法在大词汇量环境噪声中的识别率大幅降低等问题,本文提出一种多模态视听语音识别(Multi-modality Audio-Visual Speech Recognition,MAVSR)方法。该方法基于自注意力机制构建双流前端编码模型,引入模态控制器解决环境噪声下音频模态占据主导地位而导致的各模态识别性能不均衡问题,提高识别稳定性与鲁棒性,构建基于一维卷积的多模态特征融合网络,解决音视频数据异构问题,提升音视频模态间的关联性与互补性。与现有主流方法对比,在仅音频、仅视频、音视频融合3种任务下,该方法的识别准确率提升7.58%以上。  相似文献   

8.
基于动态时间规划的基因芯片数据识别   总被引:1,自引:0,他引:1  
研究了动态时间规划(DP)在基因芯片数据识别中的应用,提出了基因芯片数据的全局最大自相似度的定义以及基于最大自相似度和高维局部片段校对的基因芯片数据自动识别方法。讨论了基于最大相似度建立模板的方法与基于最大相似度的基因沿校对路径平均的建立模板方法对基因识别和分类的影响。对肿瘤基因的识别实验结果表明:基于最大相似度的DP算法(DP-MS)能够达到100%的识别率,本方法可以应用于基因芯片数据的识别、分类和基因疾病推断。  相似文献   

9.
以2,4-二氯-6,7-二甲氧基喹唑啉(DCQAL)为模板分子,采用单步溶胀聚合法制得了分子印迹聚合物微球(MIPM),研究了功能单体、模板分子与功能单体的摩尔比、交联剂用量及吸附液添加剂等对MIPM识别性能的影响.结果表明:对于碱性的DCQAL,采用酸性功能单体制得的MIPM可与之形成较强的氢键从而显示出较好的识别性能,以4-氯-6,7-二甲氧基喹唑啉或2,3-二甲基喹喔啉为竞争分子,其分离因子分别达1.83和2.02;增加交联剂的用量可增强印迹孔穴的稳定性,从而提高识别能力;在一定范围内增大模板分子与功能单体的摩尔比,能使更大比例的功能单体在MIPM中形成有序的排列,使MIPM呈现更好的识别效果;吸附液中添加少量的三乙胺(含量小于0.1%)可减弱MIPM的非特异性吸附,从而提高其识别能力.  相似文献   

10.
基于张量脸的多姿态人脸识别算法   总被引:1,自引:0,他引:1  
提出了一种新的多姿态人脸识别算法,在原有的张量脸算法(TensorFaces)基础上结合了流形学习方法和统计学聚类的方法,首先将训练图库中不同姿态的人脸图像通过保局映射投影(LPP)的姿态聚类特性投影到二维空间上,然后将待测图库中的未知姿态人脸图像投影到该二维空间并找到其最近邻的两个姿态,根据两个最近邻姿态库作为训练库修正张量脸识别算法的判别系数.实验结果表明,该算法的识别率优于原有的张量脸算法.  相似文献   

11.
在车牌自动识别系统中,因自然因素或采样因素使得原本规则的印刷体字符产生畸变,给字符识别带来了很大困难.考虑到识别的实际应用及实时性要求,采用改进的模板匹配方法先将字符细化,再结合字符的全局特征,与模板的特征矢量进行匹配,误差最小的作为识别结果.实验结果表明,该算法具有较高的识别率及较好的抗噪性能,能够实现较好的车牌识别效果.  相似文献   

12.
多媒体数据库管理的数据表示模型与融合   总被引:1,自引:0,他引:1  
通过定义角色、虚拟角色、观点和虚拟观点,解决了多媒体信息的格式不同给用户造成的使用不便,同时也较好地解决了多媒体数据融合的技术关键。角色和观点掩饰了所有由信息和日常所需的格式的复杂性,利用角色和观点来支撑多媒体对象的动态扩展,致使多媒体制造者能够很容易地在运行时延伸对象的使用。  相似文献   

13.
利用迁移学习的思想,提出了一个主题迁移模型(topic transfer model)用于跨视角的动作识别。借助源视角视频和目标视角视频,学习一个迁移模型,利用这个模型来实现对目标视角下视频的分类。具体方法是在源视角下训练一个主题模型,将反应源视角的语义信息传递到目标视角中,然后在目标视角中训练一个主题模型,实现跨视角的动作表示,利用支持向量机进行动作的训练和分类。实验结果验证了该方法的有效性。  相似文献   

14.
《清华大学学报》2020,25(1):68-80
Camera-equipped mobile devices are encouraging people to take more photos and the development and growth of social networks is making it increasingly popular to share photos online. When objects appear in overlapping Fields Of View(FOV), this means that they are drawing much attention and thus indicates their popularity. Successfully discovering and locating these objects can be very useful for many applications, such as criminal investigations, event summaries, and crowdsourcing-based Geographical Information Systems(GIS).Existing methods require either prior knowledge of the environment or intentional photographing. In this paper, we propose a seamless approach called "Spotlight", which performs passive localization using crowdsourced photos.Using a graph-based model, we combine object images across multiple camera views. Within each set of combined object images, a photographing map is built on which object localization is performed using plane geometry. We evaluate the system's localization accuracy using photos taken in various scenarios, with the results showing our approach to be effective for passive object localization and to achieve a high level of accuracy.  相似文献   

15.
One of the most important kinds of queries in Spatial Network Databases (SNDB) to support location-based services (LBS) is the shortest path query. Given an object in a network, e.g. a location of a car on a road network, and a set of objects of interests, e.g. hotels, gas station, and car, the shortest path query returns the shortest path from the query object to interested objects. The studies of shortest path query have two kinds of ways, online processing and preprocessing. The studies of preprocessing suppose that the interest objects are static. This paper proposes a shortest path algorithm with a set of index structures to support the situation of moving objects. This algorithm can transform a dynamic problem to a static problem. In this paper we focus on road networks. However, our algorithms do not use any domain specific information, and therefore can be applied to any network, This algorithm's complexity is O(klog2i), and traditional Diikstra's comolexitv is O((i + k)^2).  相似文献   

16.
针对自然场景中交通标志识别问题涉及的识别准确率和实时性改善需求,提出了一种改进的基于多尺度卷积神经网络(CNN)的交通标志识别算法.首先,通过图像增强方法比选实验,采用限制对比度自适应直方图均衡化方法作为图像预处理方法,以改善图像质量.然后,提出一种多尺度CNN模型,用于提取交通标志图像的全局特征和局部特征.进而,将组合后的多尺度特征送入全连接SoftMax分类器,实现交通标志识别.采用德国交通标志基准数据库(GTSRB)测试了所提算法的有效性,测试结果表明,算法在GTSRB基准数据集上获得98.82%的识别准确率以及每幅图像0.1ms的识别速度,本文算法具有一定的先进性.  相似文献   

17.
人脸识别技术(Face Recognition)是生物技术和计算机技术的复合应用。有别于虹膜识别(Iris Recognition)、指纹识别(Fingerprint Recognition),人脸识别对数据采集、分析和处理更灵活更直观。随着个人、企业、国家对于安全要求的提高,基于人脸识别技术的身份认证系统的应用也越来越广泛。本文通过研究和分析,阐述了如何实现基于人脸识别技术的身份认证系统,和利用云计算对大规模认证系统进行优化。  相似文献   

18.
自然手写汉字五笔码识别法   总被引:1,自引:0,他引:1  
在深入剖析五笔字型键盘输入法编码原则和字根结构基础上,结合联机识别技术特点对五笔字根作出适应性发行后,提出了一种联机识别自然手写汉字新方法:五笔码识别法。在构建的识别体系中 采用了层间分级技术,并提出将键盘输入技术与联机识别技术有机融合,为联机识别自然手写汉字探索新途径。  相似文献   

19.
迭代函数系统在模板匹配应用中的方法与定理   总被引:1,自引:1,他引:0  
迭代函数系统在自然景物的建模上所具有的优势,同样可以在模式识别中得到广泛应用。研究了基于IFS的模板匹配方法,先根据模式提取IFS代码,然后对该代码进行识别。在IFS代码的提取过程中,仿射变换矩阵形式是一个主要工具,其理论根据是分形几何中的拼贴定理,从对搜索图中的子图三角形图案提取IFS代码的整个过程来看,其IFS代码作为模板匹配的特征来提取,具有计算量小,提取方法简单等特点,还给出了根据各迭代函  相似文献   

20.
面向文物鉴定本体的基础模型与建模环境   总被引:3,自引:1,他引:2  
建立面向文物鉴定本体的基础模型环境是文物数字化和建立数字博物馆的基础,其核心文物鉴定基本模型(FMA2)是一个关于可移动文物结构化组织的概念及概念间关系的领域本体,包含了从构成文物器物的材料对象以及与它们关联的非材料实体(时间、空间、面、线和点),用以描述文物器物结构化的关系.提出了基本模型及其建模环境包括本体的定义及方法论、一个四元组的高级模式、一组准则和基于帧的创作环境.建议FMA2作为文物信息学的一种参考本体,以使在文物鉴定中不同的观点能相互关联,矫正在文物信息学本体中现有的和新发现的本体,并提供用于表示文物功能的结构化模板,使文物数字化过程中统一语义标注并提高本体的重用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号