首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
针对词袋模型统计聚集算法忽略了编码矢量的其它统计特征信息及空间信息,并且只能与常用核函数相配合度量图像之间相似性的问题,该文提出一种基于空间概率乘积核函数的图像分类(SPPKBIG)算法。使用Parzen窗方法估计编码矢量所服从的概率密度分布,用来描述图像内容,使用空间概率乘积核函数构建图像之间的核矩阵,最后使用基于此核矩阵的支持向量机对图像进行分类。实验结果表明,SPPKBIC算法对15类场景数据集和MSRcv2数据集的平均分类正确率分别为84.1%和94.8%。  相似文献   

2.
阐述了藏文Web不良信息的特点、类型、危害性,设计了倾向性藏文Web不良文本过滤系统结构.提出一种藏文Web不良文本检索算法.该算法从不良文本中提取倾向性关键词项,根据矩阵奇异值分解方法中的转移概率构造出倾向性关键词项的状态矩阵,提取平面坐标空间第一像限的奇异值向量作为复特征向量,利用向量间的余弦相似度作为文本检索的相似度度量.实验结果表明,该算法在检索准确率和运算效率上都优于传统的LSA算法.  相似文献   

3.
为了实现自动高效且结果准确的生物神经元识别,提出一种基于模式识别与图像灰度共生矩阵特征的神经元自动分类方法。该方法通过对生物神经元图像预处理,计算图像的灰度共生矩阵,统计各图像灰度共生矩阵属性值的平均值和标准差,构建生物神经元类别的特征空间,利用模式识别中的人工神经网络方法建立特征空间与神经元类别之间的映射关系。采用收集的160幅生物神经元图像对该方法进行实验分析,测试集的识别正确率达93.8%。研究结果表明,结合模式识别与图像灰度共生矩阵特征的生物神经元图像自动分类方法具有较高的准确性与可靠性。  相似文献   

4.
为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题。算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入二值化差值算法和改进后的Jaro-Winkler Distance算法分别对其进行相似度计算,2个相似度分别从不同方面反映汉字的相似程度,吸取2种方法的优势对其进行融合,得到最终字形相似度。实验结果表明,该算法在字形检索中较3元组递归算法准确率提高27.8%,较模板匹配算法、结构方法、神经网络算法执行效率平均提高约66.7%,该算法不仅可以有效解决形近字检索中的准确性问题,同时效率也得以优化。  相似文献   

5.
针对词袋模型中的聚集算法对编码矢量之间空间关系信息或者概率分布信息单独建立数学模型,将马尔可夫随机场模型中的拟合参数矢量集合视为编码矢量的聚集矢量集合,计算每个聚集矢量对应的两两图像之间的核矩阵,然后使用基于支持向量机的多核学习方法求解核矩阵的最优线性组合系数以及支持向量系数,最后使用所得训练模型对测试图像进行分类.对于15类场景数据集和Caltech 101数据集,本文算法的分类正确率达到82.67%和62.94%,与其他算法相比具有更高的平均分类正确率.  相似文献   

6.
苟和平 《科学技术与工程》2012,12(20):4926-4929
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。  相似文献   

7.
在无约束条件下,人脸表情、姿态、光照以及背景等复杂因素可能导致人脸图像的类内变化大于类间变化.针对如何降低较大的类内变化对人脸验证研究的影响,本文结合加权子空间,提出了一种带先验相似性和先验距离约束的相似度度量学习方法.首先,利用类内人脸对样本,学习带权重的类内协方差矩阵,通过加权子空间的投影,从人脸图像中获得鲁棒性的人脸特征表达;其次,利用样本对的相似性与差异性,建立了带先验相似性和先验距离约束的相似度度量学习模型,优化后的度量矩阵可以有效提高特征向量的类内鲁棒性和类间判别性;最后,利用优化的度量矩阵计算人脸对的相似度.在LFW(Labeled Faces in the Wild)数据集的实验验证了所提模型的有效性,与其它同类相似度度量学习方法相比,优化的度量矩阵更能准确地评估人脸间的相似性,并在受限训练集上取得了91.2%的识别率.  相似文献   

8.
在协同模式识别中,学习可以归结为求原型向量和伴随向量.文中提出了一种基于核函数映射的学习算法,输入向量被隐式地映射到一个可分性有所提高的向量空间,然后计算变换后的原型向量.对伴随向量增加一个附加的约束以避免它的范数超过一定值,从而改善伴随向量的性能,减少误识别.通过对数字、英文字母和汉字等的训练实验表明,这种算法得到的伴随向量能更好地表示样本的特征,计算所得的初始序参量能更好地反映测试图像与训练样本之间的相似程度.  相似文献   

9.
基于稀疏表示分类(SRC,sparse representation for classification)是近年来模式识别领域中备受关注的一个研究热点。当每类训练样本较少时,SRC的识别效果往往不理想。为解决此问题,人们提出了拓展的稀疏表示分类算法。它引入了训练样本的类内变量矩阵,来补充每类训练样本信息。但是,该方法很难获取普遍存在于复杂数据如图像中的非线性信息。为此,提出了特征空间中的拓展稀疏人脸识别算法。该算法将样本集非线性映射到新的特征空间中,计算每个训练样本在表示测试样本时所做的贡献。根据贡献大小,给每个训练样本赋予一定的权重。同时,利用类内变量矩阵,共同表示测试样本。实验表明所提出的算法优于其它经典稀疏表示分类算法。  相似文献   

10.
提出了一种基于稀疏表示和低秩矩阵逼近的图像去噪算法:首先,通过对图像块的数据矩阵进行奇异值分解和全局子空间分析,确定信号子空间和噪声子空间;其次,利用图像块与信号子空间的距离寻找相似块,并将相似块分组为训练样本;再次,对相似块矩阵进行奇异值分解,并确定表示相似块的奇异向量;最后,去除表示噪声的基.实验结果表明,该算法能...  相似文献   

11.
利用计算机进行字符自动识别与录入的技术对机器翻译、数据挖掘、人工智能等都有着重要的理论意义和实用价值,基于数字图像处理技术的字符识别是其中的一个重要发展方向。文章重点研究了字符特征提取和匹配识别这两个影响字符识别效果的因素,根据中文字符笔画的方向特点,选择了对图像方向特征敏感的Gabor变换作为特征提取方式,在获取字符的特征向量后,先利用最小距离分类器进行预分类,再利用最小距离分类中产生的候选样本集训练SVM分类器,识别时只需利用候选集分类器依次判决,降低了训练和识别工作量,同时提高了识别效率。实验表明,系统对网站导航字符平均识别率达94%以上,具有一定的理论意义和实用价值。  相似文献   

12.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类.  相似文献   

13.
为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。  相似文献   

14.
提出了一种改进模板匹配的车牌字符识别方法。详细介绍了车牌字符识别的过程,主要包括模板的建立,基于弹性网格的字符特征提取,模板匹配的步骤及改进方法。运用该方法不仅可减少计算量,而且提高了实时性。实验结果表明,提出的方法具有效率高、精确度好等特点,识别率可以达到90%以上。  相似文献   

15.
特征抽取是识别中的重要步骤,提取描述性强的特征能够有效提高分类器的识别效率。在提出有关概念的基础上,介绍了特征行抽取在字符过程中的两个重要应用。首先,在分类识别时可用作匹配的特征向量,通过双向匹配来识别独立的字符。其次,可在识别粘连字符时用于预测前端字符,并在提取前端字符后对预测结果进行验证,从而达到准确分割和识别粘连字符的目的。还详细描述了交互确定特征行的方法。最后根据实验数据对字符特征行的应用价值作出了评价。  相似文献   

16.
针对中文产品命名实体,提出了一种基于多种特征融合的识别方法。该方法以词为标注粒度,将多种特征融合到条件随机场模型中,采用递增式学习策略选取最优的特征模板,实现了从中文自由文本中识别产品命名实体。实验表明,该方法获得了令人满意的实验效果,准确率、召回率和F值分别达到94.87%、92.50%和93.67%。  相似文献   

17.
针对合成孔径雷达(synthetic aperture radar,SAR)图像样本数据有限,且不同类别间的图像区分度不高导致识别困难的问题,提出一种应用于SAR图像识别的距离度量学习方法.该方法使用CNN网络得到图像的特征分布,利用LSTM网络加强图像间的关联性,基于余弦相似距离度量方法计算图像之间的匹配度,通过注意力机制后对结果进行分类.训练过程结合小样本学习的训练方式,采取预训练的策略进行实验.实验以公开的MSTAR数据集进行SAR图像识别,结果表明该方法准确率达到99.3%,比SVM方法提升2.5%.   相似文献   

18.
一种基于VSM文本分类系统的设计与实现   总被引:10,自引:0,他引:10  
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % .  相似文献   

19.
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量 (scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络 (Recurrent Neural Network, RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比glyph and meaning to vector (GnM2Vec)、Character-enhanced Word Embedding (CWE)等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。  相似文献   

20.
智慧园区的建设推动着企业与城市的发展,传统的园区管理方式已不再适用于产业融合创新的智慧园区。以曹家滩园区为例,设计智慧园区平台总体框架,针对园区中身份识别存在识别环境差、效率低、准确率低等问题,提出一种基于多模态多核学习的身份识别算法。所提算法将视频数据中的数据分为图像、音频,并采集个人信息的文本,并将三种模态的信息输入同一样本空间中,通过引入间隔约束的多核学习算法,保留不同模态的差异性和相似性,并进行特征融合与决策融合,最终采用分类器与评分机制输出身份识别结果。通过公开的视频数据集与曹家滩园区数据集进行实验,实验结果表明本文所提算法最高准确率达到97.2%,与传统算法相比有较大优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号