共查询到19条相似文献,搜索用时 134 毫秒
1.
针对最大间距准则算法中训练样本类内平均值并不能对类内中心做精确估计的问题,提出一种基于中间值的最大间距准则特征提取方法.首先应用样本中间值代替样本的平均值来重新定义类间散度矩阵和类内散度矩阵,然后根据最大间距准则思想得到最优投影矩阵,最后利用三阶近邻分类器进行分类识别.在ORL、Yale和FERET人脸图像库上的仿真实验结果表明,该方法不仅提高了人脸识别率,而且具有较强的鲁棒性. 相似文献
2.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法. 相似文献
3.
非线性支持向量机通过核函数将低维输入空间的数据映射到高维空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性可分问题.分析了非线性支持向量机中核函数的引入可造成分类阈值的偏移问题,提出了非线性支持向量机分类阈值的优化设置方法.实验表明,所提出的阈值优化设置方法能有效提高非线性支持向量机的分类精度. 相似文献
4.
5.
6.
传统的基于PCA-HOG特征的行人头部分类算法存在降维后的子空间鉴别性不足的问题.为此,提出一种基于分步降维HOG-LBP特征的行人头部分类算法.首先,利用样本类别标签构建2类样本的HOG特征集合,在这2类特征集合中分别执行PCA降维,然后将所得的特征与LBP纹理特征进行级联得到最终的头部描述算子,最后通过训练SVM分类器对实际样本集进行分类.实验结果表明,与传统PCA降维方法相比,该方法可有效提高行人头部的分类性能. 相似文献
7.
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类. 在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选. 依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别. 实验表明,该方法可有效降低特征空间维数,在提高分类效率的同时保证了分类效果,F1值略有提高. 与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该方法的F1值明显高于其他3种方法,综合分类效果与SVM相当,优于KNN和Bayes. 相似文献
8.
9.
10.
《应用科学学报》2019,(4)
文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个Attention CNN层的A-CNN文本分类模型.其中,Attention CNN层中普通卷积层用于提取局部特征,Attention机制用于生成非局部相关度特征.最后,使用A-CNN模型分别在情感分析、问题分类、问题答案选择等数据集上进行了实验和对比分析.结果表明:相比于其他对比模型,A-CNN模型完成上述3个文本分类任务时的最高精度分别提高了1.9%、4.3%、0.6%,可见A-CNN模型在文本分类任务中具有较高的精度和较强的通用性. 相似文献
11.
针对戴眼镜人脸识别问题,提出了二维有监督测地线判别投影(2D Supervised Geodesic Discriminant Projection,2DSGDP)方法.该方法在扩充虚拟样本库的基础上,分析戴眼镜人脸图像和不戴眼镜人脸图像,及戴不同眼镜人脸图像的差异,提取判别特征用于识别.该特征同时考虑类内类间差异,寻... 相似文献
12.
13.
14.
15.
为了解决文本自动分类问题,从解决支持向量机模式支持限制问题入手,以级连概念为指导思想,构造了多层级连式支持向量机模型,提出一种文本自动分类算法,以便处理多个模式的分类问题。由于支持向量机本质上是一种非线性数据处理工具,对于复杂的两类模式分类问题已表现出良好的适应性,而且支持向量机用于模式识别不存在局部极小值问题,且不需进行网络迭代训练,求解速度明显高于神经网络。通过以CNKI文档数据为例进行算法实践,试验结果表明支持向量机用于模式分类的实现步骤比较简单,不需要长时间的训练过程,只需根据初始样本在空间的分布特性求解最优超平面(即找出支持向量),进而确定决策函数,然后即可泛化推广识别其他待识别的同类样本。 相似文献
16.
李华平 《哈尔滨师范大学自然科学学报》2013,(4):21-24
数据建模优化在多特征提取领域应用广泛,基于统计特征和基于结构特征的识别算法需要在数学建模优化下实施,可以改变图像的输入结构,从而能够对图形的统计特征进行提取,采取网格划分方法,对图像进行划分,然后对网格内文字像素进行比对,保证文字图像能够通过细分类模式进行识别. 相似文献
17.
本文提出了一种将特征生成和长短期记忆(long short term memory,LSTM)模型相结合的网络流量分类方法。该方法采用矩阵乘法特征生成方式,分析对比了不同特征生成方法的分类性能。通过实验比较了原数据和特征数据在分类问题上的准确性,并比较了卷积神经网络(convolutional neural network,CNN)和本文方法用于网络流分类的效果。在统计特征时采用核函数,使其可以适应LSTM输入维度,获得更佳的分类效果。对真实网络流数据的实验结果表明,本文方法在细分类中的准确度可达93.9%,而在粗分类任务中可达99.2%,其性能明显优于现有其他分类方法。 相似文献
18.
基于KPCA及最佳鉴别独立分量的人脸识别方法 总被引:1,自引:0,他引:1
首先分析了独立分量分析(ICA)在人脸识别应用中存在的一些问题,然后从3个方面对基于独立分量分析的人脸识别方法进行了改进:首先利用KPCA将人脸映射到特征空间,在特征空间进行ICA得到相对于原样本的非线性独立分量,从而得到一种非线性独立分量分析的方法;其次,定义了Fisher鉴别信息作为选取最佳鉴别独立分量的准则;最后,提出了一种用最佳独立分量表示待识别人脸图像的方法,克服了用直接投影得到的特征不准确的问题.基于ORL人脸数据库的实验表明,利用此改进的非线性最佳鉴别ICA方法,可以得到优于FLDA方法的识别性能,且在特征数较少时仍能得到较好的识别稳定性. 相似文献
19.
重复短语识别是网页文本的特征抽取过程中的关键性技术之一,通过重复短语的识别能够有效地解决网页文本内容特征抽取的难题.研究利用后缀数组进行重复短语识别和抽取的方法.实验表明,该方法进行重复短语识别后,得到的特征向量对于源网页文本的表示更具有代表性,网页相关性的挖掘可以获得更好效果. 相似文献