首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 134 毫秒
1.
针对最大间距准则算法中训练样本类内平均值并不能对类内中心做精确估计的问题,提出一种基于中间值的最大间距准则特征提取方法.首先应用样本中间值代替样本的平均值来重新定义类间散度矩阵和类内散度矩阵,然后根据最大间距准则思想得到最优投影矩阵,最后利用三阶近邻分类器进行分类识别.在ORL、Yale和FERET人脸图像库上的仿真实验结果表明,该方法不仅提高了人脸识别率,而且具有较强的鲁棒性.  相似文献   

2.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法.  相似文献   

3.
非线性支持向量机通过核函数将低维输入空间的数据映射到高维空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性可分问题.分析了非线性支持向量机中核函数的引入可造成分类阈值的偏移问题,提出了非线性支持向量机分类阈值的优化设置方法.实验表明,所提出的阈值优化设置方法能有效提高非线性支持向量机的分类精度.  相似文献   

4.
一种基于KCCA的小样本脸像鉴别方法   总被引:5,自引:0,他引:5  
基于典型相关分析和Fisher线性鉴别分析的等价性,提出了利用核典型相关分析来抽取小样本人脸图像的非线性鉴别特征,并用其进行脸像鉴别.这样得到的非线性特征本质上等价于核Fisher非线性最佳鉴别特征.基于ORL库的实验表明,对小样本人脸图像,KCCA可以得到和广义鉴别分析近似的识别性能,其所得非线性特征明显优于FLDA的线性鉴别特征.  相似文献   

5.
特征提取的本质就是变换.针对传统核主成分分析(KPCA)在分类问题中所提取出的特征组合的不足,提出了一种基于信息度量改进的KPCA算法.数据集使用广泛应用的KDDCUP99安全审计数据集,用训练样本各特征向量的类内聚集程度和类间离散程度所组成的信息度量来代替传统KPCA中的累积贡献率,选取有利于分类的特征组合.实验结果表明,改进的KPCA方法在较低的维数下就具有较明显的分类效果.  相似文献   

6.
传统的基于PCA-HOG特征的行人头部分类算法存在降维后的子空间鉴别性不足的问题.为此,提出一种基于分步降维HOG-LBP特征的行人头部分类算法.首先,利用样本类别标签构建2类样本的HOG特征集合,在这2类特征集合中分别执行PCA降维,然后将所得的特征与LBP纹理特征进行级联得到最终的头部描述算子,最后通过训练SVM分类器对实际样本集进行分类.实验结果表明,与传统PCA降维方法相比,该方法可有效提高行人头部的分类性能.  相似文献   

7.
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类. 在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选. 依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别. 实验表明,该方法可有效降低特征空间维数,在提高分类效率的同时保证了分类效果,F1值略有提高. 与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该方法的F1值明显高于其他3种方法,综合分类效果与SVM相当,优于KNN和Bayes.  相似文献   

8.
通过反对称四维二阶张量F_(uv)在洛伦兹变换下的性质,证明了麦克斯韦方程组中电场强度旋度方程和磁感应强度散度方程具有协变性;利用四维矢势A_u满足的达朗贝尔方程的协变性,证明了麦克斯韦方程组中电场强度散度方程和磁感应强度旋度方程具有协变性.  相似文献   

9.
将最近特征线(NFL)、特征面(NFP)和特征子空间(NFS)分类方法推广为基于核的NFL、NFP和NFS,其优点是可直接对高维的人脸图像样本进行识别,而无需先抽取人脸图像特征,使在训练样本数较多、特征抽取在计算上难以实现的情况下也能直接识别.其中对KNFS得出了两种计算方法,一是KNFP的直接推广,二是利用核主分量分析构造非线性特征子空间.基于ORL和YALE数据库的实验验证了此方法直接识别高维人脸图像的有效性.  相似文献   

10.
文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个Attention CNN层的A-CNN文本分类模型.其中,Attention CNN层中普通卷积层用于提取局部特征,Attention机制用于生成非局部相关度特征.最后,使用A-CNN模型分别在情感分析、问题分类、问题答案选择等数据集上进行了实验和对比分析.结果表明:相比于其他对比模型,A-CNN模型完成上述3个文本分类任务时的最高精度分别提高了1.9%、4.3%、0.6%,可见A-CNN模型在文本分类任务中具有较高的精度和较强的通用性.  相似文献   

11.
针对戴眼镜人脸识别问题,提出了二维有监督测地线判别投影(2D Supervised Geodesic Discriminant Projection,2DSGDP)方法.该方法在扩充虚拟样本库的基础上,分析戴眼镜人脸图像和不戴眼镜人脸图像,及戴不同眼镜人脸图像的差异,提取判别特征用于识别.该特征同时考虑类内类间差异,寻...  相似文献   

12.
基于支持向量机的文本分类技术研究   总被引:2,自引:2,他引:0  
介绍了文本分类的基本过程,讨论了常用的文本分类方法如K-最近邻分类算法K-NN(K-Nearest Neighbors,K-NN)、朴素贝叶斯分类算法NB(Naive Bayesian Classifier,NB)、决策树分类算法DT(Decision Trees,DT),并探讨了基于支撑向量机SVM(Support Vector Machines,SVM)的文本分类基本原理及方法.  相似文献   

13.
KNN算法是一种应用广泛的人工智能算法,在文本分类应用中,简单有效,易于实现.但是,KNN分类的时间复杂度与训练样本数量成正比,而且,训练样本分布密度的不均匀性将导致分类准确性的下降.本文在KNN算法的基础上,提出一种改进算法.算法分析了训练样本的分布密度,通过裁减高密度区域训练样本,降低样本数量,调节训练样本分布,达到提高分类准确性的目的.实验证明,基于密度的改进KNN文本分类算法在降低时间复杂度的同时,还具有较好的准确率和召回率.  相似文献   

14.
基于文本表示的特征项权值确定方法研究   总被引:6,自引:2,他引:4  
文本表示中特征项的权值确定方法决定了文本特征的提取,在很大程度上影响了文本分类的准确率,通过系统总结常用的几种特征项权值的确定方法,并逐一比较分析和研究,提出了一种性能较好的确定方法——据位定权函数,经实验验证据位定权函数确实能够有效地提高文本分类的准确性。  相似文献   

15.
为了解决文本自动分类问题,从解决支持向量机模式支持限制问题入手,以级连概念为指导思想,构造了多层级连式支持向量机模型,提出一种文本自动分类算法,以便处理多个模式的分类问题。由于支持向量机本质上是一种非线性数据处理工具,对于复杂的两类模式分类问题已表现出良好的适应性,而且支持向量机用于模式识别不存在局部极小值问题,且不需进行网络迭代训练,求解速度明显高于神经网络。通过以CNKI文档数据为例进行算法实践,试验结果表明支持向量机用于模式分类的实现步骤比较简单,不需要长时间的训练过程,只需根据初始样本在空间的分布特性求解最优超平面(即找出支持向量),进而确定决策函数,然后即可泛化推广识别其他待识别的同类样本。  相似文献   

16.
数据建模优化在多特征提取领域应用广泛,基于统计特征和基于结构特征的识别算法需要在数学建模优化下实施,可以改变图像的输入结构,从而能够对图形的统计特征进行提取,采取网格划分方法,对图像进行划分,然后对网格内文字像素进行比对,保证文字图像能够通过细分类模式进行识别.  相似文献   

17.
本文提出了一种将特征生成和长短期记忆(long short term memory,LSTM)模型相结合的网络流量分类方法。该方法采用矩阵乘法特征生成方式,分析对比了不同特征生成方法的分类性能。通过实验比较了原数据和特征数据在分类问题上的准确性,并比较了卷积神经网络(convolutional neural network,CNN)和本文方法用于网络流分类的效果。在统计特征时采用核函数,使其可以适应LSTM输入维度,获得更佳的分类效果。对真实网络流数据的实验结果表明,本文方法在细分类中的准确度可达93.9%,而在粗分类任务中可达99.2%,其性能明显优于现有其他分类方法。  相似文献   

18.
基于KPCA及最佳鉴别独立分量的人脸识别方法   总被引:1,自引:0,他引:1  
首先分析了独立分量分析(ICA)在人脸识别应用中存在的一些问题,然后从3个方面对基于独立分量分析的人脸识别方法进行了改进:首先利用KPCA将人脸映射到特征空间,在特征空间进行ICA得到相对于原样本的非线性独立分量,从而得到一种非线性独立分量分析的方法;其次,定义了Fisher鉴别信息作为选取最佳鉴别独立分量的准则;最后,提出了一种用最佳独立分量表示待识别人脸图像的方法,克服了用直接投影得到的特征不准确的问题.基于ORL人脸数据库的实验表明,利用此改进的非线性最佳鉴别ICA方法,可以得到优于FLDA方法的识别性能,且在特征数较少时仍能得到较好的识别稳定性.  相似文献   

19.
重复短语识别是网页文本的特征抽取过程中的关键性技术之一,通过重复短语的识别能够有效地解决网页文本内容特征抽取的难题.研究利用后缀数组进行重复短语识别和抽取的方法.实验表明,该方法进行重复短语识别后,得到的特征向量对于源网页文本的表示更具有代表性,网页相关性的挖掘可以获得更好效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号