首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度.  相似文献   

2.
文本信息中存在的模糊性和不确定性在很大程度上影响文本情感观点的准确判定.为了提高文本情感分类准确率,提出基于混合特征云模型和支持向量机的多级文本情感分类算法.首先,将文本的TF-IDF权重特征和词性特征相结合,采用信息增益法选取特征的同时对特征降维;然后,在文档混合特征向量集上生成云向量模型,依据模型间的相似度筛选出相似度较大的R个文档,作为支持向量机的输入.实验结果表明,该算法具有良好的分类准确率,且系统的训练速度有显著的提高.  相似文献   

3.
改进了基于参数化间隔的双子支持向量机算法的预处理过程,在数据预处理阶段使用了主成分分析法对数据进行降维,提出了基于主成分分析的参数化间隔双子支持向量机,从而加快了整个算法的训练速度.公共数据库上的实验结果显示了该算法的优秀分类能力,对高维数据集的降维效果也比较成功.最后,将这种算法应用到手写体数字识别技术上,实验结果显示出该算法较好的分类性能.  相似文献   

4.
针对中文网页文本分类中特征降维方法和传统信息增益方法的缺陷和不足做出优化改进,旨在有效提高文本分类效率和精度.首先,采取词性过滤和同义词归并处理对特征项进行初次特征降维,然后提出改进的信息增益方法对特征项进行特征加权运算,最后采用支持向量机(SVM)分类算法对中文网页进行文本分类.理论分析和实验结果都表明本方法比传统方法具有更好的性能和分类效果.  相似文献   

5.
针对KNN文本分类算法在高维数据集上分类计算开销大、效率低的缺点,采用一种基于矩阵奇异值分解的文本特征向量降维方法实现向量降维的同时保留更多的分类信息.同时,采用信息增益的方式对原始文本特征词进行了初步筛选,过滤掉对分类系统几乎没有贡献的特征词,以克服文本特征维数增长所带来的奇异值分解计算开销过大的缺点.实验表明此方法能在保持分类精度的同时极大地降低分类计算开销.  相似文献   

6.
随机森林算法是一种高度灵活且易于使用的机器学习算法,目前在遥感影像分类中应用广泛。为了验证其在城市土地覆盖分类中的效果,本文对河南省洛阳市局部城区进行了土地覆盖分类实验,将Landsat 8(OLI)遥感影像的光谱波段、光谱指数和纹理特征相结合,构成多种特征组合进行随机森林算法分类比较,选择分类效果最佳方案,并与支持向量机方法进行比较。后利用随机森林算法对该组合特征变量高维数据进行降维处理,得到优化特征方案。实验结果表明:采用多源特征组合的随机森林算法的土地利用分类效果最佳,总体精度为90.54%,Kappa系数为0.890,比支持向量机方法的分类精度提高了3.1%;降维处理后的特征方案与随机森林结合在保证分类结果拥有高准确度的同时,减少了运算时间,实现了土地覆被类型信息的高效获取。表明随机森林算法在城区土地覆盖分类上有很好的适用性与稳定性。  相似文献   

7.
为了提高X射线焊缝缺陷分类的识别率,提出将拉普拉斯特征映射(Laplacian Eigenmaps,LE)算法与支持向量机(Support Vector Machine,SVM)算法相结合应用于焊管焊缝缺陷检测。该方法首先提取焊缝缺陷的形状和几何特征,然后通过极大似然估计值(Maximum Likelihood Estimation,MLE)法对提取的7维样本特征进行本征维数估计并利用拉普拉斯特征映射法对各类特征向量进行降维处理,最后分别采用支持向量机和BP神经网络进行分类对比实验。实验表明,基于SVM及LE降维的X射线焊缝缺陷分类算法具有较高的识别精度,平均分类准确率达93%,能够较准确地对焊缝缺陷进行分类识别。  相似文献   

8.
针对基于颜色特征的图像检索中的图像特征降维问题,提出了自适应局部保持映射(ALPP:Adaptive Locality Preserving Projection)的图像特征降维算法.在考虑了每个特征向量与其近邻关系的基础上,通过研究贝叶斯准则在图像分类中的作用,将聚类引入降维算法中,解决特征空间维数的自适应确定问题.使降维结果既保证了最大化地消除高维向量间的相关性和冗余度,又不破坏原始数据近邻间的拓扑结构.实验结果表明,对Coral图像库,应用HSV直方图特征,在查询返回图像为50幅的情况下,基于ALPP算法图像检索的查准率为67.7%,查全率为57.3%.相对PCA(Principal Component Analysis)算法的查准率(45.8%)和查全率(49.2%),具有较高的检索精度.  相似文献   

9.
针对轴承故障检测中特征融合导致的维度高、相关性强等问题,提出一种采用规范化局部保持投影算法(LPP)的轴承故障诊断(En-LPP)方法。首先,采用熵规范化的方法将相似度矩阵结合到传统LPP算法的优化函数中,与投影向量一并求解,得到一种规范化LPP降维算法;然后对原始轴承振动信号进行小波变换和经验模式分解得到10条信号分量,每个分量通过计算平均值、均方根等,提取12维统计特征,经归一化后生成特征向量;然后将特征向量输入到规范化LPP降维算法中进行迭代共同求解,得到满足终止条件的相似度矩阵和投影向量;最后利用降维后的特征集训练极限学习机模型确定轴承最终工作状态以实现故障检测。实验结果表明:与传统LPP方法以及其他降维方法相比,所提出的En-LPP方法对于轴承故障诊断的性能更好;在小波变换72维特征集合以及经验模式分解48维特征集合下的分类精度平均提升了7%以上;在4种不同分类器组合下的分类精度平均提升了17%以上;较好的降维特征区分能力使得En-LPP方法的故障诊断性能在不同条件组合下均具有很好的鲁棒性。  相似文献   

10.
针对人脸图像的非线性特点,将基于核方法的核独立分量分析算法用于提取人脸图像特征.为避免多类支持向量机出现不可识别域,提出基于二叉树思想的层次支持向量机算法,用于多类人脸识别.将层次支持向量机和核独立分量分析算法相结合进行人脸识别,首先对人脸图像进行预处理和主成分分析法降维;然后运用核独立分量分析算法估算出独立基影像,从而得到人脸特征;最后将人脸特征输入层次支持向量机进行分类识别.在ORL人脸库上的仿真结果表明该算法较好地兼顾了识别率和运行速率.  相似文献   

11.
SVM算法复杂度与样本维数无关,具有的泛化能力强、分类精度高的特点,而LLE是有效的非线性降维方法,本文利用支持向量机(SVM)算法对局域线性嵌入(LLE)算法进行改进,有效地解决了基于内容的图像检索中的高维特征向量的降维问题,实验表明具有较高的查全率和查准率.  相似文献   

12.
邢笑雪  姜利 《长春大学学报》2013,(12):1525-1527,1534
采用支持向量机方法( SVM)对上千维的基因表达数据分析时,算法的运行时间比较长。为了解决这种情况,本文采用了基于主成分分析的支持向量机( PCA-SVM )和基于核主成分分析的支持向量机( KPCA-SVM )两种算法对数据进行降维和分类,既可以整合基因数据的特征信息又可以缩短计算时间。本文比较了累计贡献率不同时两种算法的分类准确率,实验结果表明,PCA-SVM分类准确率与累计贡献率二者之间没有明确规律,KPCA-SVM分类准确率随累计贡献率的降低存在降低或者保持不变的趋势。  相似文献   

13.
胡婧  刘伟  马凯 《科学技术与工程》2019,19(33):296-301
为了探讨中文病历文本预处理后高维稀疏性的特点,导致文本分类精度低、算法模型收敛速度慢等性能问题,提出一种基于粗糙集的词袋(BOW)模型结合支持向量机(SVM)的文本分类算法(BOW+SVM)。该算法首先采用BOW模型对特征词提取构建高维度文本空间向量,然后利用粗糙集的属性约简算法对文本特征处理,把模糊的、冗余的属性从决策规则中清除,降低空间向量维数,最后利用所提纯的特征与SVM分类器交叉结合进行文本分类。在Python+TensorFlow环境中设计六种交叉结合的算法仿真对比实验,结果表明:基于BOW+SVM高血压病历文本分类模型精准度可达97%。可见改进后的模型,能够解决样本分部不均,克服高维度稀疏特征空间的问题,有效改善病案管理工作流程。  相似文献   

14.
提出了一种基于非负矩阵分解与支持向量机相结合的面部表情识别方法。使用直方图均衡化等方法对人脸图像进行预处理,使用非负矩阵分解算法进行表情特征提取,采用支持向量机对面部表情进行分类。以Matlab为仿真工具,在日本女性人脸表情数据库上测试。取得了66.19%的识别率。  相似文献   

15.
对随机旋转集成方法提出了一种针对降维问题的改进,得到了新的降维算法框架进行随机变换降维,可以显著减少降维过程中造成的信息损失.采用随机变换降维后,训练监督学习算法时可以获得更高的准确率和更好的泛化性能.通过在模拟数据上进行的实验,证明了使用多重共线性数据进行回归分析时,与传统降维算法相比,经随机变换降维处理后可以保留更多的信息,获得更小的均方误差.对随机变换降维在手写数字识别数据集上的表现进行了研究,证明了与一般性的降维算法相比,随机变换降维在图像分类问题上可以获得更高的准确率.  相似文献   

16.
基于投影寻踪的kNN文本分类算法的加速策略   总被引:1,自引:1,他引:0  
传统的k近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法。针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略。基本思想是:通过投影的方法缩减训练集的规模,同时在寻找k近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销。实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度。  相似文献   

17.
The quaternion multiple signal classification (Q-MUSIC) algorithm generally requires four-dimensional spectral peak search to estimate the direction of arrival (DOA) and polarization parameters, which would result in the huge computation burden. A dimension reduction Q-MUSIC algorithm (DRQ-MUSIC) based on L-shaped array is presented to reduce the computational complexity in this paper. The proposed algorithm divides the steering vector into three parts, and estimates each part separately, thus DOA and polarization parameters can be estimated only by N times one-dimensional spectral peak search, where N denotes the sources number. Besides, pair match is not required. Finally, simulation examples demonstrate the effectiveness and feasibility of the proposed algorithm.  相似文献   

18.
为了提高支持向量机(SVM)分类效率,大幅减少以高分辨率距离像(HRRP)功率谱为特征的支持向量机目标识别分类器的计算量,采用自编码神经网络深度学习方法,实现高维、非线性HRRP功率谱的数据降维。在此基础上,提出了Autoencoder-SVM模型,综合利用自编码神经网络的特征提取能力和SVM的分类能力。仿真结果显示,在HRRP功率谱降维方面,自编码神经网络的降维效果远好于核主成分分析和等距映射算法,其降维结果对SVM分类结果影响甚微,但大幅缩短了SVM的计算时间;同时,在隐层节点数相同的情况下,随着隐含层数的增加或者深度的增加,自编码神经网络数据降维或特征提取效果更好。  相似文献   

19.
文章分别使用BP、RBF等神经网络和支持向量机等非线性方法对相同的水质数据建立分类模型。使用支持向量分类机建立水质分类模型过程中,选用RBF核函数,结合归一、降维等数据预处理手段,利用网格搜索算法对参数进行寻优,得出水质分类模型。实验结果证明在非线性方法中,采用支持向量机并结合相应的数据预处理手段这种方案得出的分类准确率更高,更加具有推广性。  相似文献   

20.
中文文本数据的半结构化甚至非结构化的特点使得其分类存在着特征高维的问题,传统单一的特征降维方法难以满足大数据时代的文本分类需求.基于此,提出了一种基于卡方统计(Chi-square statistics,CHI)和主成分分析(principal component analysis,PCA)的混合特征降维方法(CHI-...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号