首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率.  相似文献   

2.
一种基于分类精度的特征选择支持向量机   总被引:1,自引:0,他引:1  
在综合序列前向选择(sequential forward selection,SFS)方法和广义序列前向选择(generalized sequential forward selection,GSFS)方法的基础上,提出了基于分类精度的特征选取(sequential forward selection based on classification accuracy, CA-SFS)方法。它依次改变GSFS方法中的r值,并以支持向量机(support vector machine,SVM)作为分类器,将得出的分类精度作为准则函数对特征进行取舍。仿真实验表明CA-SFS算法不但选择了较少的特征,而且取得了较好的分类效果。  相似文献   

3.
文档分类之特征选择方法的实验比较   总被引:2,自引:1,他引:1  
在自动化信息处理中,由于大量信息是基于文字表达的,使得文本分类成为其核心任务之一.其中,相比较其他分类算法,基于类中心的文档分类方法凭借其极高的效率和较好的性能得到了更广泛的应用.然而,该分类方法的性能很大程度上取决于文本的特征空间表示.在此将4种较大差异的特征选择方法作为预处理方法,构造适合类中心点分类的特征空间,对它们的性能进行分析.实验表明,基于支持向量机的特征选择方法不仅有较好的最低错误率,并且对选择的特征数目不敏感,因此我们推荐在实际应用中使用基于支持向量机的特征选择方法作为基于类中心的文档分类算法的预处理.  相似文献   

4.
由于数据具有海量、高相关性和非线性的特点,所以如何选择原始数据的本质特征,是关系到能否有效提高问题分类器推广能力的关键问题。本文讨论了目前基于所有特征以及词袋和词序列袋的特征选择方法,提出了采用随机森林和支持向量机(SVM)相结合的方法来进行特征选择。实验证明,此方法能够有效地选择分类特征,从而提升问题分类的效率和精度。  相似文献   

5.
针对目前特征选择算法均存在容易陷入局部最优、迭代后期收敛速度慢的缺陷,提出一种基于云模型和支持向量机(Support Vector Machine,SVM)的入侵检测特征选择方法,该方法采用逆向云发生器从真实训练数据中得到云的数字特征,形成实际判断规则,实现正常数据建模,把网络入侵检测正确率作为SVM参数优化目标函数,以提高入侵检测的正确率.在KDDCUP1999数据集上进行仿真实验,结果表明该方法能更有效地精简网络数据特征,能够有效地解决入侵检测中存在的特征选择问题,并在保证较高检测率的基础上,对不同类型的攻击检测具有良好的均衡性.  相似文献   

6.
针对样本和高维数据,研究基于支持向量机的特征选择算法及其在高校就业预测中的应用.利用采集的就业数据,使用SVM方法对数据集进行特征选择,再利用SVM分类器对数据进行已就业和未就业学生的分类,得到了较好的预测结果,为高校就业指导提供了一定的依据.  相似文献   

7.
在经典特征选择算法的基础上,提出一种带专业词库的特征选择方法.在训练分类模型的时候,适当加重属于专业词汇的特征的权重.这种方法能够有效地避免特征选择时误删有用的低频词,因此,适合用于短文本的分类(电子邮件等).实验结果表明,本方法在抽取特征维数较少时,分类准确率提高约3%.  相似文献   

8.
垃圾邮件数量庞大、伪装形式多种多样,给反垃圾邮件带来了巨大的挑战。提出了一个基于行为和时间特征的垃圾邮件检测方法。根据邮件收发记录分析基于社会网络的行为特征和基于邮件发送间隔的时间特征,采用步进式判别分析方法,选择具有较强判别能力的行为特征,形成特征子空间,将训练样本投影到特征子空间。使用带标签的训练样本训练支持向量机SVM,形成邮件决策信息,以此检测出垃圾邮件。利用最近3年真实邮件数据,从不同的角度进行了对比实验。结果证明,提出的行为与时间特征能有效提升垃圾邮件检测的准确率和查全率,其整体性能优于其他的基于行为的垃圾邮件检测方法。  相似文献   

9.
基于特征贡献度的特征选择方法在文本分类中应用   总被引:1,自引:0,他引:1  
在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果.  相似文献   

10.
主要研究了基于支持向量机的特征选择方法——特征权法,通过对两组数据进行试验,说明了特征权法在分类效果上优于F-得分法和支持向量机.  相似文献   

11.
一种改进的嵌入式特征选择算法及应用   总被引:1,自引:0,他引:1       下载免费PDF全文
针对非线性多分类问题,提出了一个改进的嵌入最小-最大值特征选择算法,并与支持向量机算法结合,提出了针对复杂的组合优化问题的启发式算法.为验证方法的有效性,在钢板缺陷识别工程数据集上进行了实验,表明所提出的方法具有较高的求解速度和预测准确度.  相似文献   

12.
通过结合部分自适应弹性网络惩罚和hinge损失函数,提出了一种能同时进行微阵列分类和基因选择的自适应双正则化支持向量机模型,并证明了该支持向量机具有自适应群体基因选择性能.  相似文献   

13.
为了提高网络入侵检测正确率,利用特征选择和支持向量机(SVM)参数间的相互联系,提出一种特征选择和SVM参数联同步优化的网络入侵检测算法.该算法首先将网络入侵检测正确率作为问题优化的目标函数,网络特征和SVM参数作为约束条件建立数学模型,然后通过遗传算法对数学模型进行求解,找到最优特征子集和SVM参数,最后利用KDD 1999数据集对算法性能进行测试.结果表明,相对于其他入侵检测算法,同步优化算法能够较快选择最优特征与SVM参数,有效提高了网络入侵检测正确率,加快了网络入侵检测速度.  相似文献   

14.
文本信息中存在的模糊性和不确定性在很大程度上影响文本情感观点的准确判定.为了提高文本情感分类准确率,提出基于混合特征云模型和支持向量机的多级文本情感分类算法.首先,将文本的TF-IDF权重特征和词性特征相结合,采用信息增益法选取特征的同时对特征降维;然后,在文档混合特征向量集上生成云向量模型,依据模型间的相似度筛选出相似度较大的R个文档,作为支持向量机的输入.实验结果表明,该算法具有良好的分类准确率,且系统的训练速度有显著的提高.  相似文献   

15.
基于人工鱼群算法的储粮害虫特征选择   总被引:2,自引:1,他引:1  
储粮害虫特征选择是粮虫图像识别中的一个核心问题.提出基于人工鱼群算法的特征选择,并给出了基于二进制编码寻优的实现方法.以交叉验证训练模型的识别率作为特征子集的性能评价准则,将人工鱼群算法应用于粮虫的特征选择.该算法从粮虫的17维形态学特征中自动选择出面积、周长等7个特征所组成的最优特征子集,采用参数优化之后的SVM分类器对90个粮虫样本进行分类,识别率达到95.5%以上,并与PCA法、GA法和原始特征法进行对比,结果表明人工鱼群算法降低了特征空间的维数,提高了分类器的识别率,证实了基于人工鱼群算法的粮虫特征选择是可行的.  相似文献   

16.
提出一种采用均匀设计与最小二乘支持向量机相结合的电容层析成像传感器结构参数优化方法.该方法以敏感场均匀度为设计目标,采用均匀设计安排试验,试验因素包括ECT传感器的4个重要参数即:极板张角,绝缘管道材料相对介电常数,管道壁厚,以及屏蔽罩与电容极板间的间距.运用最小二乘支持向量机对试验结果进行回归分析,并用因素轮换法进行寻优计算,从而得出优化的传感器结构参数.结果表明:经过优化的电容成像系统具有较好的成像效果.该方法试验次数少,具有较强的实用性.  相似文献   

17.
关于支持向量机参数选择方法分析   总被引:20,自引:0,他引:20  
在分析支持向量机(SVM)原理基础上,分析了SVM中核函数、核参数及惩罚参数C的影响。介绍了两种SVM参数选择方法,作了深入比较,并提出了一种改进的最优化方法。  相似文献   

18.
基于特征选择和支持向量机的异常检测   总被引:1,自引:0,他引:1  
为在提高检测率的同时保持较低的虚警率,提出一种不同于单一算法的基于特征选择和支持向量机的异常检测技术.首先用一个数据子集进行特征选择,通过构造函数来计算特征间的相似度,并在不失样本信息的前提下,完成会话样本的特征选择;然后对用于训练和测试的数据执行特征选择,剔除不必要的数据特征;最后利用支持向量机来判断入侵.仿真实验表明:与基于标准的支持向量机、基于tf×idf的支持向量机、基于tf×idf的神经网络及基于数据挖掘等的异常检测相比较,该方法具有更高检测率,同时其虚警率也更低.  相似文献   

19.
基于免疫克隆选择算法的特征选择   总被引:12,自引:0,他引:12  
提出了一种基于免疫克隆选择算法的特征选择方法.特征选择可以被看成是一个组合优化问题,利用免疫克隆选择算法快速收敛于全局最优的特性,加快搜索到最优特征子集的速度,为后续模式分类提供良好的判别依据.实验结果表明算法在保持甚至提高分类精度的同时,有效地降低了特征维数.与基于遗传算法特征选择的结果相比较,在有限代数内,该算法能收敛到更优的特征子集,从而验证了算法的有效性及其应用潜力.  相似文献   

20.
在特征空间中将样本做分离,将高维的二次规划问题化成数个低维的二次规划问题的组合,大大降低了训练SVM的运算量,而又基本不损害SVM的性能,这为SVM在模式分类中的实时应用创造了条件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号