首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 159 毫秒
1.
针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度及分类速度慢的缺点,提出一种改进的数据挖掘模糊支持向量机分类算法.该算法首先预选有效的候选支持向量缩减训练样本集的规模提高训练速度;其次提出一种新的模糊隶属度函数,增强支持向量对构建模糊支持向量机最优分类超平面的作用,并用经过预选的训练样本集进行训练FSVM得到支持向量集;最后,运用粒子群优化算法选择最优支持向量子集,使用平均分类误差作为适应度函数,最终粒子输出时,将样本隶属度与设定阈值相比较,选择出支持向量集中相对较大隶属度的样本作为新的支持向量,提高分类速度.实验结果表明,该算法在不损失分类精度的情况下,提高了模糊支持向量机的训练速度和分类速度.  相似文献   

2.
由支持向量机算法得到的支持向量集合通常不是分类所必需的最小集合,冗余支持向量的存在降低了支持向量机的分类速度和实用化能力.为此,提出一种精简支持向量集合的新方法,给出了从原支持向量集合中识别和剔除冗余向量、生成新支持向量集合并确定其元素权值的算法.新方法尤其适用于样本规模大、支持向量数目多的分类问题.实验表明它能够在基本不降低支持向量机分类精度的前提下,大幅度地减少支持向量的数目,提高支持向量机的分类速度.  相似文献   

3.
一种改进的快速支持向量机分类算法研究   总被引:5,自引:0,他引:5  
快速的支持向量机分类算法--FCSVM对支持向量集采用变换的方式,用支持向量集的子集代替全部支持向量进行分类计算,在保证不损失分类精度的前提下使得分类速度较传统SVM算法有较大提高. 为了获得最小的支持向量子集,同时避免支持向量的移动,对FCSVM算法进行了改进.采用二分法优化分类函数中的支持向量数,给出了变换矩阵存在的充要条件及构造方法,减少了计算量.实验结果表明,改进的快速分类算法较大幅度地减少了计算复杂度,提高了分类速度,尤其在训练集规模庞大、支持向量数量较多的情况下,效果更加明显.  相似文献   

4.
针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度慢以及对噪声点敏感影响分类正确率的问题,提出一种基于改进FSVM的数据挖掘分类算法.该算法首先预选有效的候选支持向量,减小训练样本数目,提高训练速度;其次定义一种新的隶属度函数,增强支持向量对构建模糊支持向量机的作用;最后将近邻样本密度应用于隶属度函数设计,降低噪声点或野值点对分类的影响提高分类正确率.实验结果表明,该算法在训练样本数目较大时训练速度和分类正确率都有提高.  相似文献   

5.
针对传统支持向量机中存在原始数据量过大导致训练速度太慢的问题,同时考虑到非支持向量对支持向量机的训练性能无影响,且影响支持向量机性能的支持向量往往位于边界的特点,提出一种提取边界向量的支持向量机算法.数值实验表明:改进算法在保证支持向量机分类能力的前提下,有效提高了支持向量机的分类效率.  相似文献   

6.
为了提高邮件分类的准确性和分类速度,提出一种基于加权子图和支持向量机相融合的邮件分类方法.首先通过收集邮件分类样本数据,利用加权子图提取邮件特征,并实现加权,然后采用核主成分分析选择邮件的最优特征子集,最后输入到支持向量机中进行学习,并采用布谷鸟算法搜索支持向量机参数,建立最优邮件分类器.仿真实验结果表明,该邮件分类方法不仅提高了邮件分类的正确率,而且分类速度明显加快,可以较好地满足网络邮件在线分类要求.  相似文献   

7.
根据支持向量样本、边界向量样本、相对距离和加权系数之间的关系,提出了基于相对距离的加权支持向量机.利用相对距离表示了每个样本的重要性.并构造函数计算出每个样本点的加权系数,体现了支持向量对加权系数的影响,并且有效地处理非均衡数据对分类的影响,从而提高了支持向量机的训练速度和分类能力.  相似文献   

8.
基于加权近似支持向量机的文本分类   总被引:9,自引:0,他引:9  
随着因特网的迅速增长,能够分类大规模文档的高效文本分类算法变得非常重要.该文提出一种基于加权近似支持向量机模型的文本分类算法,加权近似支持向量机对近似支持向量机作了改进,通过为每个训练误差增加一个权值和使用在原空间直接求解的算法,克服了近似支持向量机模型不适合不平衡数据分类和高维数据分类的缺点.试验结果表明,与标准支持向量机算法相比,该算法的分类质量与训练速度都有提高,是一种适合文本分类的高效算法.  相似文献   

9.
提出一种改进的支持向量机分类方法.通过引入分类圆心、分类半径、分类圆心距等概念,从而更加快速准确地删除非支持向量点,引入混淆度的概念,解决如何在样本严重混淆时进行剔除混淆点,保证算法的泛化性.实验证明,采用这种改进的算法能够在严重混淆的训练样本中保证准确度的同时提高支持向量机分类速度.  相似文献   

10.
一种基于KNN与改进SVM的车牌字符识别算法   总被引:2,自引:0,他引:2  
提出了一种将KNN(K近邻)和支持向量机相结合的字符识别算法.首先用KNN对字符进行判断,如果输出的置信度大于阈值,则认为分类正确;如果小于阈值则采用支持向量机进行判决.改进了SVM分类器,通过调整支持向量机的分类超平面改进了支持向量机的性能.将算法应用到实际的车牌字符识别中,识别结果表明,这种方法在提高识别速度的同时,有效提高了字符的识别精度.  相似文献   

11.
自适应迭代算法支持向量集的特性研究   总被引:1,自引:0,他引:1  
针对在支持向量机研究中,传统的优化方法无法处理规模不断扩大的分类问题,为设计适应大样本分类的训练算法,提出了基于块的自适应迭代算法。在该算法的训练过程中,块增量学习和逆学习交替进行,能够自动得到一个小的支持向量集。将该算法与SVML ight在支持向量数量方面进行了比较,计算了UC I(Un i-versity of Californ ia-Irvine)中的6个数据集和著名的Checkboard问题。结果表明:该自适应迭代算法确定的支持向量数一般不到SVML ight所得到的支持向量数的一半,其中70%多的支持向量被SVML ight所确定的支持向量集所包含,在支持向量选择方面具有高效性。  相似文献   

12.
DirectSVM算法是求解支持向量机的一种简单快速迭代算法,具有最好的几何直观性.算法将线性可分的两类样本中距离最近的两个异类样本点作为支持向量,以该两点连线的垂直平分面作为初始分类超平面,然后根据分类情况逐步确定新的支持向量,即逐步优化出最优分类超平面.对该算法进行了测试,发现该算法具有局限性,并对算法局限性产生的根源进行了分析,对如何合理使用DirectSVM算法进行了讨论.结论是:用DirectSVM算法直接求解最优分类面是不可靠的,但可以作为支持向量机的一种近似算法,也可以作为求解候选支持向量集的方法,再与其他经典算法结合使用.  相似文献   

13.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。支持向量机在选择支撑矢量时却进行了大量不必要的运算, 成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的。投影中心距离算法是一种能够预选取支撑矢量的方法, 该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度。本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性。  相似文献   

14.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法.支持向量机在选择支撑矢量时却进行了大量不必要的运算,成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的.投影中心距离算法是一种能够预选取支撑矢量的方法,该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度.本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性.  相似文献   

15.
为提高噪音人脸图像分类问题中的抗噪性能,在综合最小类内方差支持向量机(minimum class variance support vector machines,MCVSVMs)和总间隔v-支持向量机(total margin v support vector machine,TM-v-SVM)的优点的基础上,提出了基于公共矢量的总间隔v最小类内方差支持向量机(Total margin v minimum class variance support vector machines based on common vectors,TM-v-M(CV)2SVMs)。受公共矢量(common vectors,CVs)的启发,引入了散度矩阵以进一步提高算法的分类性能和抗噪性能,并给出了TM-v-M(CV)2SVMs的推导过程。经实验证明,在噪音人脸图像的分类问题中,TM-v-M(CV)2SVMs获得了比MCVSVMs和TM-v-SVM更好的分类性能和抗噪性能。  相似文献   

16.
基于模糊熵的支撑矢量预选取方法   总被引:1,自引:0,他引:1  
在基于支撑矢量机的分类器学习算法中,预先选择支撑矢量是非常重要的.依据模糊熵理论,提出一种启发式的支撑矢量预选取方法——模糊熵方法.该方法针对支撑矢量数目较小的情况,可以有效地预选取出包含支撑矢量的边界集.利用边界集作为训练集可以大大简化支撑矢量机的训练而不影响分类性能.与其它方法相比,该方法的主要优点是不需要参数来确定边界集的阈值.仿真实验结果表明该方法是有效和可行的.  相似文献   

17.
基于加权超球支持向量机算法的超文本分类研究   总被引:3,自引:0,他引:3  
为提高超文本分类算法的性能,降低算法的复杂度,提出一种适用于超文本分类的加权超球支持向量机算法.该算法综合文档内容信息和超链接信息作为文档特征向量,针对传统超球支持向量机算法在不同类别样本数目不均衡时训练分类错误倾向于样本数目小的类别的问题,利用加权因子补偿了类别差异对算法推广性能造成的不利影响.在基准数据集上的测试结果表明,该算法降低了二次规划的复杂度,提高了分类器的分类性能.  相似文献   

18.
为了提高中心距离比值法预选取支撑矢量的效率,降低支撑矢量机的训练时间,引入自适应动态克隆算法对中心距离比值法的阈值进行优化,并将该算法应用于入侵检测中,提出了基于阈值优化的CDRM-SVM入侵检测算法.算法首先利用自适应动态克隆算法对中心距离比值法中的阈值进行优化,获得理想的阈值,从而可以提取出包含全部支撑矢量的边界矢量集,然后使用边界矢量集代替训练样本集进行支持矢量机的训练,大幅度减少了训练样本的数量,使支持矢量机的训练速度显著提高.同时,由于边界矢量集中包含了支撑矢量,因此,支撑矢量机的分类能力没有受到影响.采用KDDCUP 99数据集进行试验,试验结果表明:与传统方法相比,在保证性能的情况下,所提算法能够有效地降低支持向量机的训练时间.  相似文献   

19.
文章提出了一个新的新闻网页分类方法(WPCM),采用主成分(PCA)和熵值相结合的特征选取支持向量机(SVM)的分类方法.首先把网页用特征项权重予以表示,使用主成分方法抽取最相关的一些特征,然后从每一类中选择在该类具有代表性的词并计算这些词的熵,把两种方法提取的特征合并之后作为支持向量机分类器的输入,实验结果显示,该网页分类方法在体育类新闻中取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号