首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对自训练半监督支持向量机算法中的低效问题,采用加权球结构支持向量机代替传统支持向量机,提出自训练半监督加权球结构支持向量机。传统支持向量机需要求解二次凸规划问题,在处理大规模数据时会消耗大量存储空间和计算时间,特别是在多分类问题上更加困难。利用球结构支持向量机进行多类别分类,大大缩短了训练时间,降低了算法复杂度。球结构支持向量机在不同类别样本数目不均衡时训练分类错误倾向于样本数目较小的类别,通过权值的引入,降低了球结构支持向量机对样本不均衡的敏感性,补偿了类别差异对算法推广性能造成的不利影响。在人工数据集和UCI(university of california irvine)数据集上的实验结果表明,该方法对有标记样本的鲁棒性较好,不仅能够提高效率,且分类精度也有显著提高。  相似文献   

2.
支持向量机方法已经成功地应用于解决分类和回归问题,但是在训练支持向量机时需要求解二次规划问题,使得支持向量机的训练时间过长,训练样本量越大,这个缺陷越明显.将超球方法与回归支持向量机相结合,提出一种增量学习的新方法.该方法使用两个同心超球缩减训练集,以达到提高训练速度的目的.通过分析表明,这种新的增量学习方法较普通支持向量机训练方法有较低的计算复杂度.实验结果表明,该算法可以在不降低预测准确性的同时减少大量建模时间.  相似文献   

3.
基于加权近似支持向量机的文本分类   总被引:9,自引:0,他引:9  
随着因特网的迅速增长,能够分类大规模文档的高效文本分类算法变得非常重要.该文提出一种基于加权近似支持向量机模型的文本分类算法,加权近似支持向量机对近似支持向量机作了改进,通过为每个训练误差增加一个权值和使用在原空间直接求解的算法,克服了近似支持向量机模型不适合不平衡数据分类和高维数据分类的缺点.试验结果表明,与标准支持向量机算法相比,该算法的分类质量与训练速度都有提高,是一种适合文本分类的高效算法.  相似文献   

4.
为解决多分类支持向量机计算量大、训练时间长的问题,构造了支持向量域多分类器(MSVDC).在训练阶段,运用支持向量域描述求得各类样本的最小包围超球,进而将数据空间划分为不同区域;在测试阶段,计算待识别样本与最小包围超球球心的距离,并判断其空间位置;对超球重叠以及超球外区域的样本,定义一种相对类距离,判断样本归属该值较小的类.MSVDC避免了重复利用训练样本,降低了内存占用并提高了计算效率.数值实验结果表明:MSVDC具有好的鲁棒性,分类精度可高达98.89%,分别比一对多和一对一算法高4.51%和1.24%,训练时间分别为一对多和一对一算法的18.06%和55.41%.  相似文献   

5.
由支持向量机算法得到的支持向量集合通常不是分类所必需的最小集合,冗余支持向量的存在降低了支持向量机的分类速度和实用化能力.为此,提出一种精简支持向量集合的新方法,给出了从原支持向量集合中识别和剔除冗余向量、生成新支持向量集合并确定其元素权值的算法.新方法尤其适用于样本规模大、支持向量数目多的分类问题.实验表明它能够在基本不降低支持向量机分类精度的前提下,大幅度地减少支持向量的数目,提高支持向量机的分类速度.  相似文献   

6.
分类大规模数据的核向量机方法研究   总被引:1,自引:0,他引:1  
标准的支持向量机算法需要求解二次规划问题,因此,在处理大规模样本的时候,求解二次规划问题的时间复杂度和空间复杂度就成为支持向量机应用的一个瓶颈.核向量机将传统支持向量机中的二次规划问题转化为求解最小包围球问题,从而显著降低了二次规划的复杂程度.使用核向量机对大规模数据进行分类,所选用的数据样本数均超过2000,并与标准的支持向量机作了对比实验结果表明:核向量机在处理大规模数据分类时,比标准的支持向量机计算复杂度低,训练速度快,耗费空间少.  相似文献   

7.
针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明:所提方法可以有效提高线性支持向量机的整体性能。  相似文献   

8.
针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度慢以及对噪声点敏感影响分类正确率的问题,提出一种基于改进FSVM的数据挖掘分类算法.该算法首先预选有效的候选支持向量,减小训练样本数目,提高训练速度;其次定义一种新的隶属度函数,增强支持向量对构建模糊支持向量机的作用;最后将近邻样本密度应用于隶属度函数设计,降低噪声点或野值点对分类的影响提高分类正确率.实验结果表明,该算法在训练样本数目较大时训练速度和分类正确率都有提高.  相似文献   

9.
吴疆  董婷 《科学技术与工程》2007,7(16):4173-41754178
在实际的应用中,当处理样本的类别数目差异较大时,算法的预测精度偏向于样本数目大的类别。同时,对数目少的样本不能很好的预测。主要讲述了支持向量机算法如何解决在学习样本数目严重失衡情况下,预测结果的倾向问题,并且在G蛋白数据的分类和预测实验中取得有效的结果。  相似文献   

10.
为提高基于超球的支持向量机算法中样本数据较多时的训练速度,提出一种构造最小超球的并行融合算法.该算法将全部训练数据集依据特定策略分割成若干个子数据集,分别对各个子数据集进行训练,对所得到的各子数据集的支持向量与融合数据进行训练,构造最小超球.仿真结果表明,并行融合算法在保证分类精度的情况下,能够显著减少训练时间,提高效率,且支持向量的数目较少.同时也验证了该文对Gauss核函数分析的正确性.  相似文献   

11.
针对不确定数据多分类问题,提出一种基于模糊机会约束的超球支持向量机(FCC-HSVM).在球结构支持向量机的基础上,引入模糊事件的可能性测度,得到模糊机会约束规划及其对偶规划.利用球结构的优点,每类样本只参与一个超球体的训练,直接求解多分类模型,提出FCC-HSVM的快速学习算法,显著缩短多分类情况下训练时间.数据试验表明:这种支持向量机分类精度较高,训练速度快,适合解决不确定数据多分类问题.  相似文献   

12.
基于粒子群优化算法提出了一种通过优化支持向量机模型参数,建立更佳的支持向量机数学模型的方法. 针对双螺旋分类问题,分别利用基于粒子群优化算法所建立的支持向量机分类器和标准支持向量机分类器进行了仿真实验,利用所建立的评价体系对仿真实验所获得的实验数据进行了评估,评估结果表明基于粒子群优化算法的支持向量机分类器明显优于标准支持向量机分类器,其分类结果表明基于粒子群优化算法的支持向量机分类器提高了分类结果的准确性,同时也验证了基于粒子群优化算法的支持向量机分类器在数据分类中的有效性.   相似文献   

13.
 为了实现对民航飞机液压系统的健康评估,基于相异性表示的方法,利用单类线性规划分类器模型进行健康评估,确定了影响模型评估准确率的参数,定义了健康指数,得到总体测试样本以及非正常样本的评估结果,且与支持向量机超球模型的评估结果进行比较。结果表明,在已选择相应参数的情况下,采用基于相异性表示的单类线性规划分类器模型可以对民机液压系统进行健康评估。  相似文献   

14.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。支持向量机在选择支撑矢量时却进行了大量不必要的运算, 成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的。投影中心距离算法是一种能够预选取支撑矢量的方法, 该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度。本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性。  相似文献   

15.
通过分析同类数据点在空间中的几何形态,从数据点集所构成几何形态的凹凸性着手,提出边界提取算法并对高维数据进行分类。针对现实生活中的高维数据,利用局部线性嵌入将数据进行降维处理,得到低维特征数据。在此基础上,对于单分类数据集,用数据集表面的点的近邻样本与过该点的切平面之间的关系寻找边界点;对于多分类数据集,利用贝叶斯后验概率来寻找边界重复的点,以此更快达到提取边界点的目的。由此可以粗略筛选出边界点。为去除不重要的边界点,降低分类误差,通过构造最优超平面和支持向量机对边界点赋予权重,并设置阈值去除不重要的边界点,由此达到用较少的边界点准确分类数据的目的。通过100个测试样本进行分类测试并计算其分类准确率,验证了此分类方法的可行性。  相似文献   

16.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法.支持向量机在选择支撑矢量时却进行了大量不必要的运算,成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的.投影中心距离算法是一种能够预选取支撑矢量的方法,该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度.本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性.  相似文献   

17.
针对垃圾信息过滤的问题,提出了一种基于支持向量机(SVM)算法的垃圾信息过滤方法. 利用文本分类和信息检索领域所常用的性能评价指标,建立了垃圾信息过滤的评价体系,针对仿真实验获得的实验数据,利用所建立的垃圾信息过滤评价体系对实验数据评价结果,选取了适合的核函数及其参数,构建了SVM分类器,同时也通过仿真实验和评价体系对SVM分类器和传统贝叶斯分类器进行了测试和评估. 结果表明,基于SVM算法的分类器提高了信息过滤的准确性,同时也验证了SVM算法在垃圾信息过滤中的有效性.   相似文献   

18.
针对多标签分类问题,提出了一种面向样本不均衡及类属不确定性的多标签分类算法。首先,结合“一对一”分解策略和贝叶斯理论,将多标签数据集分解为单标签数据子集,并利用Parzen窗方法估计子集样本后验概率,对类标签进行了基于概率的不确定性表示。然后,在融合概率类标签和LS-SVM模型的基础上,利用样本差异信息来调节惩罚参数值,建立了考虑样本不均衡的概率LS-SVM子分类器模型。依据正态分布的3σ原理,设计了子分类器决策阈值确定方法。最后,结合实例对算法进行了性能分析,结果证明了新算法的合理性和有效性。  相似文献   

19.
针对现有的支持向量机多类分类方法的不足之处,提出了一种基于超球体支持向量机的不完全二叉树多类分类算法。该算法首先采用超球体SVM算法,计算各类样本群的分布范围。再利用距离公式,计算各类样本间的距离,基于将最容易分离出来的类最先分割出来的原则,设计二叉树结构,从而提高分类精度。通过仿真实验,分析比较各种方法的性能,从而验证了该算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号