首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
针对模糊支持向量机(FSVM)应用于数据挖掘分类中存在对大样本集训练速度慢以及对噪声点敏感影响分类正确率的问题,提出一种基于改进FSVM的数据挖掘分类算法.该算法首先预选有效的候选支持向量,减小训练样本数目,提高训练速度;其次定义一种新的隶属度函数,增强支持向量对构建模糊支持向量机的作用;最后将近邻样本密度应用于隶属度函数设计,降低噪声点或野值点对分类的影响提高分类正确率.实验结果表明,该算法在训练样本数目较大时训练速度和分类正确率都有提高.  相似文献   

2.
模糊支持向量机的核心思想是赋予样本模糊隶属度,给每个样本以不同的权重,从而克服标准支持向量机对噪声和异常点敏感的问题.现有的模糊支持向量机算法通常以样本与类中心距离为基础,给每个样本赋予一个固定的隶属度,没有根据样本分布对隶属度做进一步修正.提出了一种新的动态方式赋予样本隶属度,利用萤火虫算法不断地更新样本中心的位置和隶属度函数,同时利用粒子群算法优化模糊支持向量机参数.在UCI数据集上的实验结果表明,该算法可以有效减少噪声和野点对超平面的影响,分类性能要优于几类常用的模糊支持向量机算法.  相似文献   

3.
具有模糊隶属度的模糊支持向量机算法   总被引:8,自引:1,他引:7  
针对传统支持向量机(SVM)由于样本中存在孤立点数据或噪声而导致的过学习问题,通过分析模糊支持向量机(FSVM)的特点,指出其关键在于如何构建模糊隶属度,为此结合k近邻法思想提出了一种新的隶属度函数构造方法.该方法不仅考虑了样本点到类中心的距离,而且对各样本点排列的紧密程度也进行了估计,与传统SVM相比,它对样本的分类更为清晰和准确.将该方法应用于汽车发动机的实际故障诊断中,结果表明:SVM与普通FSVM的分类正确率较低,而采用新的模糊隶属度的FSVM算法却有较高的识别率,当k为5时分类正确率达到了70.93%,因此验证了该算法的有效性.  相似文献   

4.
为了提高遥感图像分类精度,提出一种模糊均值聚类(FCM)和最小二乘支持向量机(LSSVM)相融合的遥感图像分类方法(FCM-LSSVM).首先对遥感图像样本进行模糊均值聚类,得到隶属度矩阵,然后根据隶属度矩阵选择遥感图像的训练样本,最后将训练样本输入到最小二乘支持向量机进行学习,并采用粒子群优化最小二乘支持向量机参数,建立遥感图像分类模型.通过仿真实验对算法性能进行测试,结果表明FCM-LSSVM提高了遥感图像分类效率和分类精度.  相似文献   

5.
提出了基于方向梯度直方图(Histogram of oriented gradient, HOG)特征提取和模糊支持向量机(Fuzzy support vector machine, FSVM)的西夏文字识别技术.在模糊支持向量机模型中引入了新的隶属度函数,构造了基于多超平面的模糊支持向量机模型,增强了分类能力,降低了噪声点的干扰,提高了分类效率.将HOG特征提取和FSVM相结合应用于西夏文字识别,提高了文字识别效率.通过在数据集上测试,并与已有的文字识别方法相比较,结果表明,HOG特征提取结合FSVM的方法性能优于现有的其他方法.  相似文献   

6.
针对传统模糊支持向量机算法采用样本到类中心的距离关系来构建模糊隶属度函数存在不足,以及易受数据集不平衡的影响,提出了一种基于高斯分布的FSVM,该方法既考虑了2类样本数量的不平衡问题,同时进一步考虑了样本不同方向上的分布特性.将样本的分布特性应用于模糊隶属度函数的设计,有效地提高了对正常样本和噪声、野值样本的区分能力.实验结果表明,在处理不平衡和有噪声干扰的数据集时,该方法较传统的FSVM具有更强的鲁棒性.  相似文献   

7.
基于动态核函数的模糊支持向量机   总被引:1,自引:1,他引:0  
针对传统的支持向量机(SVM)对训练样本中的噪声和野值特别敏感而导致的过学习问题,文中提出了一种新的基于动态核函数的模糊支持向量机(FSVM).该方法不仅考虑了样本点到类中心的距离,而且还考虑了样本间的密切度,结合这两种思想在特征空间中构造了一种新的基于动态核函数的模糊隶属度.仿真实验表明,该方法有较好的分类精度和推广能力并且在理论上具有一般性和能够有效地减弱野值的影响.  相似文献   

8.
用于不平衡数据分类的模糊支持向量机算法   总被引:1,自引:0,他引:1  
作为一种有效的机器学习技术,支持向量机已经被成功地应用于各个领域.然而当数据不平衡时,支持向量机会产生次优的分类模型;另一方面,支持向量机算法对数据集中的噪声点和野点非常敏感.为了克服以上不足,提出了一种新的用于不平衡数据分类的模糊支持向量机算法.该算法在设计样本的模糊隶属度函数时,不仅考虑训练样本到其类中心距离,而且考虑样本周围的紧密度.实验结果表明,所提模糊支持向量机算法可以有效地处理不平衡和噪声问题.  相似文献   

9.
支持向量机(SVM)是一种新的机器学习方法,已经广泛应用于模式识别和函数估计等问题中.针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑属性重要性对分类结果的影响的缺陷,提出了基于样本属性重要度的支持向量机方法,该方法首先利用信息论中的信息增益技术计算各个样本特征属性对分类属性的重要度,然后对所有样本的同一特征属性的值分别用对应的属性重要度进行加权,最后所得数据集用于训练和测试SVM.数值实验的结果表明,该方法提高了分类器的分类精度.  相似文献   

10.
针对模糊支持向量机(FSVM)方法无法有效定位支持向量,在确定隶属度时易丢失分类信息的问题,提出一种基于多区域划分的FSVM方法。该方法先利用传统SVM获取支持向量的大体位置,作为对FSVM支持向量的近似估计,再进一步融合带负类样本的支持向量域描述(SVDD-neg)模型,对样本空间进行划分,最后根据样本所在的区域按不同的规律确定隶属度。研究结果表明:这种隶属度确定方式不仅能有效削弱野值样本的影响,而且也会提高支持向量的隶属度。与基于样本紧密度以及基于样本到类内超平面距离的FSVM方法相比,该方法具有更好的抗噪性能和泛化能力。  相似文献   

11.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法.支持向量机在选择支撑矢量时却进行了大量不必要的运算,成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的.投影中心距离算法是一种能够预选取支撑矢量的方法,该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度.本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性.  相似文献   

12.
基于模糊支持向量机和核方法的目标检测方法研究   总被引:6,自引:0,他引:6  
介绍了模糊支持向量机(FSVM)理论,利用FSVM理论解决一般场景图像中的目标检测问题,并利用统计学习理论和支持向量机方法研究中形成的新的机器学习方法——核方法,研究FSVM的隶属度确定问题。实验表明,本算法具有较高的识别精度。本方法既具有针对性,又在理论上具有一般性,对推动模糊支持向量机这一新的模式分类方法的实际应用具有积极意义。  相似文献   

13.
支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法。支持向量机在选择支撑矢量时却进行了大量不必要的运算, 成为其应用的瓶颈问题.因此在基于支持向量的分类器学习算法中,预先选择支撑向量是非常重要的。投影中心距离算法是一种能够预选取支撑矢量的方法, 该方法可以有效地预选取出包含支持向量的边界集,在不影响支持向量机的分类能力情况下,大大地减少了训练样本,提高了支持向量机的训练速度。本文采用投影中心距离算法进行支撑矢量的预选取,通过对人工线性、非线性数据及MINST字符库的实验证明了该方法的有效性和可行性。  相似文献   

14.
模糊支持向量机(FSVM)中的模糊隶属度函数确定一直是一个难点问题。针对支持向量分类机对噪声数据或孤立点非常敏感的问题,受贝叶斯决策理论的启发,结合样本密度特性,研究样本点相对于同类和异类的关系,对各样本点分布的紧密程度给出了描述,构造了样本点的后验概率与样本密度的加权方法,提出了一种新的加权模糊隶属度函数构造。该方法避免了对噪声数据和孤立点的检测。通过建立基于提出模糊隶属函数的FSVM进行仿真,实验表明,提出的模糊隶属度函数构造的后验概率加权方法的有效性。  相似文献   

15.
解的稀疏性的丧失——所有的训练样本均作为支持向量,是最小二乘支持向量机的缺点之一,针对导致模型复杂度提高和模型训练、识别速度降低的问题,从数据挖掘和支持向量的几何分布含义两个方面出发,提出了一种新的支持向量预选取算法。一方面对原数据集的每类数据分别进行K均值聚类,将所有的类中心作为原始数据的表征集;另一方面对原数据集用K最近邻方法提取原数据集的边界样本;最后将这两种方法提取的所有样本点的并集作为预选支持向量进行训练和预测。UCI数据库的实验表明:该方法充分融合了K均值和K最近邻预选取算法的优点,能有效的预选取出支持向量,同时保持较高的识别率,而且稀疏效果更稳定,稀疏性能优于经典的迭代剪枝算法。  相似文献   

16.
模糊支持向量机(FSVM)赋予每个样本一个模糊隶属度,优化了最优分类面,具有好的抗噪性。为提高低信噪比条件下的语音识别准确率,减小传统支持向量机(SVM)中噪声样本对分类精度造成的影响,首先将模糊支持向量机(FSVM)应用于语音识别系统中的识别网络。在此模型的基础上,考虑到语音样本各维特征的影响,计算各维特征的信息增益作为对分类的重要程度,依据此重要程度确定对各维特征的加权系数,构造加权核函数。为了减小一对一分类模式下的时间复杂度,引入了三叉决策树策略。在仿真实验中,采用韩语语料库的耳蜗滤波器倒谱系数(CFCC)作为实验数据,实验结果表明,在低信噪比语音识别中,特征加权模糊支持向量机(FWFSVM)比传统的SVM具有更好的鲁棒性。  相似文献   

17.
文中提出了一种新的边缘检测方法——基于组合隶属度模糊支持向量机(FSVM)的图像边缘检测.通过对这种新的FSVM分类算法建立边缘检测的模型对加入椒盐噪声状态的图像进行边缘检测的实验.仿真实验结果表明,新的算法稳定性高,抗噪性能好,具有更好的检测效果.  相似文献   

18.
模糊支持向量机中隶属度确定的新方法   总被引:4,自引:1,他引:3  
针对目前模糊支持向量机方法中,一般使用样本与类中心之间的距离关系构建隶属度函数的不足,提出一种改进的隶属度确定方法.该方法不仅考虑样本与类中心之间的关系,还考虑样本之间的关系根据样本的类中心与传统支持向量机构造的分类面构建2个超球,由样本点与超球的位置关系计算其隶属度,能够有效地区分样本点、噪音点以及孤立点.通过文本分类实验表明,与其他两种隶属度函数方法相比,基于双超球的模糊支持向量机方法可以更有效地将文本训练集中的噪音剔除,具有较好的分类性能.  相似文献   

19.
支持向量机(SVM)花费大量时间用于对非支持向量样本的优化.根据支持向量都是位于两类边界的靠近分类超平面的样本点,本文提出首先利用基于中心距离比值法排除大部分远离分类超平面的样本,然后以最小类间距离样本数作为测度进一步选择边界样本.得到包含所有支持向量的最小样本集,构成新的训练样本集训练SVM.将提出的算法应用于解决医学图像奇异点检测问题.实验结果表明.该算法减小了训练样本集的规模,有效地缩短了SVM训练算法的时间.同时获得了较高的榆出率.  相似文献   

20.
针对支持向量机对训练样本内的噪声和孤立点比较敏感,影响了支持向量机分类性能的弱点,利用模糊支持向量机的学习方法,构建了变压器故障诊断模型.采取一种基于二叉树的多分类方法,使用模糊C均值聚类算法求取模糊支持向量机的模糊隶属度,采用径向基核函数,并利用遗传算法对模糊支持向量机的参数进行寻优.实验结果表明,基于二叉数的模糊支持向量机模型相比BP神经网络、支持向量机有更高的诊断准确率,基于二叉树模糊支持向量机的变压器故障诊断方法是可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号