首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在属性均值聚类(AMC)与支持向量机(SVM)的基础上,提出了一个新的模式分类算法——基于(属性)聚类的属性支持向量机算法(AMC-ASVM)。主要思想是利用属性均值聚类网络得到的具有概率信息(权重)的样本,来训练属性支持向量机,从而得到分类器。这种方法结合了属性聚类的稳定性与属性支持向量机可以利用加权样本的优点,适合处理具有强噪声的数据。另外,该方法也可以看作是堆近邻分类法的自然推广。在实验部分,将其用于结肠癌基因表达数据的处理。实验结果显示了AMC-ASVM在一定程度上优于最近邻, Boosting, 堆近邻, SVM等方法。  相似文献   

2.
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

3.
支持向量机(SVM)是一种新的机器学习方法,已经广泛应用于模式识别和函数估计等问题中.针对现有的加权支持向量机(WSVM)和模糊支持向量机(FSVM)只考虑样本重要性而没有考虑属性重要性对分类结果的影响的缺陷,提出了基于样本属性重要度的支持向量机方法,该方法首先利用信息论中的信息增益技术计算各个样本特征属性对分类属性的重要度,然后对所有样本的同一特征属性的值分别用对应的属性重要度进行加权,最后所得数据集用于训练和测试SVM.数值实验的结果表明,该方法提高了分类器的分类精度.  相似文献   

4.
基于聚类和SVM的数据分类方法与实验研究   总被引:1,自引:0,他引:1  
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

5.
文章通过汽轮机故障样本数据的空间分布状态分析,基于模糊c均值(FCM)聚类方法实现故障征兆参数属性的离散化处理;采用粗糙集(RS)属性约简方法对原始特征向量进行优化,去除冗余特征,提取特征向量的本质信息;基于约简后的特征向量建立支持向量机(SVM)故障诊断模型.实验结果表明,该文所提出的方法不仅可以提高故障诊断的准确性...  相似文献   

6.
针对支持向量机(Support Vector Machine,SVM)处理大规模样本分类的学习效率降低问题,提出两阶段学习的支持向量机算法。该方法首先在正负类分别进行无监督聚类,提取各个聚类质心组成约简训练集,进行初次SVM训练;然后,根据初次训练结果选取边界样本集,参与第二次SVM训练。在UCI数据集上的实验结果表明,所提方法在保持分类泛化性能的同时,提高了模型的训练速度。  相似文献   

7.
针对信用评价数据存在离群点和噪声问题, 提出一种基于离群点剔除的支持向量机(SVM)信用风险评价模型. 该模型利用模糊c-均值聚类算法剔除样本离群点, 采用粒子群算法优化支持向量机分类参数, 进而提高支持向量机的分类性能. 将该方法应用于信用风险评价中的结果表明, 相比于其他模型, 该方法分类精度更高.  相似文献   

8.
针对不平衡数据集数据分布不均匀及边界模糊的特点,提出一种新的近邻密度SVM(NNDSVM)不平衡数据集分类算法。该算法先计算多数类中每个样本K近邻范围内的密度值,依据该密度值分别选出边界区域、靠近边界区域的与少数类数目相等的样本与少数类完成SVM初始分类;用所得的支持向量机和剩余的多数类样本对初始分类器迭代优化。人工数据集和UCI数据集的实验结果表明,与SVM、ALSMOTE-SVM和WSVM算法相比,本文算法分类效果良好,能有效改进SVM算法在分布不均匀及边界模糊数据集上的分类性能。  相似文献   

9.
提出一种基于核可能性c-均值算法的支持向量机分类算法,该算法改进了SVM训练过程中噪声和孤立点的敏感问题.其基本思想是:用核可能性c-均值算法对每个模式类训练样本进行聚类,得到不同的可能性度量值,根据得到的可能性度量值对训练样本进行修剪,删除具有较低可能性度量值的训练样本,最后用生成的新训练样本训练支持向量机.实验结果表明,该算法可以有效地解决由噪声和孤立点引发的分类错误问题以及重要样本的错分问题.  相似文献   

10.
基于未确知测度理论,建立回采工作面瓦斯涌出量的均值属性测度聚类预测模型.模型以样本均值为聚类中心,以熵权确定评价指标测度的权重,通过计算样本熵权综合测度与所属类别目标均值乘积之和获得瓦斯涌出量的预测值.利用实测的20组数据作为训练样本建立预测模型,并对校本进行逐一检验.研究结果表明:瓦斯涌出量预测值与实测值的相对误差不超过5%,能满足工程需要;与支持向量机(SVM)工具的验算相比,易于为现场的工程技术人员所掌握.  相似文献   

11.
针对现有方法在汽轮机故障诊断中存在影响诊断结果的样本、诊断准确率不高等缺陷,提出了基于变分模态分解(VMD)和改进的模糊支持向量机(FSVM)相结合的故障诊断模型;采用VMD对信号进行分解,并计算出各模态分量的样本熵值作为特征值,构造特征向量;通过核模糊C均值(KFCM)聚类算法计算出不同特征向量的模糊隶属度值,并将其引入支持向量机(SVM)中形成FSVM故障诊断识别模型,同时采用粒子群算法(PSO)优化FSVM中的参数;通过本特利RK4型转子试验台模拟汽轮机故障,将得到的数据输入诊断模型中进行实验。结果表明,在保证诊断模型性能的前提下,与传统SVM相比,基于VMD和改进的FSVM方法可以有效提高汽轮机故障诊断的准确率,而且诊断时间更短。  相似文献   

12.
针对最小二乘支持向量机对训练样本内噪声比较敏感和其稀疏性差的问题,提出基于密度k-近邻向量的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据,提高支持向量机的训练精度。通过计算出每个样本类的平均相似度和平均密度,得到样本的类相似度阈值;根据相似度阈值,将小于类相似度阈值的样本进行合并,减少训练样本总数。实验结果表明,该算法在保证训练精度的情况下,减少了支持向量数目。  相似文献   

13.
支持向量机(SVM)算法往往由于分类面过分复杂或过学习而导致其泛化能力降低,现有的最近邻(NNSVM)或K近邻(KNNSVM)方法解决了这类样本问题,但算法时间复杂度高,处理海量样本的能力有限。在NNSVM算法的基础上引入了网格概念,提出了GNNSVM算法,该算法先对空间进行分块,然后在空间块内计算样本距离,找出最近邻,并结合分块序列最小优化算法(SMO)进行了算法实现。实验表明,该方法降低了计算复杂度,它在保持分类精度的同时,提高了训练和分类的速度,并具有较强的泛化能力,从而提高了原NNSVM算法的海量数据处理能力。  相似文献   

14.
针对谱聚类算法在处理较大规模的样本时,在存储空间和计算时间上都存在瓶颈问题,文章分析了目前常见的两种解决方式,即基于稀疏化t近邻的谱聚类和基于Nystr9m矩阵低秩逼近的谱聚类方法.为了进一步提高这两种谱聚类算法的准确度,提出了采取基于信息熵属性赋权的欧式距离来计算样本间的相似度的方法.首先,计算样本各属性的权重;然后,计算样本间的相似度矩阵并应用到稀疏化t近邻的谱聚类和Nystr9m矩阵低秩逼近的谱聚类方法中;最后,在多个数据集上进行了验证.实验结果表明该方法在一些数据集上的聚类精确度要比原来谱聚类算法高,尤其在Pendigits数据集上,基于信息熵赋权的稀疏化t近邻谱聚类比稀疏化t近邻谱聚类方法精确度提高15.11%.  相似文献   

15.
运用OPTICS算法能发现任意形状的聚类,且对输入参数不敏感的优势,提出一种基于OPTICS密度聚类的支持向量机算法,通过对原始数据进行预处理,利用可达图得到约简样本代替原始训练样本用支持向量机进行训练,降低了SVM训练所需的时间及空间复杂度.实验表明,该方法在保持分类精度的同时,大大缩短了训练时间,提高了分类效率.  相似文献   

16.
为了提高遥感图像分类精度,提出一种模糊均值聚类(FCM)和最小二乘支持向量机(LSSVM)相融合的遥感图像分类方法(FCM-LSSVM).首先对遥感图像样本进行模糊均值聚类,得到隶属度矩阵,然后根据隶属度矩阵选择遥感图像的训练样本,最后将训练样本输入到最小二乘支持向量机进行学习,并采用粒子群优化最小二乘支持向量机参数,建立遥感图像分类模型.通过仿真实验对算法性能进行测试,结果表明FCM-LSSVM提高了遥感图像分类效率和分类精度.  相似文献   

17.
针对经典支持向量机对非目标样本没有拒绝能力,且应用于说话人辨认时存在不可分区域的问题,提出一种基于模糊C均值聚类和模糊支持向量机的多级模糊说话人辨认方法。首先利用模糊C均值聚类方法对特征向量进行聚类,减少样本的数目,加快模糊支持向量机训练速度。最终由FSVM得出判决结果。并通过仿真实验验证了该方法的有效性。  相似文献   

18.
基于聚类分析和支持向量机的布匹瑕疵分类方法   总被引:2,自引:0,他引:2  
提出一种基于聚类分析和支持向量机(SVM)的布匹瑕疵分类方法.该方法充分利用瑕疵的几何特征,首先使用迭代自组织数据分析技术算法(ISODATA)对其进行聚类,在聚类形成的子空间内再根据瑕疵的纹理特征利用SVM进行分类.根据布匹瑕疵的特点提出一种新的几何特征,并使用各类瑕疵的几何特征均值作为初始聚类中心,提高ISODATA算法的聚类效果.实验表明,该方法有效地提高了分类准确性,降低了训练的复杂度,分类准确率可达90%.  相似文献   

19.
针对短期负荷预测方法中传统的模糊C均值(FCM)聚类容易陷入局部最优和对初始聚类中心敏感的问题,提出利用粒子群优化(PSO)算法的全局搜索特性来优化此缺点.通过优化的FCM聚类来选取与预测日相似的日期作为支持向量机的训练样本,既强化了训练样本的数据规律,又保证数据特征的一致性.实验结果表明,优化预测模型的预测精度优于BP神经网络和支持向量机算法.  相似文献   

20.
基于局部信息的加权孪生支持向量机(WLTSVM)借用类内及类间近邻图分别表示类内样本的紧凑性和类间样本的分散性,克服孪生支持向量机(TWSVM)欠考虑训练样本间相似性的缺陷,并且在一定程度上降低二次规划求解的计算复杂度。然而,WLTSVM仍不能充分刻画类内样本潜在的局部几何结构,并且存在对噪声点敏感的风险。基于以上不足,提出一种鲁棒的加权孪生支持向量机(RWTSVM)。与WLTSVM相比,RWTSVM的优势在于:选用热核函数定义类内近邻图权值矩阵,可以更好地刻画类内样本潜在的局部几何结构及蕴含的鉴别信息;用类间近邻图选取边界点,同时结合类内近邻图使得超平面远离边界点中权重较大的样本,降低算法对噪声点敏感的风险。人造数据集和真实数据集上的测试结果验证算法RWTSVM的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号