首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
为了有效地利用信息技术发展而产生的海量信息,信息检索与数据挖掘得到了快速的发展,通过对传统支持向量机的特点分析,针对其在文本分类中的局限性,采用了一种基于二叉树的模糊支持向量机的多分类算法,通过实验证明该算法有更好的抗干扰能力和更好的分类效果。  相似文献   

2.
基于加权近似支持向量机的文本分类   总被引:9,自引:0,他引:9  
随着因特网的迅速增长,能够分类大规模文档的高效文本分类算法变得非常重要.该文提出一种基于加权近似支持向量机模型的文本分类算法,加权近似支持向量机对近似支持向量机作了改进,通过为每个训练误差增加一个权值和使用在原空间直接求解的算法,克服了近似支持向量机模型不适合不平衡数据分类和高维数据分类的缺点.试验结果表明,与标准支持向量机算法相比,该算法的分类质量与训练速度都有提高,是一种适合文本分类的高效算法.  相似文献   

3.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

4.
用于分类的支持向量机   总被引:6,自引:0,他引:6  
支持向量机是20世纪90年代中期发展起来的机器学习技术,建立在结构风险最小化原理之上的支持向量机以其独有的优点吸引着广大研究者,该文着重于用于分类的支持向量机,对其基本原理与主要的训练算法进行介绍,并对其用途作了一定的探索.  相似文献   

5.
支持向量机多类分类方法研究   总被引:1,自引:0,他引:1  
系统地回顾了现有的支持向量机多类分类方法,通过对其原理和实现方法的分析,从训练速度、分类速度和推广能力3个方面对这些方法的优缺点进行了归纳和总结,并得出相关结论.  相似文献   

6.
基于支持向量机的多分类方法研究   总被引:1,自引:0,他引:1  
支持向量机是一种典型的两类分类方法,如何将其扩展到多分类领域是一个重要的问题。本文对现有的多类支持向量机算法作了一定的分析,并提出了一些建议,希望对研究者以后的研究有所帮助。  相似文献   

7.
针对支持向量机(Support Vector Machine,SVM)处理大规模样本分类的学习效率降低问题,提出两阶段学习的支持向量机算法。该方法首先在正负类分别进行无监督聚类,提取各个聚类质心组成约简训练集,进行初次SVM训练;然后,根据初次训练结果选取边界样本集,参与第二次SVM训练。在UCI数据集上的实验结果表明,所提方法在保持分类泛化性能的同时,提高了模型的训练速度。  相似文献   

8.
支持向量机训练及分类算法研究   总被引:2,自引:0,他引:2  
支持向量机(SVM)是在统计学习理论基础上发展起来的一种新的数据挖掘方法,已广泛应用于模式识别与回归分析等领域。针对一些主要的SVM训练算法,比较它们的特点,阐述其中最有代表性的序列最小优化(SMO)算法及其多种改进算法,还讨论一些典型的支持向量机多分类算法及支持向量机多标注算法。最后,指出亟待解决的一些问题。  相似文献   

9.
基于离散核支持向量机的文本自动分类   总被引:1,自引:0,他引:1  
传统基于向量空间模型的文本分类方法需要对文档进行预处理,同时也会损失很多有用的信息.该文提出一种基于离散核支持向量机的文本分类方法,直接根据文档的字符序列构造离散核,用于支持向量机分类算法,比较文档之间的相似性,从而改善文本分类的效果.证明了离散核支持向量机方法的时间复杂度与文本的长度成O(n)关系.在Reuters-21578文档集上将离散核方法与多项式核、高斯核方法进行比较,实验结果表明该文所提方法在简化分类方法的同时也可以提高分类的精度.  相似文献   

10.
提出一种基于双支持向量机的偏二叉树多类分类算法,偏二叉树双支持向量机多类分类算法.该算法综合了二叉树支持向量机和双支持向量机的优势,实现了在不降低分类性能的前提下,大大缩短训练时间.理论分析和UCI(University of California Irvine)机器学习数据库数据集上的实验结果共同证明,偏二叉树双支持...  相似文献   

11.
基于机器学习的文本分类方法综述   总被引:1,自引:0,他引:1  
文本分类是信息检索与数据挖掘领域的核心技术,是机器学习领域新的研究热点。本文对现有的基于机器学习的文本分类方法进行了详细的介绍,分析了各种方法的优缺点,并阐述了文本分类方法未来的发展趋势。  相似文献   

12.
基于Boosting的支持向量机组合分类器   总被引:3,自引:0,他引:3  
Boosting是一种有效的分类器组合的方法,文章提出用一个改进的Boosting方法对支持向量机分类器进行集成学习,得到Boosting-MultiSVM分类器;试验结果表明,基于Boosting的支持向量机训练是一个收敛过程,相比标准的支持向量机分类器,Boosting-MultiSVM分类器的泛化性能有不同程度的提高。  相似文献   

13.
支持向量机的训练算法   总被引:27,自引:0,他引:27  
大量数据下支持向量机(SVM)的训练算法是SVM研究的一个重要方向和广大研究者关注的焦点。该文回顾了近几年来这一领域的研究情况。该文从分析SVM训练问题的实质和难点出发,结合目前一些主要的SVM训练方法及它们之间的联系,重点阐述当前最有代表性的一种算法——序贯最小优化(SMO)算法及其改进算法。从中可以看到,包括SMO在内的分解算法通过求解一系列规模较小的子问题逐步逼近最优解,从而避免存储整个Hessian矩阵,是解决大规模SVM训练问题的主要方法。而工作集的选择对于分解算法的收敛与否和收敛速度至关重要。  相似文献   

14.
基于层次型支持向量机的人脸检测   总被引:25,自引:0,他引:25  
复杂背景中的人脸检测可广泛应用于人脸识别、人机交互等方面。但目前大部分人脸检测方法中存在分类器训练困难和检测计算量大等问题。提出了一种基于层次型支持向量机的正面直立人脸检测方法,在这两方面作了改进。这种结构的分类器由一个线性支持向量机组合和一个非线性支持向量机组成,由前者在保证检测率的情况下快速排除掉图像中绝大部分非人脸区域,后者对人脸候选区域进行进一步确认。在卡内基梅隆CMU等数据库上的实验证明了这种方法不仅具有较高的检测率和较低的误检率,而且具有较小的计算量。  相似文献   

15.
基于词向量空间模型的中文文本分类方法   总被引:4,自引:0,他引:4  
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。  相似文献   

16.
基于支持向量机的仓储害虫声音识别   总被引:3,自引:0,他引:3  
对于仓储害虫的种类识别问题,提出了一种根据害虫产生的声音来进行基于支持向量机的识别算法.利用已知害虫的声音样本,经过语音预处理、特征提取,用所提取的语音特征向量构造多个支持向量机(SVMs).在识别应用中,在无法看到害虫的情况下,利用传感器采集到的害虫声音样本,预处理之后,利用训练好的支持向量机来判断是什么害虫,从而采取合适的灭虫措施.  相似文献   

17.
 讨论了通过对支持向量的局部扰动来确定支持向量集中的强影响点,并由这些强影响点构造相同精度下具有更强广义能力的支持向量机;对线性核函数和高斯径向基函数所构建的SVM进行了分析,并给出一个实例.  相似文献   

18.
支持向量机在云检测中的应用   总被引:1,自引:0,他引:1       下载免费PDF全文
针对地球观测系统/中分辨率成像光谱仪影像资料中的云检测工作,提出了基于支持向量机SVMs(support vector machines)的遥感影像分类方法.分析了云检测过程中的特征提取和选择,建立了基于支持向量机的遥感影像分类模型,并针对陆地、海洋2种不同的下垫面进行了云检测试验.云检测结果中,云与陆地、水体、积雪准确地区分开来.结果表明,特征选择对云检测起到了积极的作用,同时也证明了支持向量机方法在遥感影像分类中的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号