首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
运用OPTICS算法能发现任意形状的聚类,且对输入参数不敏感的优势,提出一种基于OPTICS密度聚类的支持向量机算法,通过对原始数据进行预处理,利用可达图得到约简样本代替原始训练样本用支持向量机进行训练,降低了SVM训练所需的时间及空间复杂度.实验表明,该方法在保持分类精度的同时,大大缩短了训练时间,提高了分类效率.  相似文献   

2.
基于SVM多类分类算法的模拟电路软故障诊断   总被引:3,自引:0,他引:3  
给出了基于支持向量机(SVM)1-v-1和决策导向无环图(decision directed acyclic graph,DDAG)多类分类算法的模拟电路软故障诊断新方法.DDAG是在1-v-1算法基础上构建的新的学习架构,在对多个SVM子分类器进行组合的过程中,引入了图论中有向无环图的思想.比较了采用不同核函数时支持向量机的分类结果.实验结果表明采用DDAG支持向量机(DAGSVM))多类分类算法时,诊断准确率为99%.因此,DAGSVM算法具有较高的诊断准确率.  相似文献   

3.
针对自训练半监督支持向量机算法中的低效问题,采用加权球结构支持向量机代替传统支持向量机,提出自训练半监督加权球结构支持向量机。传统支持向量机需要求解二次凸规划问题,在处理大规模数据时会消耗大量存储空间和计算时间,特别是在多分类问题上更加困难。利用球结构支持向量机进行多类别分类,大大缩短了训练时间,降低了算法复杂度。球结构支持向量机在不同类别样本数目不均衡时训练分类错误倾向于样本数目较小的类别,通过权值的引入,降低了球结构支持向量机对样本不均衡的敏感性,补偿了类别差异对算法推广性能造成的不利影响。在人工数据集和UCI(university of california irvine)数据集上的实验结果表明,该方法对有标记样本的鲁棒性较好,不仅能够提高效率,且分类精度也有显著提高。  相似文献   

4.
基于加权超球支持向量机算法的超文本分类研究   总被引:3,自引:0,他引:3  
为提高超文本分类算法的性能,降低算法的复杂度,提出一种适用于超文本分类的加权超球支持向量机算法.该算法综合文档内容信息和超链接信息作为文档特征向量,针对传统超球支持向量机算法在不同类别样本数目不均衡时训练分类错误倾向于样本数目小的类别的问题,利用加权因子补偿了类别差异对算法推广性能造成的不利影响.在基准数据集上的测试结果表明,该算法降低了二次规划的复杂度,提高了分类器的分类性能.  相似文献   

5.
提出了一种组合凸线器和Hadamard纠错码相结合的多类文本分类算法,利用Hadamard纠错码将多类分类问题转换成多个二分类问题,对每个二分类问题,采用组合凸线器构造二分类器,使用海明距离判定待分类文本类别.在标准数据集Reuters 21578上进行了文本分类实验,分类结果表明,与支持向量机多类分类算法1-a-r、1-a-1和DAGSVM相比,该算法不仅提高了分类精度,而且分类速度有较大幅度的提高.  相似文献   

6.
基于内容的垃圾邮件过滤本质上是文本分类问题,支持向量机分类器非常适合于垃圾邮件过滤这一二分类问题,但标准的支持向量机是基于分类精度进行优化的,对两类邮件的重要性未以区别,造成了邮件分类时虽然整体精度较高,但对正常邮件的误判率也较高.据此笔者提出了一种基于加权支持向量机的垃圾邮件过滤算法,通过增加两类邮件的类别权重及反映每封邮件重要性的权重,对支持向量机分类器进行训练,在保证分类精度的同时,尽可能地降低对正常邮件的误判率.实验表明该算法取得了很好的过滤效果.  相似文献   

7.
基于加权近似支持向量机的文本分类   总被引:9,自引:0,他引:9  
随着因特网的迅速增长,能够分类大规模文档的高效文本分类算法变得非常重要.该文提出一种基于加权近似支持向量机模型的文本分类算法,加权近似支持向量机对近似支持向量机作了改进,通过为每个训练误差增加一个权值和使用在原空间直接求解的算法,克服了近似支持向量机模型不适合不平衡数据分类和高维数据分类的缺点.试验结果表明,与标准支持向量机算法相比,该算法的分类质量与训练速度都有提高,是一种适合文本分类的高效算法.  相似文献   

8.
由支持向量机算法得到的支持向量集合通常不是分类所必需的最小集合,冗余支持向量的存在降低了支持向量机的分类速度和实用化能力.为此,提出一种精简支持向量集合的新方法,给出了从原支持向量集合中识别和剔除冗余向量、生成新支持向量集合并确定其元素权值的算法.新方法尤其适用于样本规模大、支持向量数目多的分类问题.实验表明它能够在基本不降低支持向量机分类精度的前提下,大幅度地减少支持向量的数目,提高支持向量机的分类速度.  相似文献   

9.
基于Huffman树的模糊多类支持向量机   总被引:1,自引:0,他引:1  
针对二叉树多类分类方法存在的问题,提出了一种基于Huffman树的构造过程自下而上生成二叉树结构的方法.为降低二叉树方法"误差累积"的影响,使用模糊支持向量机来训练每个结点的两类分类器.针对设计隶属度函数时仅考虑样本与类别关系,而不考虑样本间关系的问题,提出了根据传统支持向量机构造的超平面做切球来确定样本间关系的方法,有效地区分了有效样本和噪音、孤立点样本.实验结果表明:同其他多类支持向量机方法相比,该方法具有更好的分类性能.  相似文献   

10.
一种改进的DDAGSVM决策算法   总被引:1,自引:0,他引:1       下载免费PDF全文
决策导向无环图支持向量机(DDAGSVM)是一种典型的SVM多类分类算法,然而传统SVM决策分类器存在误差积累,其推广能力有待进一步提高。为改进DDAGSVM,有效的做法是定义一种类间可分离性测度,将容易分的类先分割出来,然后再分不容易分的类,使错分尽可能地远离图的根部。引入了一种基于广义KKT条件的类间可分离性测度,提出一种改进的DDAGSVM分类决策算法。三螺旋线实验和HRRP分类实验证明该方法对控制分类错误有明显的效果。  相似文献   

11.
为解决弱情感倾向语料影响文本情感分类的问题,提出基于全局语义学习的文本情感增强方法。首先设计语料划分方法,将语料划分为强情感倾向语料与弱情感倾向语料,然后,从文本处理全过程及整体语义学习的角度出发,构造均值抽取与最大值抽取的语义提取方式及文档信息向量,改进基于循环神经网络的变分自编码器的语义学习过程,并用于学习强情感倾向语料中文本的词语序列特征与语义特征。基于此,对弱情感倾向语料进行重构,实现情感增强目标,最后,将经过情感增强的语料替换掉原来的弱情感倾向语料,再进行情感分类模型的训练与测试。结果表明:提出的文本情感增强方法能够提升情感分类效果,并使得Bert分类器对IMDb影评数据集的情感分类精确率达到了93.03%。  相似文献   

12.
针对短文本具有稀疏性强和文本长度较小等特性, 为更好地处理短文本分类问题, 提出一个基于集成神经网络的短文本分类模型. 首先, 使用扩展词向量作为模型的输入, 从而使数值词向量可有效描述短文本中形态、 句法及语义特征; 其次, 利用递归神经网络(RNN)对短文本语义进行建模, 捕获短文本内部结构的依赖关系; 最后, 在训练模型过程中, 利用正则化项选取经验风险和模型复杂度同时最小的模型. 通过对语料库进行短文本分类实验, 验证了所提出模型有较好的分类效果, 且该分类模型可处理变长的短文本输入, 具有良好的鲁棒性.  相似文献   

13.
提出一种基于马氏超椭球学习机的多类文本分类算法。对每一类训练样本,训练马氏超椭球学习机,使其包含该类尽可能多的样本,同时将噪音点排除在外。对于待分类样本,通过待分类样本的映射到每个超椭球球心的马氏距离确定其类别。实验结果表明,该算法提高了分类精度和分类速度。  相似文献   

14.
We present a novel watermarking approach based on classification for authentication,in which a watermark is embedded into the host image.When the marked image is modified,the extracted watermark is also different to the original watermark,and different kinds of modification lead to different extracted watermarks,In this paper,different kinds of modification are considered sa classes,and we used classification algorithm to recognize the modifications with high probability.Simulation results show that the proposed method is potential and effective.  相似文献   

15.
基于多尺度熵的滚动轴承故障诊断方法   总被引:1,自引:0,他引:1  
针对滚动轴承故障振动信号具有不同复杂性的特点,提出了一种新的基于多尺度熵(multi-scale entropy,简称MSE)和支持向量机的滚动轴承故障诊断方法.该方法首先利用MSE方法对滚动轴承不同类型振动信号进行故障特征提取,然后与样本熵方法对比说明MSE方法相对于样本熵方法的优势,最后通过适合小样本分类的支持向量机作为分类器来识别滚动轴承故障类型.对实验数据分析的结果表明,该方法能有效地实现滚动轴承故障类型的诊断.  相似文献   

16.
针对传统文本分类算法的分类精度低和计算复杂度高的问题,提出一种基于加权频繁子图挖掘的图模型文本分类算法。首先将文档集表示成图集;然后运用加权图挖掘算法提取频繁子图;最后,对特征向量进行分类。提出的算法仅提取最重要的子图,使其整体具有较好的分类效果和较高的计算效率。为评估该算法有效性,将其与多种现有分类算法分别对一个数据集进行分类实验,实验结果表明,提出的算法具有更高的识别精度和更少的运行时间。  相似文献   

17.
针对现有的支持向量机多类分类方法的不足之处,提出了一种基于超球体支持向量机的不完全二叉树多类分类算法。该算法首先采用超球体SVM算法,计算各类样本群的分布范围。再利用距离公式,计算各类样本间的距离,基于将最容易分离出来的类最先分割出来的原则,设计二叉树结构,从而提高分类精度。通过仿真实验,分析比较各种方法的性能,从而验证了该算法的有效性。  相似文献   

18.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

19.
Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间.  相似文献   

20.
针对文本特征选择中原始特征空间维数过高,提出一种基于类别相关性及遗传算法的文本特征选择方法.有效地降低了特征空间的维数,提高了分类准确率.实验验证了该方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号