首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对SVM中当训练样本数非常多时,分类算法训练阶段的计算量庞大;当训练样本集中存在噪声时,影响训练阶段超平面划分的准确度,导致分类准确率降低等问题,提出了一种基于密度的训练样本裁剪的SVM算法。首先应用密度裁剪算法裁剪掉原始训练样本集中存在的噪声和冗余样本,作为新训练样本集,使用网格搜索算法在新的训练样本集中对SVM参数(C,g)寻优,进行SVM训练并建模,达到分类的目的。实验结果表明,该算法同无样本裁剪的SVM算法相比分类准确率有所提高、训练阶段的时间耗费大大降低。  相似文献   

2.
针对现有云计算加密数据库分类算法的高时间开销问题,提出一种安全有效的基于Yao式乱码电路云计算隐私保护的kNN分类算法,该方法既能保护数据隐私和查询隐私,又能隐藏数据访问模式,同时又能保证高效查询处理的工作。该算法由4部分组成:加密kd树搜索阶段、kNN检索阶段、结果验证阶段和多数类选择阶段。通过加密索引搜索方案来过滤与查询无关的数据,隐藏了最终的类标签和数据访问模式,提高云计算中数据查询处理的效率。通过Yao式乱码电路来支持有效的kNN分类,保护云计算中数据隐私和查询隐私,同时减少了kNN分类的时间开销。对Yao式乱码电路kNN分类方法的安全性进行了分析。实验结果表明,在分类时间方面,所提算法的性能优于现有PPkNN方法和SkNNCI方法。  相似文献   

3.
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法. 首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类. 这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点. 试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本.  相似文献   

4.
在kNN算法分类问题中,k的取值一般是固定的,另外,训练样本中可能存在的噪声能影响分类结果。针对以上存在的两个问题,本文提出一种新的基于稀疏学习的kNN分类方法。本文用训练样本重构测试样本,其中,l_1-范数导致的稀疏性用来对每个测试样本用不同数目的训练样本进行分类,这解决了kNN算法固定k值问题;l_(21)-范数产生的整行稀疏用来去除噪声样本。在UCI数据集上进行实验,本文使用的新算法比原来的kNN分类算法能取得更好的分类效果。  相似文献   

5.
在分类问题中,支持向量机(SVM)首先将样本映入某一高维特征空间,并在此空间中构造具有最大间隔的分类超平面.由Vapnik的统计学习理论知道,SVM泛化能力的强弱与分类超平面间隔的大小有十分密切的关系:分类平面的间隔越大,SVM的泛化能力就越强.本文提出了一种通过特征权学习来增加分类超平面的间隔,从而增强SVM泛化能力的方法.仿真试验表明,该方法对提高SVM的泛化能力是有效的.  相似文献   

6.
针对基于GPU和MPI并行的支持向量机(SVM)算法不适合于云计算环境,设计了一种基于多级SVM的并行支持向量机模型,实现了云计算环境下的序列最小优化(SMO)的并行算法。该算法通过MapReduce系统将大规模训练数据集划分为若干小训练集,再由这些小训练集开发多级的SVM,最后收集每一个SVM最优超平面附近的样本数据来训练另一个新的SVM。实验结果表明,该算法在时间消耗与分类正确率等综合方面比单机算法和传统并行算法获得更好的效果。  相似文献   

7.
研究了垃圾邮件的指纹特征向量表示和SVM过滤方法,设计实现了基于指纹特征和SMO的在线式邮件过滤器FSVM,在在线垃圾信息过滤上获得到了与传统方法相当的效果.在SVM过滤的运算速度方面,基于原始SMO算法,对上述在线方法提出了邮件样本动态集方法(DFSVM)进行条件减弱,在降低了计算量的同时能够保证指纹SMO获得相当的过滤效果.在标准测试集和真实邮件系统中进行了实验验证和对比,结果表明,该改进对提高SVM分类精读有一定的帮助.  相似文献   

8.
基于miRNA表达谱数据集,提出了一种新的数据挖掘算法——tSVM-kNN(t statistic with support vector machine-k nearest neighbor).该算法的思想为:首先,采用统计量法对该数据集进行特征初选;其次,将融合了支持向量机和K-最近邻判别法思想的算法——SVM-kNN算法作为分类器;最后,输出分类结果.仿真实验表明,SVMkNN算法分类器的分类能力比单独运行SVM和kNN都好;在miRNA"标签"的数量和识别精度方面,tSVM-kNN算法只需要取5个miRNAs即可获得96.08%的分类准确率.与同类的算法相比,其具有明显的优越性.  相似文献   

9.
网页分类是使用机器学习算法实现网页类别的自动标注。提出了一种基于SVM的日文网页分类方法,针对日文的特点,设计日文词素词典与规则库,并以此为基础进行日文分词和特征表示,然后使用互信息度进行特征选择,最后应用SVM来构造分类超平面,对日文网页进行分类。最后通过实验进行了验证。  相似文献   

10.
蔡贺  张睿 《甘肃科技》2012,28(18):15-16
从介绍和分析k最近邻域分类算法入手,对该算法进行了分析与研究,剖析了kNN分类算法中的关键问题,为读者呈现了分类效果,并指出了该算法存在的问题以及解决方法,并对算法未来的发展进行了展望。  相似文献   

11.
针对传统方法对有杆抽油泵系统进行故障诊断存在的缺陷,提出了基于支持向量机的抽油泵故障诊断方法.为解决高维、非线性分类问题,通过引入核运算技巧,分析非线性软间隔分类学习机具体算法,并得到使分类间隔最大的最优分类超平面方程.提出了特殊情况下的样本数据标准化处理具体算法,采用基于网格搜索的交叉验证法来选择模型参数,避免了参数选择的盲目性和随意性.采用一对多SVM分类器对抽油泵工况进行了多分类仿真试验,并与BP网络、RBF网络、最小距离法等加以比较,试验结果表明一对多SVM分类法理论严谨,方法可行,自适应好,可在线运行,在解决有杆抽油泵故障诊断问题中表现出了良好的性能,有助于提高采油效率,实现远程采油控制智能化,建设数字油田.  相似文献   

12.
利用改进的SVM分类算法处理汉语语音识别结果文本的分类问题,针对语音识别文本的特点简化了文本分类的预处理过程,调整支持向量机的分类超平面,并且自动优化参数,结合实际的识别结果文本集测试了改进的SVM性能,同时实现了KNN和贝叶斯分类算法,对3种分类性能进行了评价.  相似文献   

13.
针对kNN分类算法对不平衡数据进行分类可能偏向多数类的问题,提出了象限壳近邻分类算法。该算法仅选择测试样本象限方向上的最近邻的训练样本来判断其所属类别,从而有效地避免了kNN算法对选取k个最近邻训练样本时可能产生偏向多数类的问题。通过在UCI真实不平衡数据集上的实验,该文提出的分类算法在Recall、F-value和G-mean等评价标准明显优于传统的kNN分类算法。  相似文献   

14.
基于基尼的模糊kNN分类器   总被引:2,自引:0,他引:2  
随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的文本分类算法之一。对于大多数文本分类来说,文本预处理是文本分类的瓶颈,文本预处理的好坏直接影响着分类的性能。在此介绍了一种新的文本预处理算法——基于基尼的文本预处理算法。同时采用模糊集理论改进kNN的决策规则。这两者的结合使得模糊kNN比传统的kNN表现出更好的分类性能。实验结果证明这种改进是有效的,可行的。  相似文献   

15.
基于投影寻踪的kNN文本分类算法的加速策略   总被引:1,自引:1,他引:0  
传统的k近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法。针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略。基本思想是:通过投影的方法缩减训练集的规模,同时在寻找k近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销。实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度。  相似文献   

16.
合成孔径雷达(synthetic aperture radar, SAR)图像分类是遥感领域最重要的课题之一。然而,SAR图像特征提取的困难和相干斑噪声的存在都严重影响了SAR图像分类的准确性。为了克服这些问题,文章提出了一种新的SAR图像分类算法。该算法将相干斑去噪技术和深度置信网络相结合,在通过深度置信网络对SAR图像进行无监督的学习和特征提取的同时,提出了区域滤波的方法来减少相干斑噪声对分类结果的影响。实验采用了不同噪声水平的合成SAR图像以及由RADARSAT-2获取的真实SAR图像进行测试。实验结果表明,与传统的分类方法相比,该算法在噪声鲁棒性和分类能力方面都有良好的改进;同时,该算法在边界区域具有优秀的分类能力。  相似文献   

17.
基于支持向量机的遥感图像分类研究   总被引:5,自引:0,他引:5  
支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论的新型机器学习算法.通过解算最优化问题,在高维特征空间中寻找最优分类超平面,从而解决复杂数据的分类及回归问题.将支持向量机理论应用到遥感图像分类的研究还处在初级阶段,传统分类算法应用于遥感图像分类存在运算速度慢、精度比较低和难以收敛等问题.从支持向量机基本理论出发,建立了一个基于支持向量机的遥感图像分类器.用遥感图像数据进行实验,并将结果与其它方法的结果进行了比较分析.实验结果表明,利用SVM进行遥感图像分类的精度明显优于神经网络算法和最大似然算法分类精度.  相似文献   

18.
基于凸包的k局部超平面距离分类方法,通过改进k近邻算法在处理小样本问题时的决策边界而显著提高分类性能.但是,该方法对噪声和类的数目敏感,并且在一类样本"包围"另一类样本时,由于外围类凸包与内部样本的距离为零而导致分类错误.针对上述问题,提出了k子凸包分类方法,该方法融合了k近邻分类和凸包技术的优点,首先寻找测试样本的k近邻,然后在该邻域中计算测试样本到相应类的子凸包的距离,并根据距离大小来确定该测试样本的类别,有效克服了k局部超平面距离分类存在的不足.大量实验表明,文章提出的k子凸包分类方法在分类性能上具有显著的优势.  相似文献   

19.
针对DNA序列类别的分属问题,提出采用支持向量机(Support Vector Machine,SVM)的方法进行分类。根据SVM分类器的要求建立特征属性空间,首先由每个DNA中4个碱基的含量得到4个特征属性,然后在此空间中扩充DNA序列长度的属性,最后根据SVM分类器对已知的DNA分类样本做训练得到分类超平面。利用此超平面检测所要分类的DNA序列,实验结果表明这种方法具有很好的分类精度。  相似文献   

20.
kNN算法在文本分类中的改进   总被引:4,自引:0,他引:4  
kNN算法用已归类的数据训练分类器,它是一种基于实例研究(instance_based learning)文本分类算法,本文在研究kNN算法的基础上,结合k邻近法和最近特征线法的思想,提出了新的分类方法,k最近特征线法(k nearest feature line,kNFL),将其运用于文本分类中,汲取了kNN算法和NFL算法的优点,降低了偶然误差,提高了算法适应性和分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号