首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
基于支持向量机的文本分类技术研究   总被引:2,自引:2,他引:0  
介绍了文本分类的基本过程,讨论了常用的文本分类方法如K-最近邻分类算法K-NN(K-Nearest Neighbors,K-NN)、朴素贝叶斯分类算法NB(Naive Bayesian Classifier,NB)、决策树分类算法DT(Decision Trees,DT),并探讨了基于支撑向量机SVM(Support Vector Machines,SVM)的文本分类基本原理及方法.  相似文献   

2.
随着我国现代科技的快速发展,文本分类逐渐在信息化技术与数字化技术领域得到重视。利用计算处理系统处理文本信息,能够有效提升文本分类的质量与效率,提升数据信息的利用率,从而促进信息化技术的普及。而支持向量机是处理文本内容,加强文本分类速度,并通过文档建模、中文分词、分类器评估等形式,构建出的行之有效的统计语言模型,它可以推动文本分类工作的发展。本文结合国内外研究现状,探析文本分类内涵及支持向量机原理,提出基于支持向量机的文本分类算法。  相似文献   

3.
为了解决文本自动分类问题,从解决支持向量机模式支持限制问题入手,以级连概念为指导思想,构造了多层级连式支持向量机模型,提出一种文本自动分类算法,以便处理多个模式的分类问题。由于支持向量机本质上是一种非线性数据处理工具,对于复杂的两类模式分类问题已表现出良好的适应性,而且支持向量机用于模式识别不存在局部极小值问题,且不需进行网络迭代训练,求解速度明显高于神经网络。通过以CNKI文档数据为例进行算法实践,试验结果表明支持向量机用于模式分类的实现步骤比较简单,不需要长时间的训练过程,只需根据初始样本在空间的分布特性求解最优超平面(即找出支持向量),进而确定决策函数,然后即可泛化推广识别其他待识别的同类样本。  相似文献   

4.
支持向量机作为一种新的机器学习技术,由于它具有结构简单,泛化能力强的优良性能,越来越受到人们的关注.为此,介绍了支持向量机的一些新的进展,及其在分类器设计中的应用.  相似文献   

5.
对机器学习、支持向量机的研究现状进行了综述,阐述了机器学习和支持向量机的基本概念以及支持向量机的训练算法.  相似文献   

6.
非线性支持向量机通过核函数将低维输入空间的数据映射到高维空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性可分问题.分析了非线性支持向量机中核函数的引入可造成分类阈值的偏移问题,提出了非线性支持向量机分类阈值的优化设置方法.实验表明,所提出的阈值优化设置方法能有效提高非线性支持向量机的分类精度.  相似文献   

7.
文本分类规则的提取和优化是衡量文本分类系统适应性能和分类能力的主要指标.在基于粗糙集和模糊聚类理论的文本分类系统中,结合粗集理论及不完备信息系统理论,提出了分类规则的提取和优化方法,通过实验和分析,产生用户满意的约简规则,从而能够快捷迅速地指导新文本的分类,提高系统的适应性能和分类能力.  相似文献   

8.
对基于支持向量机的数字水印算法做了概要性的介绍,由于支持向量机可以通过有限的训练集样本得到小的误差,从而提高学习的泛化能力,因此支持向量机在版权保护领域有很好的应用效果.对基于支持向量机的数字水印技术的相关概念和现有算法进行了描述与分析,另外,对基于支持向量机的数字水印技术的未来发展方向和前景进行了预测.  相似文献   

9.
基于小波支持向量机的金融预测   总被引:1,自引:1,他引:0  
基于小波分析与支持向量核函数理论构造了一个小波支持向量机(WSVM),用以预测金融时间序列的波动率.与采用高斯核的标准支持向量机相比,由于小波核结合了小波分析的多分辨特性,因此可以更好地逼近任意非线性函数.仿真实验表明,小波支持向量机在股指收益波动率预测中具有较好性能.  相似文献   

10.
非合作接收条件下调制识别算法预处理要求高,分类集有限,为此提出一种基于循环频率特征和支持向量机的调制分类方法. 利用信号循环累积量的循环频率为分类特征,不必进行参数估计和同步等预处理,在缺乏先验知识条件下对FSK、PSK、QAM、OQAM、CPOFDM、ZPOFDM等常见调制信号具有良好的识别效果. 该方法提升了盲接收环境下的分类效果,扩大了分类集. 理论推导和计算机仿真表明,该方法能有效提升非合作接收条件下的盲分类性能.  相似文献   

11.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法.  相似文献   

12.
针对当前基于深度学习的金融文本分类模型严重依赖于标记数据的问题,提出了一种基于跨领域迁移的AM-AdpGRU金融文本分类模型,通过学习相关领域数据的分类准则将其迁移到目标领域数据。AM-AdpGRU模型首先利用深度网络自适应来克服源领域和目标域之间数据分布差异导致的迁移损失,使得即使数据分布发生变化时模型也无需重构;然后利用注意力机制建立了目标域对源领域的特征选择机制,使得模型对源领域的注意力可以集中在与目标域相似性更高的部分。在公开的跨域情感评论Amazon数据集和SemEval-2017的Microblog金融数据集上进行了实验,将AM-AdpGRU模型与其他方法进行比较,结果表明AM-AdpGRU模型的分类平均准确性相对于其他模型有了显着提升。  相似文献   

13.
深度学习促进了自然语言处理技术的发展,基于文本生成的信息隐藏方法表现出了巨大的潜力.为此,提出了一种基于神经机器翻译的文本信息隐藏方法,在翻译文本生成过程中进行信息嵌入.神经机器翻译模型使用集束搜索(Beam Search)解码器,在翻译过程中通过Beam Search得到目标语言序列各位置上的候选单词集合,并将候选单词依据概率排序进行编码;然后在解码输出目标语言文本的过程中,根据秘密信息的二进制比特流选择对应编码的候选单词,实现以单词为单位的信息嵌入.实验结果表明,与已有的基于机器翻译的文本信息隐藏方法相比,该方法在隐藏容量方面明显提升,并且具有良好的抗隐写检测性和安全性.  相似文献   

14.
目标判别跟踪方法一般以单一跟踪结果(正样本)和部分负样本训练分类器,并只用单一的特征描述目标,因此在目标发生遮挡、光照变化、形变等情况下很容易导致跟踪的失败. 为了克服单一正样本和单一特征训练的分类器导致跟踪不稳定的问题,提出一种基于支持向量机的多特征描述、多个正负样本进行分类器训练的目标跟踪方法,用训练分类器对所有候选粒子的不同特征进行判别和选择,并将具有最大置信概率的粒子确定为跟踪结果. 在跟踪过程中,利用子空间学习的方法实现正样本的更新,并以更新后的正负样本训练分类器. 实验结果表明,该方法在目标存在遮挡、光照变化、形变等情况下均可以取得较好的跟踪效果.  相似文献   

15.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率.  相似文献   

16.
刘磊  王帅 《河南科技》2020,(4):72-74
受多种因素的综合影响,水库泥沙淤积表现为一个复杂的非线性动态过程,影响着水库的运行方式和其他效益的发挥。针对目前常用的几种计算水库泥沙冲淤量方法存在的问题,本文以三门峡水库为例,将支持向量机应用于水库泥沙冲淤量计算和预测。算例结果表明,该方法计算结果较为合理,计算过程涉及的参数较少,使用简便,适用于水库泥沙冲淤量的快速计算和预测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号