共查询到16条相似文献,搜索用时 46 毫秒
1.
2.
3.
为了解决文本自动分类问题,从解决支持向量机模式支持限制问题入手,以级连概念为指导思想,构造了多层级连式支持向量机模型,提出一种文本自动分类算法,以便处理多个模式的分类问题。由于支持向量机本质上是一种非线性数据处理工具,对于复杂的两类模式分类问题已表现出良好的适应性,而且支持向量机用于模式识别不存在局部极小值问题,且不需进行网络迭代训练,求解速度明显高于神经网络。通过以CNKI文档数据为例进行算法实践,试验结果表明支持向量机用于模式分类的实现步骤比较简单,不需要长时间的训练过程,只需根据初始样本在空间的分布特性求解最优超平面(即找出支持向量),进而确定决策函数,然后即可泛化推广识别其他待识别的同类样本。 相似文献
4.
5.
对机器学习、支持向量机的研究现状进行了综述,阐述了机器学习和支持向量机的基本概念以及支持向量机的训练算法. 相似文献
6.
非线性支持向量机通过核函数将低维输入空间的数据映射到高维空间,从而将原低维空间的线性不可分问题转化为高维空间上的线性可分问题.分析了非线性支持向量机中核函数的引入可造成分类阈值的偏移问题,提出了非线性支持向量机分类阈值的优化设置方法.实验表明,所提出的阈值优化设置方法能有效提高非线性支持向量机的分类精度. 相似文献
7.
文本分类规则的提取和优化是衡量文本分类系统适应性能和分类能力的主要指标.在基于粗糙集和模糊聚类理论的文本分类系统中,结合粗集理论及不完备信息系统理论,提出了分类规则的提取和优化方法,通过实验和分析,产生用户满意的约简规则,从而能够快捷迅速地指导新文本的分类,提高系统的适应性能和分类能力. 相似文献
8.
对基于支持向量机的数字水印算法做了概要性的介绍,由于支持向量机可以通过有限的训练集样本得到小的误差,从而提高学习的泛化能力,因此支持向量机在版权保护领域有很好的应用效果.对基于支持向量机的数字水印技术的相关概念和现有算法进行了描述与分析,另外,对基于支持向量机的数字水印技术的未来发展方向和前景进行了预测. 相似文献
9.
基于小波支持向量机的金融预测 总被引:1,自引:1,他引:0
基于小波分析与支持向量核函数理论构造了一个小波支持向量机(WSVM),用以预测金融时间序列的波动率.与采用高斯核的标准支持向量机相比,由于小波核结合了小波分析的多分辨特性,因此可以更好地逼近任意非线性函数.仿真实验表明,小波支持向量机在股指收益波动率预测中具有较好性能. 相似文献
10.
11.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法. 相似文献
12.
针对当前基于深度学习的金融文本分类模型严重依赖于标记数据的问题,提出了一种基于跨领域迁移的AM-AdpGRU金融文本分类模型,通过学习相关领域数据的分类准则将其迁移到目标领域数据。AM-AdpGRU模型首先利用深度网络自适应来克服源领域和目标域之间数据分布差异导致的迁移损失,使得即使数据分布发生变化时模型也无需重构;然后利用注意力机制建立了目标域对源领域的特征选择机制,使得模型对源领域的注意力可以集中在与目标域相似性更高的部分。在公开的跨域情感评论Amazon数据集和SemEval-2017的Microblog金融数据集上进行了实验,将AM-AdpGRU模型与其他方法进行比较,结果表明AM-AdpGRU模型的分类平均准确性相对于其他模型有了显着提升。 相似文献
13.
深度学习促进了自然语言处理技术的发展,基于文本生成的信息隐藏方法表现出了巨大的潜力.为此,提出了一种基于神经机器翻译的文本信息隐藏方法,在翻译文本生成过程中进行信息嵌入.神经机器翻译模型使用集束搜索(Beam Search)解码器,在翻译过程中通过Beam Search得到目标语言序列各位置上的候选单词集合,并将候选单词依据概率排序进行编码;然后在解码输出目标语言文本的过程中,根据秘密信息的二进制比特流选择对应编码的候选单词,实现以单词为单位的信息嵌入.实验结果表明,与已有的基于机器翻译的文本信息隐藏方法相比,该方法在隐藏容量方面明显提升,并且具有良好的抗隐写检测性和安全性. 相似文献
14.
目标判别跟踪方法一般以单一跟踪结果(正样本)和部分负样本训练分类器,并只用单一的特征描述目标,因此在目标发生遮挡、光照变化、形变等情况下很容易导致跟踪的失败. 为了克服单一正样本和单一特征训练的分类器导致跟踪不稳定的问题,提出一种基于支持向量机的多特征描述、多个正负样本进行分类器训练的目标跟踪方法,用训练分类器对所有候选粒子的不同特征进行判别和选择,并将具有最大置信概率的粒子确定为跟踪结果. 在跟踪过程中,利用子空间学习的方法实现正样本的更新,并以更新后的正负样本训练分类器. 实验结果表明,该方法在目标存在遮挡、光照变化、形变等情况下均可以取得较好的跟踪效果. 相似文献
15.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率. 相似文献
16.
受多种因素的综合影响,水库泥沙淤积表现为一个复杂的非线性动态过程,影响着水库的运行方式和其他效益的发挥。针对目前常用的几种计算水库泥沙冲淤量方法存在的问题,本文以三门峡水库为例,将支持向量机应用于水库泥沙冲淤量计算和预测。算例结果表明,该方法计算结果较为合理,计算过程涉及的参数较少,使用简便,适用于水库泥沙冲淤量的快速计算和预测。 相似文献