首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对分类中如何有效利用负关联模式提高分类准确率,提出了一种基于正负关联模式的分类算法.利用类Apriori算法挖掘包含正项或/和负项且项与项之间互相关联的正负关联模式来产生分类规则.为提高挖掘效率,先找出能覆盖训练集的信息熵最小k个正,负项.然后,把这k个正/负项分别与其他项进行连接得到相应的正负关联模式.实验表明,该算法有效减少了挖掘的规则数,极大减少了挖掘时间,并提高了分类准确率.  相似文献   

2.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

3.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

4.
为了解决文本自动分类问题,从解决支持向量机模式支持限制问题入手,以级连概念为指导思想,构造了多层级连式支持向量机模型,提出一种文本自动分类算法,以便处理多个模式的分类问题。由于支持向量机本质上是一种非线性数据处理工具,对于复杂的两类模式分类问题已表现出良好的适应性,而且支持向量机用于模式识别不存在局部极小值问题,且不需进行网络迭代训练,求解速度明显高于神经网络。通过以CNKI文档数据为例进行算法实践,试验结果表明支持向量机用于模式分类的实现步骤比较简单,不需要长时间的训练过程,只需根据初始样本在空间的分布特性求解最优超平面(即找出支持向量),进而确定决策函数,然后即可泛化推广识别其他待识别的同类样本。  相似文献   

5.
提出了一种改进的局部二值模式即局部均值模式用于对静态手势进行分类. 计算不同分辨率的原始手势图像、非线性光照变化图像、高斯模糊图像和椒盐噪音图像的局部均值模式、局部二值模式和局部角相模式. 利用gentle_Adaboost 分类算法对这些算子特征进行训练和测试,实现手势分类. 文中提出的局部均值模式能充分利用区域内像素灰度值之间相关性和区别性信息进行编码,恰当地描述不同手势的特征,具有简单快速及良好的区分度等特点. 实验结果表明:与局部二值模式和局部角相模式相比,局部均值模式算子取得了更高的分类准确度.对于原始图像,该描述子的分类准确度达到95%,同时该模式对非线性光照变化和高斯模糊具有较强鲁棒性.  相似文献   

6.
提出了一种H.264至HEVC视频转码重压缩检测的新算法.基于HEVC编码标准中的一个新特性—–PU划分模式,利用直方图统计所有GOP的第1个P帧中各PU尺寸占据的8×8块数目,并将此作为视频的分类特征送入SVM进行判别分类.实验结果表明,所提出的算法能有效区分单压视频和转码视频,分类正确率达到90%以上.  相似文献   

7.
在关联规则、协同过滤的基础上提出了面向对象的推荐系统.根据客户特点进行分类,采取不同模式挖掘算法,提出面向对象的协同过滤算法,为客户提供个性化的服务,从而提高电子商务推荐系统的推荐质量.通过设计实验,对算法质量进行度量和分析.  相似文献   

8.
为了改善网络管理水平、加强网络安全监督,针对虚拟专用网络(virtual private network, VPN)通道下流量加密性强、不透明度高的特点,设计了加密流量数据的新构图方式,提出了基于变体ResNet18网络的加密流量分类算法。为了验证算法有效性,采集真实VPN通道下的热门app流量,成功实现了多VPN通道下的多应用流量分类。所提算法最终在公有数据集与真实采集数据集上的分类准确率分别达到98.1%和96.0%。实验结果表明,该算法具有通用性且具有一定的实际价值。  相似文献   

9.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

10.
基于频带能量和相同步的运动意识任务分类研究   总被引:1,自引:0,他引:1  
提出了基于信号频带能量和相同步作为脑电特征向量,实现对左右手运动意识任务的分类方法.用线性判别式算法对左右手运动想象脑电模式进行识别,识别正确率最高达到了86.43%,与只用特定频带能量作为脑电特征分类结果相比,效果更好.为大脑运动意识任务的分类提供了新思路.  相似文献   

11.
在数据量很大时,原有的数据分类方法变得失效。因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法。在相同的数据量下,PSS算法比传统的sPRINT算法具有更好的性能。实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题。  相似文献   

12.
基于支持向量机的文本分类技术研究   总被引:2,自引:2,他引:0  
介绍了文本分类的基本过程,讨论了常用的文本分类方法如K-最近邻分类算法K-NN(K-Nearest Neighbors,K-NN)、朴素贝叶斯分类算法NB(Naive Bayesian Classifier,NB)、决策树分类算法DT(Decision Trees,DT),并探讨了基于支撑向量机SVM(Support Vector Machines,SVM)的文本分类基本原理及方法.  相似文献   

13.
针对在联盟链中实用拜占庭容错(practical Byzantine fault tolerance, PBFT)算法所存在的通信开销过大、节点信誉度无法保证、算法无法动态地增删节点等问题,提出了基于决策树改进的PBFT(decision tree Byzantine fault tolerance, DTBFT)算法。首先,针对联盟链的应用场景,简化了PBFT算法的一致性协议,降低了通信开销;其次,考虑到系统安全性的问题,引入信誉积分机制,增加决策树分类算法,在每轮共识完成后,统计节点行为,对节点分类,使得系统可以动态地剔除拜占庭节点,提高系统的安全性;最后,为了防止拜占庭节点当选主节点,视图频繁切换,导致系统运行效率低的问题,改进了视图切换协议,将主节点的选取范围缩小到节点信誉好的高级节点,保证主节点的可信度。实验表明,DTBFT算法在吞吐量、算法安全性等方面较PBFT算法具有一定的提升。  相似文献   

14.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法.  相似文献   

15.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

16.
董贺  荣光怡 《松辽学刊》2008,29(4):107-108
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

17.
首先定义了抽象选择算子和抽象进化算子,基于这两种算子给出了一般抽象进化算法的定义.特别讨论了一种基于特殊选择的抽象进化算法,根据状态空间的分类,分析了这种特殊选择进化算法种群的一步转移概率矩阵的性质,最后证明了这种算法的Markov链存在极限概率分布.  相似文献   

18.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率.  相似文献   

19.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率.  相似文献   

20.
KNN算法是一种应用广泛的人工智能算法,在文本分类应用中,简单有效,易于实现.但是,KNN分类的时间复杂度与训练样本数量成正比,而且,训练样本分布密度的不均匀性将导致分类准确性的下降.本文在KNN算法的基础上,提出一种改进算法.算法分析了训练样本的分布密度,通过裁减高密度区域训练样本,降低样本数量,调节训练样本分布,达到提高分类准确性的目的.实验证明,基于密度的改进KNN文本分类算法在降低时间复杂度的同时,还具有较好的准确率和召回率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号