首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法.  相似文献   

2.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

3.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

4.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的.  相似文献   

5.
在数据量很大时,原有的数据分类方法变得失效。因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法。在相同的数据量下,PSS算法比传统的sPRINT算法具有更好的性能。实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题。  相似文献   

6.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

7.
针对传统纹理图像分类算法识别率不高的问题,引入置信规则库推理方法而提出一种纹理图像分类策略.目前纹理图像分类研究常局限于纹理特征提取算法的改进,而忽视了另一个决定分类效果的关键,即分类器设计.该文采用置信规则库推理方法,在现有纹理特征提取算法基础上重新设计纹理图像分类器.根据角度径向变换和灰度共生矩阵算法提取图像纹理特征,采用主成分分析方法减少角度径向变换特征的维数,以避免产生置信规则库"组合爆炸"的问题.最后用置信规则库推理方法将纹理特征信息转换成类别置信度信息,得到最终的分类结果.实验中将置信规则库推理方法分别与相似性距离度量法和支持向量机法进行对比,结果表明所提出的方法在一定程度上提高了纹理图像分类准确率.  相似文献   

8.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率.  相似文献   

9.
提出了一种H.264至HEVC视频转码重压缩检测的新算法.基于HEVC编码标准中的一个新特性—–PU划分模式,利用直方图统计所有GOP的第1个P帧中各PU尺寸占据的8×8块数目,并将此作为视频的分类特征送入SVM进行判别分类.实验结果表明,所提出的算法能有效区分单压视频和转码视频,分类正确率达到90%以上.  相似文献   

10.
介绍了一种加快神经网络学习的改进算法.这种改进算法结合采用快速自底向上构造神经网络算法和动态优化学习参数算法.首先,快速自底向上构造神经网络算法自动地构建神经网络的优化结构;随后,动态优化学习参数算法动态地调整和选取优化的学习参数.实验结果显示,这种改进算法能自动有效地构造网络的优化结构,与其它算法相比,具有更好的分类性能、优化的网络结构和更快的学习速度.  相似文献   

11.
决策树分类ID3算法研究   总被引:1,自引:0,他引:1  
张桂杰  王帅 《松辽学刊》2008,29(3):135-137
分类是数据挖掘的重要内容之一,在许多领域得到广泛应用,现已有多种分类方法,其中决策树分类法在海量数据环境中应用最为广泛,本文分析了决策树分类ID3算法的原理,给出构造决策树的基本算法,指出ID3算法构造决策树的优缺点,针对ID3算法倾向于取值较多的测试属性的缺点,引入一个参数来约束属性选择,给出一种优化算法.  相似文献   

12.
田苗苗 《松辽学刊》2008,29(1):54-56
本文对决策树数据挖掘方法进行分析和比较,并应用该分类方法对网页文本进行分类,仿真实验结果证明决策树算法在文本分类研究领域有着广阔的应用前景.  相似文献   

13.
基于粗集的ID3算法研究   总被引:5,自引:0,他引:5  
决策树是数据挖掘任务中分类的常用方法,ID3算法是经典的决策树生成算法,它的核心是通过计算各个属性的信息熵来确定最好的分枝结点.给出一种用粗集的方法计算信息熵,应用ID3算法来生成决策树.  相似文献   

14.
以齐齐哈尔市辖区为研究区域,利用分类回归树(Classification and Regression Tree,CART)算法从训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、纹理特征和地学辅助数据建立研究区的决策树模型.用实测的GPS样本点对分类结果进行精度验证,并与最大似然监督分类方法(Maximum Likelihood Classification,MLC)进行对比.结果表明,基于CART的决策树分类结果的总精度和Kappa系数分别为82.24%和0.77,分类精度较MLC监督分类方法有明显提高,有较好的分类效果.  相似文献   

15.
基于频繁模式树的约束最大频繁项目集挖掘算法研究   总被引:2,自引:0,他引:2  
目前绝大多数频繁项目集(或最大频繁项目集)挖掘算法并没有考虑相关领域知识,其结果会产生许多无关的模式.因此,发现约束频繁(或约束最大频繁)项目集是多种数据挖掘应用中的关键问题,然而,这方面的研究工作却很少.为此该文提出了一种快速的基于频繁模式树(FP-tree:一种扩展前缀树结构)的约束最大频繁项目集挖掘及其更新算法.实验结果表明该算法是快速有效的.  相似文献   

16.
银行贷款风险评估一直是金融界高度关注的主要问题,现有方法主要包括K-means聚类、BP神经网络、简单决策树、VAR方法等多种风险评估算法。但对于客户属性值缺失的案例,上述方法就很难达到良好的效果。为了解决属性值缺失的风险评估问题。提出了一种基于贝叶斯决策树算法的贷款风险评估算法(DBT ),实验结果证明了该算法的有效性。  相似文献   

17.
基于案例的决策是一种直接依据过去的历史案例对当前案例进行分类或者指标预测的方法,K-近邻方法就是一种广泛应用的基于案例的决策模型。在K-近邻方法中,历史案例上需要有标签,而在现实应用中,标签本身有一定的不确定性.文章详细地讨论了现有的基于K-近邻的决策方法忽略了样本标签不确定性这一问题,并基于Dempster-Shafer证据理论对标签不确定性进行建模以改善预测的性能,在此基础上结合边界树模型提高模型的运行效率.文中介绍了边界树算法的作用与原理,对如何结合传统边界树算法与样本标签的不确定性对边界树算法的节点转移策略以及决策过程进行了优化.文章最后对边界树算法的计算规模与准确率做了详细的实验论证.结果表明,文中提出的方法一方面考虑了标签的不确定性,另一方面提高了传统的K-近邻模型的决策效率.  相似文献   

18.
摘要: 机场应急救援工作的规模决策对于抢救生命财产至关重要. 针对目前救援规模决策缺乏合理规则指导的问题, 提出了一种基于满意度控制的数据挖掘方法. 该方法将满意度理论中的选择函数和拒绝函数植入数据挖掘关联规则算法 中,在保持样本完好性的同时识别异样数据,控制挖掘进程,建立有效的机场应急救援辅助决策规则库,用以辅助决策 者作出更为科学合理的决策. 实验结果表明,该算法能挖掘出合理的应急救援规模决策规则,提高挖掘的准确性和效率.  相似文献   

19.
针对遗传算法无法利用系统中的反馈信息,求解到一定范围时出现的冗余迭代,求精确解效率低,局部搜索能力弱、易出现"早熟"现象等缺点,提出了采用蚁群信息素对均匀划分子空间进行标定,利用留存的信息素控制选择操作,采用双重选择算子、基于"杂交优势"思想的交叉算子和自适应变异算子的混合遗传算法.实验表明,采用该算法的分类系统的分类准确率、算法运行时间、算法收敛性等方面性能均有明显提高.  相似文献   

20.
提出了一种新的免疫算法,将匹配滤波器的输出判决信号作为一条染色体放入初始种群,使得初始种群中包含最优解的概率大大增加;选择疫苗时,将接种了疫苗的个体的适应值小于父代适应值的个体,按一定的概率接受该个体,克服了GA欺骗问题.仿真结果表明该算法在收敛速度和误码率方面都优于基于遗传算法的多用户检测.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号