首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法. 该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的. 实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE 和RFW 相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.  相似文献   

2.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

3.
设计了一种基于VSM模型的动态文本分类器,它能针对文本的不同类别建立不同的特征子空间,各特征子空间之间相互独立,同时能将文本分类中常用的2个评估指标召回率和精确率转化为正确分类率和错分率;考察了特征子空间的维数和判定界值对这2个指标的影响.该动态文本分类器能对用户输入的文本流进行动态分类.  相似文献   

4.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

5.
本文提出了一种集成基于EP的分类器用于数据流入侵检测的模型EEPCDS(Ensemble of EP-based Classifiers on Data Stream)。该模型选择滑动窗口中的多个时间段数据来生成多个EP分类器,并且通过加权投票表决对未知样本进行分类,检测入侵行为。EEPCDS能适应数据流环境下的概念漂移,并且能实现较好的目标类召回率和精度的平衡,以及较高的分类准确率。  相似文献   

6.
针对如何提高遥感影像分类精度等问题,该文选取覆盖友好自然保护区的Landsat_5TM遥感影像为数据源,提出了将多个分类器进行组合的遥感影像分类方法.该方法将熵权法引入到湿地遥感分类研究中,选取最大似然、支持向量机(SVM)、神经网络(NN) 3种分类器作为子分类器,利用熵权法确定组合分类器的组合规则,采用多分类器组合的方法对友好自然保护区进行湿地类型信息提取,以提高湿地的分类精度.结果表明:与单一分类器相比,多分类器组合的遥感影像分类方法能够有效的提高分类精度.  相似文献   

7.
针对目标用户所感兴趣的图书具体特征,开发了一种基于意见挖掘技术结合图分类器的图书推荐系统.首先,基于图的分类器技术对图书条目进行分类;然后,挖掘出图书条目的评价信息,并根据评价内容判定评价的正反面;最后,结合两组技术实现图书的个性化推荐.通过实际案例的数据进行计算,以精确率和召回率评价依据进行综合评价,结果证明了提出的推荐系统的可行性和实用性.  相似文献   

8.
基于数据挖掘与机器学习的蛋白质疏水性分析的研究   总被引:1,自引:0,他引:1  
蛋白质的疏水性对蛋白质的稳定性、构象和蛋白质功能具有重要意义,通过数据挖掘中的机器学习算法实现了将一个数据集中已知疏水性的多个蛋白质样本数据,分配给具有特征值的各个目标类.将这些已知其特定类归属的数据作为KNN,LR,决策树,SVM四类分类器的训练集,利用这些已知数据训练后的分类器来处理未知疏水性的蛋白质数据,最终判断该数据的分类.该算法对蛋白质疏水性的预测,其准确率可达90%以上.  相似文献   

9.
为了实现对通信源个体特征的辨识,提出一种利用高阶累积量的多目标优化求解特征量方法.将射频功率放大器的等效模型变换为多输入-单输出系统,导出了系统输入信号累积量与输出信号累积量之间的关系式.通过多目标遗传优化算法求解方程,可获得射频功放的个体特征.仿真实验验证了方程的正确性,特征量优化估计值与直接计算值很接近,表明该算法能正确辨识通信源的个体特征.  相似文献   

10.
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类. 在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采用类别核心概念对特征项进行精选. 依据类别核心概念相关的类别语义信息,提出了文档与类别关联度的计算方法,并根据类别关联度来判断文本类别. 实验表明,该方法可有效降低特征空间维数,在提高分类效率的同时保证了分类效果,F1值略有提高. 与SVM、KNN和Bayes分类器对比,当特征项数目较少时,该方法的F1值明显高于其他3种方法,综合分类效果与SVM相当,优于KNN和Bayes.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号