首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
分类是把数据项映射到其中一个事先定义的类中的这样一个学习函数的过程.文章介绍分类数据挖掘的定义、分类的过程以及算法的分类,论述数据分类的常用技术,对分类的应用和分类算法的发展方向进行了展望.  相似文献   

2.
一种改进的互信息特征选取预处理算法   总被引:4,自引:1,他引:3  
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。  相似文献   

3.
针对传统进化算法在图像分类中存在的收敛速度慢,易陷入局部最优等问题,本文提出用猫群算法求解图像分类问题,将求解组合优化问题转化为猫群的位置寻优过程,并分析了猫群算法及其两种行为模式下的算法模型.讨论了不同模式下猫群的速度、位置更新公式,并阐述了利用该算法求解图像分类问题的具体步骤.通过实验,验证了猫群算法在图像分类中的准确性和有效性.  相似文献   

4.
蔡贺  张睿 《甘肃科技》2012,28(18):15-16
从介绍和分析k最近邻域分类算法入手,对该算法进行了分析与研究,剖析了kNN分类算法中的关键问题,为读者呈现了分类效果,并指出了该算法存在的问题以及解决方法,并对算法未来的发展进行了展望。  相似文献   

5.
刘璇 《科技信息》2012,(30):289-289
本文论述了决策树分类挖掘系统中的ID3算法和C45算法的建立思想,并将其应用到优化图书馆数据统计中,实践证明了该方法的可行性。  相似文献   

6.
论述了遗传算法在数据挖掘中的一类知识分类应用,并给出了基于遗传算法的知识规则挖掘算法的基本思想和关键问题,包括知识规则表示,适应度函数定义等.通过实例证明了该算法的有效性.  相似文献   

7.
数据分类是数据挖掘中的一个重要课题,研究各种高效的分类算法是数据挖掘的重要问题之一.本文对了GAAA算法进行改进提出了一种新组合优化算法,将其应用到分类规则的优化问题,采用遗传算法生成信息素分布,利用蚂蚁算法求精确解,优势互补,有效地节省了计算时间,并优化了生成的分类规则.实验结果表明:该算法可以有效克服停滞,提高搜索效率,有效地挖掘出最优的分类规则集.  相似文献   

8.
一种基于关联性度量的决策树分类方法   总被引:9,自引:2,他引:7  
在介绍了一些典型的决策树分类算法的基础上,论述了所开发的面向先进制造企业的综合数据挖掘系统ScopeMiner中的决策树分类算法,该算法集中了ID3、C45和MedGen等典型算法的思想,并进行了改进·在建立决策树过程中采用关联性度量的计算来确定划分条件属性的顺序,通过阈值设定和处理简化了决策树的剪枝和优化过程,准确性高,分类速度快·系统已在某大型企业质量控制中得到了应用,取得了一定的经济和社会效益·文章详述了算法的执行过程、应用于冶金企业中的实例以及正确性证明和时间复杂性分析·  相似文献   

9.
支持向量机(Support vector machines)在人像识别、文本分类等模式识别问题中有广泛的应用,可以有效地解决一些实际生活中的分类问题。针对半监督两分类问题,提出了基于Seeded-Kmeans和SVM的分类算法(SK-SVM)。用Seeded-Kmeans算法对无标签点进行处理,使其获得初始标签,再选取有效的标签点加入已有带标签点中,构成新的带标签训练集,最后结合SVM进行分类。选取UCI中的8个数据集进行数值实验,基于Seeded-Kmeans和SVM的分类算法的有效性得到了验证。  相似文献   

10.
为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台.该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究.实验结果表明: 该平台可以通过计算分类器分类准确率的宏平均值比较分类算法与特征选择算法的性能,可以评估语料库的可用性,能够用于研究中文分词、特征选择、分类算法等中文文本分类技术问题.  相似文献   

11.
基于人工标引的中文学术期刊文献自动分类算法   总被引:3,自引:0,他引:3  
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85 %的分类识别率  相似文献   

12.
本文主要针对数据挖掘分类算法研究现状,对目前发展较成熟的几种分类算法如决策树、关联规则分类、神经网络、贝叶斯方法、遗传算法等分别进行了论述,并且展望了数据挖掘技术的未来。  相似文献   

13.
分类挖掘技术在金融客户关系管理中的应用   总被引:7,自引:0,他引:7  
探讨数据挖掘技术在企业实际工作中的应用方式与应用领域,分析金融客户分类的必要性.针对具体的项目论述对金融客户进行分类的方法.改进了传统的决策树分类挖掘算法即ID3算法,提出了进行数据挖掘结果可视化展现的两层软件结构.该方法在银行客户关系管理系统中投入实际运行,获得了较好的用户反映,对企业的决策支持产生了积极的影响.  相似文献   

14.
协同过滤算法是一个在各领域广泛使用的启发式推荐算法,但传统协同过滤算法存在冷启动、数据稀疏性、用户分类精度低等问题.以协同过滤算法中重要的分类模型为切入点,对协同过滤算法进行改进.在选取分类算法方面,使用支持向量机算法与K最近邻算法进行模型融合,得到一个适用于协同过滤模型的分类算法,用其代替传统协同过滤算法中的分类算法.实验结果表明,改进的个性化推荐算法模型能较好解决传统协同过滤算法存在的问题,在对用户喜好的推荐精度上有明显优化作用.  相似文献   

15.
数据挖掘中决策树分类方法研究   总被引:1,自引:0,他引:1  
分类知识的获取是数据挖掘所要实现的重要任务之一 ,其核心问题是解决分类模型的构造和分类算法实现问题。本文以决策树分类方法中有代表性的方法 C4.5为例介绍数据挖掘中的一种分类模式 :基于决策树方法的分类器的构建方法和算法。  相似文献   

16.
数据挖掘中决策树分类方法研究   总被引:2,自引:0,他引:2  
分类知识的获取是数据挖掘所要实现的重要任务之一,其核心问题是解决分类模型的构造和分类算法实现问题.本文以决策树分类方法中有代表性的方法C4.5为例介绍数据挖掘中的一种分类模式:基于决策树方法的分类器的构建方法和算法.  相似文献   

17.
朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析   总被引:3,自引:0,他引:3  
为分析对比朴素贝叶斯算法和SVM算法在Web文本分类中的效率及其适用的范围,构建了一个Web分类系统,此分类系统将已分类的Web网页作为训练集,利用分类算法构建Web分类器,通过Web测试集评价两类算法在Web文本分类中的性能体现,为Web文本分类算法选择提供一定的参考依据.  相似文献   

18.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

19.
针对竞技体育训练中的肌肉疲劳监测问题,提出了一种基于ReliefF-NOSCA-AdakNN(RNA)的表面肌电信号(sEMG)特征提取和分类算法. 该算法结合了特征和类别之间的相关性分析和启发式搜索算法,对高维特征进行了有效的筛选和分类. 将RNA算法应用于经过滤波处理的肱二头肌肌电信号数据,对不同疲劳状态进行了识别和分类. 实验结果表明,提出的RNA算法在平均分类准确率和标准差方面分别达到了83.88%和0.012 7,均显著优于传统单一算法,体现了较好的分类性能.  相似文献   

20.
基于频繁模式树的关联分类规则挖掘算法   总被引:1,自引:1,他引:1  
构建精确而有效的分类器是数据挖掘和机器学习中的一个重要任务.提出了一种基于频繁模式树的关联分类规则挖掘算法,该算法同时考虑所有属性,并对现有关联分类规则挖掘算法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案.试验结果表明,该方法可以取得比同样基于关联规则的分类算法CMAR更高的执行效率以及基于规则的决策树分类算法C4.5更好的分类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号