首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 792 毫秒
1.
基于支持向量机的文本分类技术研究   总被引:2,自引:2,他引:0  
介绍了文本分类的基本过程,讨论了常用的文本分类方法如K-最近邻分类算法K-NN(K-Nearest Neighbors,K-NN)、朴素贝叶斯分类算法NB(Naive Bayesian Classifier,NB)、决策树分类算法DT(Decision Trees,DT),并探讨了基于支撑向量机SVM(Support Vector Machines,SVM)的文本分类基本原理及方法.  相似文献   

2.
随着人们对数据挖掘理论知识的不断研究和探讨,数据挖掘技术和应用领域日趋成熟和广泛。在数据挖掘技术中,决策树方法是用于分类和预测的重要方法之一。本文对决策树构造方法中最为常用的ID3算法进行分析和研究,并将ID3算法在构件库中进行应用,证明了决策树分类方法在构件库领域中的应用前景。  相似文献   

3.
决策树分类ID3算法研究   总被引:1,自引:0,他引:1  
张桂杰  王帅 《松辽学刊》2008,29(3):135-137
分类是数据挖掘的重要内容之一,在许多领域得到广泛应用,现已有多种分类方法,其中决策树分类法在海量数据环境中应用最为广泛,本文分析了决策树分类ID3算法的原理,给出构造决策树的基本算法,指出ID3算法构造决策树的优缺点,针对ID3算法倾向于取值较多的测试属性的缺点,引入一个参数来约束属性选择,给出一种优化算法.  相似文献   

4.
随着PACS系统在我国各医院的普及,PACS数据库中存储了大量的医学图像信息,如何把这些图像进行分类来提供相似病例图片,从而为临床诊断提供辅助帮助已成为研究热点.关于医学图像的分类,已有很多学者从不同方面用不同方法进行了研究.本文使用贝叶斯决策树的方法对PACS数据库进行教据挖掘,实现医学图片的分类.贝叶斯决策树不仅能够提高分类的准确率,而且能够处理不一致,不完整数据等"脏数据",本文充分发挥了贝叶斯方法和决策树方法的优点,通过对肺癌图片进行良性、恶性分类,证明了本方法的有效性.  相似文献   

5.
基于粗集的ID3算法研究   总被引:5,自引:0,他引:5  
决策树是数据挖掘任务中分类的常用方法,ID3算法是经典的决策树生成算法,它的核心是通过计算各个属性的信息熵来确定最好的分枝结点.给出一种用粗集的方法计算信息熵,应用ID3算法来生成决策树.  相似文献   

6.
以齐齐哈尔市辖区为研究区域,利用分类回归树(Classification and Regression Tree,CART)算法从训练样本数据集中挖掘分类规则,集成遥感影像的光谱特征、纹理特征和地学辅助数据建立研究区的决策树模型.用实测的GPS样本点对分类结果进行精度验证,并与最大似然监督分类方法(Maximum Likelihood Classification,MLC)进行对比.结果表明,基于CART的决策树分类结果的总精度和Kappa系数分别为82.24%和0.77,分类精度较MLC监督分类方法有明显提高,有较好的分类效果.  相似文献   

7.
用随机决策树群算法进行高光谱遥感影像分类   总被引:1,自引:0,他引:1  
摘要: 高光谱影像具有丰富的光谱信息,与全色、多光谱影像相比能更好地进行地面目标的分类识别. 该文对决策树分类算法的优劣进行分析,引入随机决策树群算法,对青海省祁连县Hyperion高光谱影像和IRS-P6影像数据进行实验,使用子空间划分和光谱距离进行降维后,分别采用支持向量机、神经网络、最大似然法进行分类,并与随机决策树群算法分类结果进行比较. 结果表明,该算法表现最优且无需降维预处理,可广泛应用于高光谱遥感领域.  相似文献   

8.
一种文本分类数据挖掘的技术   总被引:7,自引:0,他引:7  
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性.  相似文献   

9.
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率.  相似文献   

10.
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.  相似文献   

11.
在分析决策树算法及遗传算法的基础上,提出了一种将两种算法结合起来挖掘分类规则的新方法.实验证明,它不仅解决了数据挖掘中的“碎片”问题,同时还提高了分类的准确率.  相似文献   

12.
银行贷款风险评估一直是金融界高度关注的主要问题,现有方法主要包括K-means聚类、BP神经网络、简单决策树、VAR方法等多种风险评估算法。但对于客户属性值缺失的案例,上述方法就很难达到良好的效果。为了解决属性值缺失的风险评估问题。提出了一种基于贝叶斯决策树算法的贷款风险评估算法(DBT ),实验结果证明了该算法的有效性。  相似文献   

13.
在测试代价敏感决策系统中,测试代价敏感属性约简方法是一种寻找测试代价尽量小的属性集的有效方法.但是,约简后决策系统只保留了简洁完整的信息,其所构造的分类器精度会有所降低.假设我们拥有有限但多于最小测试代价的资源,那么我们可以充分利用这些资源来获得更高质量的分类器.本文针对这种情况做了以下两个工作:1)我们在最小测试代价约筒的基础上添加好属性,寻找一个更好的属性集.2)提出了一种改进的决策树算法,提高分类器质量.该算法选择一些当前最好的属性值来构建结点,这些属性值能够覆盖当前相应的训练集.实验表明:1)改进的决策树算法能够获得比ID3更高的分类准确度;2)与最小测试代价约简的分类器相比,在最小测试代价约筒的基础上添加一些的好属性,可以获得更高质量的分类器;3)该方法在减少测试代价开销的同时,保证了分类器的质量.  相似文献   

14.
采用数据挖掘技术中的决策树方法,进行收视数据分析.收集大量的调查问卷作为待挖掘的样本,利用决策树经典算法C4.5,对样本集中的样本进行 学习,构造出一棵决策树.对决策树进行分析,得出电视收视分析相关的知识和规律,作为节目编制等的决策依据.  相似文献   

15.
阐述了风险决策中的决策树问题,举例分析了决策树如何为决策者提供最优方案.  相似文献   

16.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号