首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 500 毫秒
1.
一种改进的朴素贝叶斯分类器在文本分类中的应用研究   总被引:1,自引:0,他引:1  
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

2.
朴素贝叶斯分类作为一种统计分类的方法,简单高效,但它是建立在属性独立性假设的基础上,有一定的局限性,影响了它的分类效果.x2统计是一种度量属性相关性的方法,通过属性相关的分析,可以对属性进行约简,去除冗余和无关属性,达到简化朴素贝叶斯分类器的目的.朴素贝叶斯分类器的扩展方法是在非类父子结点之间添加扩展弧,表示相关属性间的依赖关系,从而扩展朴素贝叶斯分类器的结构.在数据集上的实验结果显示,KEANBC分类器优于NBC分类器,提高了分类正确率.  相似文献   

3.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设使其无法将属性间的依赖关系表达出来,影响了它分类的正确率,加权朴素贝叶斯是对它的一种扩展.基于强属性限定的贝叶斯分类器SANBC,通过在强弱属性之间添加增强弧以弱化朴素贝叶斯的独立性假设,扩展了朴素贝叶斯分类器的结构;结合加权朴素贝叶斯和基于强属性限定的贝叶斯分类器SANBC的优点,提出一种基于强属性限定的加权贝叶斯分类器WSANBC;实验结果表明,WSANBC分类器具有较高的分类正确率.  相似文献   

4.
通过对朴素贝叶斯分类器的讨论, 提出将贝叶斯方法应用于医学图像分割后的图像分类思想. 给出一种基于朴素贝叶斯分类器的图像分类方法, 对从尿沉渣图像中识别出的微粒进行正确分割及特征提取与选择, 并利用朴素贝叶斯分类器进行分类. 实验结果表明, 所提出的方法用于解决图像分类有效.  相似文献   

5.
朴素贝叶斯分类方法是一种广泛使用的分类算法,在独立性假设不完全满足的情况下计算效率和分类效果均较为理想.通过分析全局特征向量中各特征与类别属性之间的联系,提出将组合特征置换多源特征,用组合特征的共现率对多源特征进行概率调整的新方法,在不同数据集的实验中,调整后的朴素贝叶斯分类器(FRNB)的分类精度均好于传统朴素贝叶斯分类器.测试结果表明,改进后的算法是有效可行的.  相似文献   

6.
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升.  相似文献   

7.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设影响了它分类的正确率.加权朴素贝叶斯是对它的一种扩展.通过分析属性相关性的度量和属性约简,选择一组最近似独立的属性约简子集,并结合加权朴素贝叶斯和选择性贝叶斯分类器的优点,提出一种选择性的加权贝叶斯分类器SWNBC.实验结果表明,与朴素贝叶斯分类器相比,WSANBC分类器具有较高的分类正确率.  相似文献   

8.
基于云模型理论对朴素贝叶斯分类器进行了改进,使得分类器能够处理语言中的一些模糊值,扩展了朴素贝叶斯分类器的应用范围.使用UCI鸢尾花数据集对算法进行了实验仿真和结果分析.结果表明,改进后的分类算法在一定程度上提高了分类精度.  相似文献   

9.
针对朴素贝叶斯分类器忽略属性间依赖关系造成分类准确性降低的问题,提出了基于贪婪选择算法的半朴素贝叶斯分类器分组改进算法.改进过程中依据不同参数的调整和属性选择技术衍生出3种分组方法,获得不同的改进方式,建立了贪婪选择半朴素贝叶斯分类器,实验采用UCI数据库中选取的数据进行分类.结果表明,改进的分类器具有良好的分类准确率.  相似文献   

10.
朴素贝叶斯分类器是一种简单有效的文本分类方法.改进方法利用同义词对文本的特征词集进行过滤,在一定程度上放松了朴素贝叶斯的特征独立性假设;在特征选择时迭代了2种不同的特征选择方法,有效地提高了特征集的代表性.实验结果表明,本方法有效地提高了朴素贝叶斯分类器的性能.  相似文献   

11.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

12.
基于贝叶斯网络的分类器研究   总被引:28,自引:2,他引:28  
研究了贝叶斯分类器家族中具有代表性的分类器,即朴素(naIve)贝叶斯分类器、贝叶斯网络分类器和TAN(tree augmented Bayesian)分类器;发现属性变量之间的依赖相对于属性变量与类变量之间的依赖是可以忽略的,因此在所有树形分类器中TAN分类器是最优的.  相似文献   

13.
朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了每个测试实例所具有的特点,同时从整个训练集上学习到的属性权重并不能准确反映每个属性对待分类实例的影响.为此提出一种基于数据驱动的懒惰式局部属性加权方法,它在每个测试实例的近邻集合上学习属性权重,并通过最优化方法建立相应的局部属性加权朴素贝叶斯模型.实验结果表明:和当前常见的准朴素贝叶斯模型相比,本文模型具有较高的分类准确率.  相似文献   

14.
明文特征是基于应用层静态特征的一种识别方法,需要提取出应用层数据的特征信息;而朴素贝叶斯分类是基于大量统计信息的一种识别方法,主要用来识别加密的Peer-to-Peer(P2P)流量。着重介绍了采用明文特征和朴素贝叶斯分类相结合的方法,对加密的以及未加密的P2P流量进行识别。测试结果表明,这种方法可以较准确地识别出P2P流量。  相似文献   

15.
基于权值调整的文本分类改进方法   总被引:14,自引:0,他引:14  
文本分类是文本挖掘的基础与核心 ,可广泛应用于传统的情报检索和 Web信息的检索与挖掘等。提出了一种利用权值调整思想对向量空间法 (VSM)和朴素 Bayes分类器 (NBC)进行改进的文本分类方法 ,并探讨了利用 EM算法进行无导师 Bayes分类的方法 ,设计和实现了一个中英文文本分类系统 CZW。 3组实验数据表明 ,用某些评估函数调节单词权值可有效提高 VSM和 NBC等文本分类模型的精度 ,并且训练文本规模越大 ,改进的效果越明显。 NBC的分类精度最高可达 86 %。  相似文献   

16.
为了提高信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的基于分类和扩展向量空间模型CE-BVSM(Classifier and Expand-Based Vector Space Model)。该模型对传统的空间向量法进行了改进,引入分词技术、朴素贝叶斯分类器和专业词库,重新定义了资源特征向量和查询索引项的内容,参考关键词出现的频率及其在所描述的资源中所起的作用等因素来计算特征索引项和资源向量的权重值。在此基础上,又对查询索引项使用了基于专业词库的扩展策略。实验证明该模型使检索能够在相对精确的范围内进行,提高检索查准率和查全率,改善了信息检索系统的性能。  相似文献   

17.
朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析   总被引:3,自引:0,他引:3  
为分析对比朴素贝叶斯算法和SVM算法在Web文本分类中的效率及其适用的范围,构建了一个Web分类系统,此分类系统将已分类的Web网页作为训练集,利用分类算法构建Web分类器,通过Web测试集评价两类算法在Web文本分类中的性能体现,为Web文本分类算法选择提供一定的参考依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号