首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

2.
朴素贝叶斯算法因其分类精度高、模型简单等优点而被得到普遍应用,但因为它需要具备很强的属性之间的条件独立性假设,使得其在实际分类学习中很难实现.针对这个缺点,提出了一种基于遗传算法的加权朴素贝叶斯分类算法(G_WNB).该算法将遗传算法(GA)与加权朴素贝叶斯分类算法(WNB)相结合,首先使用基于Rough Set的加权朴素贝叶斯分类算法,综合信息论与代数论给出的属性权值求解方法,计算出每个属性的权值,以初始权值作为初始种群,加权朴素贝叶斯的分类正确率为适应度函数,采用遗传算法优选,以使适应度函数最高的权值为数据集的最终权值,最后使用G_WNB进行分类.实验表明,该算法提高了分类准确率,同时提高了朴素贝叶斯分类器的性能.  相似文献   

3.
基于条件互信息下聚类的朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
 采用条件互信息来度量任意2个条件属性之间的关联程度,采用互信息度量各条件属性与类属性间的关联程度,以此作为将各条件属性进行聚类的准则,提出一种新的将条件属性进行聚类的分组技术.同时,结合朴素贝叶斯分类算法,构造了改进的朴素贝叶斯分类模型.通过仿真实验表明该文提出的算法具有较好的分类性能.  相似文献   

4.
针对朴素贝叶斯算法在处理不平衡数据时准确率不高的问题,提出类权重和属性值权重相结合的双重加权朴素贝叶斯算法.双重加权可降低算法的属性独立假设对分类结果的影响,提升少数类对分类过程的作用.乳腺癌患者复发率预测结果表明,双重加权朴素贝叶斯算法相对于传统的朴素贝叶斯算法、属性值加权的朴素贝叶斯、K最近邻分类算法、支持向量机分...  相似文献   

5.
在原有中医药冠心病临床治疗数据采集系统的基础上,使用中医证型的辨证相关因素,提出属性加权朴素贝叶斯算法,并应用到冠心病中医证型的分类模型之中.实验结果显示,对于冠心病4种证型的分类,运用属性加权朴素贝叶斯分类算法都略高于朴素贝叶斯分类算法.实验结果表明属性加权朴素贝叶斯分类算法在中医冠心病临床诊断中具有良好的分类性能.  相似文献   

6.
基于属性约简的PLS加权朴素贝叶斯分类   总被引:1,自引:0,他引:1  
朴素贝叶斯算法是一种简单而高效的分类算法,它的属性独立性假设,影响了它的分类性能.针对这种问题,在分析属性相关性的基础上,通过属性约简选择一组近似独立的属性约简子集,提出一种基于属性约简的偏最小二乘回归加权朴素贝叶斯分类算法.对不同的条件属性给予不同的权值,从而在保持简单性的基础上有效地提高了朴素贝叶斯分类算法的分类性能.实验结果表明,该方法可行且有效.  相似文献   

7.
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。  相似文献   

8.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

9.
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升.  相似文献   

10.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设使其无法将属性间的依赖关系表达出来,影响了它分类的正确率,加权朴素贝叶斯是对它的一种扩展.基于强属性限定的贝叶斯分类器SANBC,通过在强弱属性之间添加增强弧以弱化朴素贝叶斯的独立性假设,扩展了朴素贝叶斯分类器的结构;结合加权朴素贝叶斯和基于强属性限定的贝叶斯分类器SANBC的优点,提出一种基于强属性限定的加权贝叶斯分类器WSANBC;实验结果表明,WSANBC分类器具有较高的分类正确率.  相似文献   

11.
利用加权核Fisher准则,给出一种朴素贝叶斯分类器的改进算法。该算法通过寻找使类与类最大分离的最优投影矩阵,将样本数据进行投影变换,再利用朴素贝叶斯分类器对新样本进行分类。将该方法应用于双酚A生产过程在线监测数据集的分类中,仿真结果表明,相比于单纯朴素贝叶斯分类器,该分类算法具有更好的分类性能。  相似文献   

12.
为了提高朴素贝叶斯算法的复合语言文本分类准确度和效率,将加权朴素贝叶斯算法用于复合语言文本分类,采用量子遗传算法对权重参数进行优化;根据贝叶斯定理建立语言文本分类模型,考查样本属性之间的差异对分类结果的影响;然后引入属性权重,形成加权朴素贝叶斯文本分类模型;利用遗传算法对权重参数进行优化,借助量子比特运算提高遗传优化效...  相似文献   

13.
朴素贝叶斯算法是一种简单而高效的分类算法,但是它的条件独立性假设和数据完备性要求,影响了其分类性能;在此提出了一种基于EM算法和偏最小二乘的加权朴素贝叶斯分类算法,实验结果验证了该算法的有效性.  相似文献   

14.
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。  相似文献   

15.
朴素贝叶斯分类算法是一种简单并且高效的分类算法,但条件独立性假设在现实中很难满足,导致其性能有所下降.为了解决该问题,本文在关联规则和置信度的基础上对该分类算法进行了改进.通过挖掘出来的关联规则和该规则的置信度,对不同的属性赋予不同的权重,同时实现了该分类算法的MapReduce化,从而在保持简单性的基础上有效地提高了朴素贝叶斯分类算法的分类性能.动车组运维实验表明:该算法提高了分类的准确率和效率.  相似文献   

16.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设影响了它分类的正确率.加权朴素贝叶斯是对它的一种扩展.通过分析属性相关性的度量和属性约简,选择一组最近似独立的属性约简子集,并结合加权朴素贝叶斯和选择性贝叶斯分类器的优点,提出一种选择性的加权贝叶斯分类器SWNBC.实验结果表明,与朴素贝叶斯分类器相比,WSANBC分类器具有较高的分类正确率.  相似文献   

17.
面对生活中数据信息量大的问题,常使用粗糙集对数据进行知识约简,消除数据中冗余的部分。但大多数研究没有考虑约简后对原有分类的影响;常使用的朴素贝叶斯算法又难以获得其先验概率。基于上述问题,本文提出了一种基于粗糙集的贝叶斯分类算法:首先利用粗糙集中决策属性和条件属性之间的依赖关系,进行属性约简,消除冗余的数据,然后通过贝叶斯算法对约简后的数据进行知识挖掘,最后通过对故障源数据的对比分析。该方法既避开了朴素贝叶斯算法对先验概率的要求,又使得数据分类和预测能力有了明显提升。  相似文献   

18.
一种改进的朴素贝叶斯分类器在文本分类中的应用研究   总被引:1,自引:0,他引:1  
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

19.
混合式朴素贝叶斯分类模型   总被引:3,自引:0,他引:3  
为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合。将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率。  相似文献   

20.
朴素贝叶斯模型具有的简单性和有效性,使其在诸多问题领域表现出优良的性能,但其属性条件独立性假设在实际应用中难以成立.而属性加权是降低属性条件独立性假设对分类器性能影响的主要途径.传统建立在整个数据集上的单一全局模型忽略了每个测试实例所具有的特点,同时从整个训练集上学习到的属性权重并不能准确反映每个属性对待分类实例的影响.为此提出一种基于数据驱动的懒惰式局部属性加权方法,它在每个测试实例的近邻集合上学习属性权重,并通过最优化方法建立相应的局部属性加权朴素贝叶斯模型.实验结果表明:和当前常见的准朴素贝叶斯模型相比,本文模型具有较高的分类准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号