首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 750 毫秒
1.
朴素贝叶斯分类作为一种统计分类的方法,简单高效,但它是建立在属性独立性假设的基础上,有一定的局限性,影响了它的分类效果.x2统计是一种度量属性相关性的方法,通过属性相关的分析,可以对属性进行约简,去除冗余和无关属性,达到简化朴素贝叶斯分类器的目的.朴素贝叶斯分类器的扩展方法是在非类父子结点之间添加扩展弧,表示相关属性间的依赖关系,从而扩展朴素贝叶斯分类器的结构.在数据集上的实验结果显示,KEANBC分类器优于NBC分类器,提高了分类正确率.  相似文献   

2.
本研究以全国清香型、浓香型、中间香型烤烟为研究对象,以6个区域24个C3F中部叶为分类样本,采用随机森林分类算法进行香型分类,结果表明:随机森林算法对烤烟香型起到了很好的区分作用,分类正确率达到了87.5%;基于随机森林分类的同时得到了分类变量在香型分类中的重要性,烟叶常规化学成份在香型分类中的重要性从高到低依次为:总钾→总氮→总糖→还原糖→总氯→烟碱.因此,随机森林分类可以用于烤烟的香型分类,同时也可以用于判断分类变量对分类目标的重要性程度.  相似文献   

3.
为了提高朴素贝叶斯算法的复合语言文本分类准确度和效率,将加权朴素贝叶斯算法用于复合语言文本分类,采用量子遗传算法对权重参数进行优化;根据贝叶斯定理建立语言文本分类模型,考查样本属性之间的差异对分类结果的影响;然后引入属性权重,形成加权朴素贝叶斯文本分类模型;利用遗传算法对权重参数进行优化,借助量子比特运算提高遗传优化效...  相似文献   

4.
一种改进的朴素贝叶斯分类器在文本分类中的应用研究   总被引:1,自引:0,他引:1  
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

5.
在原有中医药冠心病临床治疗数据采集系统的基础上,使用中医证型的辨证相关因素,提出属性加权朴素贝叶斯算法,并应用到冠心病中医证型的分类模型之中.实验结果显示,对于冠心病4种证型的分类,运用属性加权朴素贝叶斯分类算法都略高于朴素贝叶斯分类算法.实验结果表明属性加权朴素贝叶斯分类算法在中医冠心病临床诊断中具有良好的分类性能.  相似文献   

6.
混合式朴素贝叶斯分类模型   总被引:3,自引:0,他引:3  
为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合。将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率。  相似文献   

7.
在分析航空滚动轴承典型缺陷形成原因的基础上,对缺陷分类识别模型的工作原理及组成、航空滚动轴承典型缺陷的特征分类及特征参数进行了研究。利用朴素贝叶斯分类器与图像处理技术相结合的方法,构建基于小样本数据的分类识别算法,对航空滚动轴承典型缺陷进行分类与识别。实验结果表明:该算法对航空滚动轴承典型缺陷具有较好的识别准确度。  相似文献   

8.
为提高电子文本分类效果,解决独立同分布模型在标记数据不足时存在的参数估计问题,提出了一种基于Nesterov平滑的高阶路径朴素贝叶斯文本分类算法.首先,利用传统意义的朴素贝叶斯事件模型构建高阶路径形式的文本分类模型,利用高阶路径中的隐式链接信息来提高文本分类模型的性能;其次,针对朴素贝叶斯事件模型中采用拉普拉斯平滑的二阶差分过程容易产生信息丢失、噪声增强的问题,提出基于Nesterov平滑的高阶路径朴素贝叶斯文本分类改进算法;最后,通过基准数据集和图书馆电子文本分类实验,验证了所提算法的有效性.  相似文献   

9.
通过对甘肃省档案局数据资源的分析研究,并与朴素贝叶斯分类算法相结合,实现对档案资源分类应用的研究.根据档案数据的特征,选用TFIDF(term frequency-inverse document frequency)算法进行选取符合档案文本主题的属性.样本实验结果证明,该分类模型适用于档案文本资源的分类,实现了档案资源自动分类的功能.相较于传统朴素贝叶斯分类方法,所提出的分类模型针对档案资源的分类效率提高了1%~2%.  相似文献   

10.
为了探讨朴素贝叶斯分类在仪表故障判断领域的应用价值,通过将某核电厂压力表故障的历史信息进行分类汇总,将故障的判断转换成文本分类任务,结合朴素贝叶斯分类算法和自然语言处理建立故障的分类模型,实现对新增故障的准确判断。通过验证,朴素贝叶斯分类模型能够对新增故障进行判断分类。测试中需要进行校验类故障准确率能够达到95%以上,其他类故障准确率高于70%。传统故障判断一般是由人来完成,通过贝叶斯分类模型实现对故障的判断,可减轻人员劳动强度,提高工厂维修自动化水平。  相似文献   

11.
朴素贝叶斯分类器是一种简单而高效的分类器,但它的条件独立性假设影响了它分类的正确率.加权朴素贝叶斯是对它的一种扩展.通过分析属性相关性的度量和属性约简,选择一组最近似独立的属性约简子集,并结合加权朴素贝叶斯和选择性贝叶斯分类器的优点,提出一种选择性的加权贝叶斯分类器SWNBC.实验结果表明,与朴素贝叶斯分类器相比,WSANBC分类器具有较高的分类正确率.  相似文献   

12.
在朴素贝叶斯分类的基础上建立了一种增强型分类器系统,并在对1997~2002年夏季青藏高原上MCS(Mesoscale Convective System)进行自动追踪的基础上,对MCS的移动方向与其周边环境物理量场的分布特征进行了分类研究.进而,将分类结果与决策树、人工神经网络分类方法进行了比较.研究表明,与其他分类方法相比,使用增强型的贝叶斯分类器预测MCS的移动路径具有较好的效果,这为揭示高原上MCS的移动规律、提高长江中下游地区灾害天气预报的准确率提供了一种有效的方法.  相似文献   

13.
介绍粗糙集基础上的属性分类系统的构造,给出一种数据挖掘中新的分类方法:从初始的数据信息出发,依次构造约简属性集,并对其使用Bayes判别法进行基于属性的分类。最后给出了实例,验证算法的可行性。  相似文献   

14.
基于云模型理论对朴素贝叶斯分类器进行了改进,使得分类器能够处理语言中的一些模糊值,扩展了朴素贝叶斯分类器的应用范围.使用UCI鸢尾花数据集对算法进行了实验仿真和结果分析.结果表明,改进后的分类算法在一定程度上提高了分类精度.  相似文献   

15.
湘西主产烟区烤烟常规化学成分分析与评价   总被引:1,自引:0,他引:1  
对2006年湘西2大主产烟区(桑植烟区和龙山烟区)202个烤烟样本的5种常规化学成分进行了分析与评价,并与云南烤烟的常规化学成分进行了对比分析.结果表明:2大主产烟区烤烟总糖含量略高于优质烟叶范围,但均低于云南烟叶总糖含量;烟碱含量大多在适宜水平偏高区域,且大都高于云南烟叶烟碱水平;氯和总氮含量多在优质烟叶化学含量指标范围内,糖碱比和钾氯比大小基本适宜,但糖碱比大都低于云南烟叶糖碱比;氮碱比值低于优质烤烟含量范围.说明要进一步提高湘西地区烟叶的化学品质,需改善生态及栽培条件,运用复烤调制技术,降低总糖及烟碱含量,提高含钾水平.  相似文献   

16.
针对网络流量协议标注比较困难的问题,提出一种基于贝叶斯网络的半监督学习模型,以提高Inter-net协议的识别精度.该模型首先使用少量的标注样本训练贝叶斯网络分类模型,并对未标注样本进行初始分类,然后从未标注样本中挑选分类损失最小的样本加入到训练集中并重复训练分类模型,经过多次循环训练出最终的分类器.该模型可以使用未标注样本和标注样本共同训练分类模型,非常适合于标注比较困难的Internet应用协议的识别.实验结果表明:在标注样本较少的情况下,该模型的识别精度和稳定性均优于朴素贝叶斯模型和贝叶斯网络模型,对于提高Internet协议的识别精度是有效的.  相似文献   

17.
为探索昭通烟区烟叶糖质量分数与其气象因子的关系,研究了2011-2015年昭通烟区3个主要基地(昭阳、彝良、镇雄)烤烟K326各部位初烤烟叶糖质量分数(总糖、还原糖、两糖差)与气象因子的相关性.结果表明:昭通烟区各部位初烤烟叶的总糖质量分数与大田期5-8月日照时数、降雨量、温度的相关性因基地不同而异;各部位初烤烟叶还原糖质量分数与大田期5-8月日照时数负相关、与降雨量正相关、与气温的相关性因基地不同而异;各部位初烤烟叶两糖差与大田期5-8月日照时数正相关、与降雨量负相关、与温度的相关性因基地不同而异.因此,影响昭通烟区各部位初烤烟叶两糖协调性的主导生态因素为大田期5-8月的日照时数和降雨量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号