首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于类别核心词的朴素贝叶斯中文文本分类   总被引:5,自引:0,他引:5  
摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用. 基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率.  相似文献   

2.
将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型. 首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类. 实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果.  相似文献   

3.
混合式朴素贝叶斯分类模型   总被引:3,自引:0,他引:3  
为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合。将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率。  相似文献   

4.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

5.
关系朴素贝叶斯分类算法对于目标关系表和背景关系表中不同的记录关联方式采用不同的策略,灵活运用连接和元组ID传播技术,高效地实现了将背景关系表中的信息加入到目标关系表中一起考虑来进行分类,提高了分类正确率。该算法采用关系数据库的数据表示方式,解决了传统的朴素贝叶斯算法不能支持关系数据库的问题。  相似文献   

6.
针对传统朴素贝叶斯算法属于浅层学习,其特征独立性假设易引起分类效果欠佳的问题,提出一种深度集成朴素贝叶斯模型;该模型受深度森林中集成思想的启发,将高斯朴素贝叶斯、多项式朴素贝叶斯、伯努利朴素贝叶斯3种浅层基分类器集成为具有深层学习结构的朴素贝叶斯模型。结果表明:提出的深度集成朴素贝叶斯模型不仅克服了浅层学习特征表达能力不足的问题,而且缓解了特征独立性假设的缺点;通过在经典文本分类数据集上的实验,证明了提出的深度集成朴素贝叶斯模型的精确率、召回率以及精确率与召回率的调和平均数F_1值显著增大,模型性能良好。  相似文献   

7.
一种改进的朴素贝叶斯分类器在文本分类中的应用研究   总被引:1,自引:0,他引:1  
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

8.
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。  相似文献   

9.
图像消噪是图像分割和识别的必要预处理。根据噪声的统计特征和频谱分布规律以及图像特点,人们提出并发展了多种不同的图像消噪方法。基于朴素贝叶斯分类决策的图像消噪效果良好,在图像消噪和细节保留上取得了合理的平衡。  相似文献   

10.
一种基于主动贝叶斯分类技术的垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点.对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性.  相似文献   

11.
为了提高情感分类准确率,提出了一种基于改进的TF-IDF与隐朴素贝叶斯的情感分类研究。通过改进的TF-IDF算法提取文本特征词,并根据属性之间的依赖关系添加隐藏的父节点,增强了属性之间的依赖关系,提高了情感分类的准确性。实验结果表明,在平均宏查准率、宏查全率和宏F1值在改进之后的算法分别提高了5%、8%和6%。  相似文献   

12.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

13.
预测大盘指数的涨跌幅度在股票投资中具有重要的意义。大盘指数的涨跌既与国家的宏观经济政策有关,也与大盘指数自身运行状态有关。结合朴素贝叶斯分类算法和股票大盘指数涨跌的影响因素建立了大盘指数分类预测模型,以上证指数为例进行了实验,结果表明分类预测模型有效,准确性较高。  相似文献   

14.
一种基于粗糙集的朴素贝叶斯分类算法   总被引:3,自引:0,他引:3  
朴素贝叶斯分类器的计算过程只有在完全数据库中才成立,而基于相似关系的粗糙集模型具有处理空值的功能,并且提供了属性离散化和约简技术,可以改善属性间的依赖关系。因此,将两种不同的软计算方法相结合,利用粗糙集合理论先把决策表补齐,再对数据进行约简,然后结合朴素贝叶斯分类器,得出分类结果。实验证明这种方法不仅简化了数据和模型的规模,也具有对不完全数据的分类能力。  相似文献   

15.
朴素贝叶斯分类挖掘技术在零售业的应用   总被引:2,自引:0,他引:2  
当前零售业对每位顾客大都采取同样的推销策略,使服务成本加大,而收效甚微的前提下,本文从数据挖掘角度,利用朴素贝叶斯分类预测技术,从顾客数据库中发现潜在顾客群体,为今后零售业调整有效的顾客服务策略提供准确的参考信息及科学的决策依据。  相似文献   

16.
把总糖、还原糖、总氮、烟碱、总氯和总钾这6个成分含量作为影响烤烟烟叶产地的自变量,利用朴素贝叶斯分类算法(NBC)建立烤烟烟叶生产地的判别模型.结果表明,用朴素贝叶斯分类建立的烟叶产地识别模型建模、留一法、预报准确度分别为91.24%、89.05%和88.24%,而用支持向量机分类和K点最近邻分类建立的烟叶产地识别模型的准确率均低于朴素贝叶斯分类建立的模型.可见利用朴素贝叶斯分类算法对烟叶产地进行模式识别研究,可以很好地反映烟叶样本由于产地的不同带来的差异.因此可以将NBC算法引入到烟草行业的研究中.  相似文献   

17.
在已有上机实验数据的基础上,使用综合的权值计算方法,将加权朴素贝叶斯分类算法应用到学生成绩分析与预测中.实验结果显示,对于学生的成绩分类,使用综合权值的结果优于传统权值的分类结果,表明使用文中的加权贝叶斯方法分析学生成绩是切实可行的.  相似文献   

18.
提出了一种基于朴素贝叶斯分类算法的决策系统框架,为实现高校招生宣传决策提供支持。  相似文献   

19.
朴素贝叶斯分类在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据库信息分类中,朴素贝叶斯分类模型是一种简单有效的分类方法,它理论基础好,分类精度高.本文运用朴素贝叶斯分类的方法,对所给数据进行分类和预测,通过一个实例给出了该算法对于预测数据进行分类的详细过程.  相似文献   

20.
提出了一种基于朴素贝叶斯分类算法的决策系统框架,为实现高校招生宣传决策提供支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号