首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本分类(Text Categorization,TC)指的是把一个自然语言文本,根据其主题归入到预先定义好的类别中的过程.文本分类是自然语言处理的一个基础性工作,也是近年来人们研究的热点话题.针对朴素贝叶斯算法在小样本集分类效果不高的原因进行了分析,对其进行了改进和调整,提出了基于改进的朴素贝叶斯文本分类方法,试验结果表明,该方法取得了更好的效果.  相似文献   

2.
朴素贝叶斯分类器是一种简单有效的文本分类方法.改进方法利用同义词对文本的特征词集进行过滤,在一定程度上放松了朴素贝叶斯的特征独立性假设;在特征选择时迭代了2种不同的特征选择方法,有效地提高了特征集的代表性.实验结果表明,本方法有效地提高了朴素贝叶斯分类器的性能.  相似文献   

3.
一种改进的朴素贝叶斯文本分类方法   总被引:1,自引:0,他引:1  
针对网络中所存在的大量以网页等非结构化形式存在的文本资源,提出一种改进的朴素贝叶斯分类方法.首先,通过卡方检验方法求文档特征并对文档降维,提高特征词区分性信息;然后,以文本特征来代替原始词条进行朴素贝叶斯对类.实验表明,该方法不仅理论上易于建立和更新,而且分类的精确率也得到提高.  相似文献   

4.
为了提高情感分类准确率,提出了一种基于改进的TF-IDF与隐朴素贝叶斯的情感分类研究。通过改进的TF-IDF算法提取文本特征词,并根据属性之间的依赖关系添加隐藏的父节点,增强了属性之间的依赖关系,提高了情感分类的准确性。实验结果表明,在平均宏查准率、宏查全率和宏F1值在改进之后的算法分别提高了5%、8%和6%。  相似文献   

5.
为解决车辆在相对高速运动下产生网络间切换的“乒乓效应”,根据隐朴素贝叶斯分类思想,突破原有贝叶斯决策中关于属性之间完全独立的假设,建立属性间的关系,同时引入自适应修正概率,降低切换次数,避免了运算的复杂度。仿真结果表明,改进算法与原算法及其他算法相比较,可以有效降低切换次数,并且拥有更低的运行时间,提升了在车联网环境下垂直切换的稳定性与效率。  相似文献   

6.
通过对甘肃省档案局数据资源的分析研究,并与朴素贝叶斯分类算法相结合,实现对档案资源分类应用的研究.根据档案数据的特征,选用TFIDF(term frequency-inverse document frequency)算法进行选取符合档案文本主题的属性.样本实验结果证明,该分类模型适用于档案文本资源的分类,实现了档案资源自动分类的功能.相较于传统朴素贝叶斯分类方法,所提出的分类模型针对档案资源的分类效率提高了1%~2%.  相似文献   

7.
目前,手机短信成为了人们所喜爱的一种通信方式,同时也成为了商业广告或诈骗信息的载体,对人们的生活,甚至对社会的安定造成了严重的威胁。因此本文采用贝叶斯文本分类算法对垃圾短信进行了分类,进而实现其过滤,并结合黑白名单技术模拟实现了一垃圾短信过滤系统。通过测试,该系统不仅能较为准确的实现对垃圾短信的过滤,还能减少对合法短信的误判率。  相似文献   

8.
朴素贝叶斯分类(naive Bayes)有一个“独立性假设”:给定一个实例的类标签,实例中的每个属性的出现都独立于实例中其他属性的出现,而在实际应用中这种条件并不易满足,另外由于文本的特殊性,相关的特征项可能会产生新的语义信息。因此在训练文本时,对特征选择后产生的特征集用一种可行的方法考察它们之间的相关性,然后对相关程度高的特征进行合并处理。实验数据表明,这个改进的方法能提高朴素贝叶斯的算法精确度。  相似文献   

9.
高阶schrodinger方程隐式辛格式的迭代解法   总被引:1,自引:0,他引:1  
本文对以tanh(x)为基础构造的schrodnger方程的隐式辛格式建立一种迭代解法,并讨论了此迭代解法的收敛条件。  相似文献   

10.
随着监管不断加强,人们表达方式逐渐由直白向隐晦演进,情感分析任务变得更为困难。针对用于情感分析的预训练语言模型和微调阶段模型在处理包含隐式情感文本时遇到的巨大困难,本文提出了一种基于提示学习模型(一种弥合了预训练模型和微调阶段模型的模型)和类别差异化损失的方法ImplicitPrompt,将隐式的情感显式化,区分不同情感标签的距离,提升隐式情感分类的准确率。在英文方面级情感分类标准数据集上进行实验的结果表明,本文模型在标准监督设置下和低资源设置下均能在文本隐式情感分类中取得最佳效果。  相似文献   

11.
隐朴素贝叶斯(Hidden Naive Bayes,HNB)算法是一种结构扩展后的朴素贝叶斯分类改进算法,其分类精确率较原算法有了很大的提高,但是在分类过程中,HNB算法没有考虑测试实例的各个特征属性的不同取值对分类的贡献程度。针对这个问题,构建相应的加权函数计算各个特征属性取不同值时对分类的贡献程度,并利用得到的结果对HNB算法中用到的条件概率计算公式加权,得到了一个改进的HNB算法,然后利用加利福尼亚大学的埃文斯标准数据集(University of California Irvine,UCI)在Eclipse上对其进行数值实验,结果表明,改进的HNB算法较原始HNB算法的分类精确率有了较大提高。  相似文献   

12.
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。  相似文献   

13.
预测大盘指数的涨跌幅度在股票投资中具有重要的意义。大盘指数的涨跌既与国家的宏观经济政策有关,也与大盘指数自身运行状态有关。结合朴素贝叶斯分类算法和股票大盘指数涨跌的影响因素建立了大盘指数分类预测模型,以上证指数为例进行了实验,结果表明分类预测模型有效,准确性较高。  相似文献   

14.
基于朴素贝叶斯分类的考试成绩监测机制的研究   总被引:1,自引:0,他引:1  
考试成绩是现阶段衡量高等院校学生质量的重要指标之一,本文利用数据挖掘技术,通过朴素贝叶斯分类方法,探索一种有效的监测学生考试成绩变化趋势的机制。  相似文献   

15.
将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型. 首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类. 实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果.  相似文献   

16.
图像消噪是图像分割和识别的必要预处理。根据噪声的统计特征和频谱分布规律以及图像特点,人们提出并发展了多种不同的图像消噪方法。基于朴素贝叶斯分类决策的图像消噪效果良好,在图像消噪和细节保留上取得了合理的平衡。  相似文献   

17.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

18.
朴素贝叶斯算法是一种简单而高效的分类算法,但是它的条件独立性假设和数据完备性要求,影响了其分类性能;在此提出了一种基于EM算法和偏最小二乘的加权朴素贝叶斯分类算法,实验结果验证了该算法的有效性.  相似文献   

19.
朴素贝叶斯分类器是一种简单、高效的分类算法,它以贝叶斯定理和最大后验假设为理论基础,然而朴素贝叶斯分类器属性之间相互独立的假设,影响了朴素贝叶斯分类器的性能.提出先使用基于相关的属性选择算法进行属性选择,然后在选择的属性集上,用朴素贝叶斯分类器对数据集进行分类.实验证明,与未使用属性选择的实验结果相比,使用基于相关的属性选择算法进行属性选择后,朴素贝叶斯分类器平均分类正确率提高,分类效率显著提升.  相似文献   

20.
构造高阶Schrodinger方程iδu/δt+(-1)^mδ^2mu/δx^2m=0的一类半隐式差分格式,给出了它们的稳定性条件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号