排序方式: 共有68条查询结果,搜索用时 15 毫秒
31.
基于特征相关的改进加权朴素贝叶斯分类算法 总被引:1,自引:0,他引:1
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高. 相似文献
32.
基于滑动窗口的优化贝叶斯邮件过滤算法 总被引:1,自引:0,他引:1
贝叶斯算法在文本分类时需要进行特征提取,传统特征提取算法存在特征提取不够准确,进而导致分类效率不高。为解决此问题,提出一种基于滑动窗口的特征选取方法,该方法能扩大特征的选取范围。实验表明,改进后的方法可以有效地提高文本的分类精度 相似文献
33.
在文本分类中,选取一个高效的分类算法是提高文本分类准确度,缩短分类时间的关键。提出基于指数分布族的多项式贝叶斯类特定分类算法(exponential family-multinomial naive Bayes,EF-MNB),基于多项式模型构造了N个类的分布,利用类特定特征选择算法得到第N个类的特征子集及对应类的特征概率密度函数(probability density function,PDF),通过指数分布族构造了N个类的原始PDF估计表达式,给定N个类的训练集,得到了第N个类的最优PDF估计,并基于贝叶斯定理制定了分类规则。仿真结果表明,与基于文档主题生成模型和支持向量机(latent dirichlet allocation-support vector machine,LDA-SVM)的层次分析分类算法、改进的超球支持向量机(improved hyper-sphere support vector machine,IHS-SVM)文本分类算法和基于主成份分析和k最近邻(principal component analysis-k-nearest-neighbor,PCA-KNN)混合分类算法相比,EF-MNB类特定分类算法使用少量的时间就可获得更高分类准确率。 相似文献
34.
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度. 相似文献
35.
明文特征是基于应用层静态特征的一种识别方法,需要提取出应用层数据的特征信息;而朴素贝叶斯分类是基于大量统计信息的一种识别方法,主要用来识别加密的Peer-to-Peer(P2P)流量。着重介绍了采用明文特征和朴素贝叶斯分类相结合的方法,对加密的以及未加密的P2P流量进行识别。测试结果表明,这种方法可以较准确地识别出P2P流量。 相似文献
36.
Jií Andl 《Journal of forecasting》1996,15(7):549-552
The m-step least squares extrapolation is generally different from the m-step naive extrapolation in non-linear AR (1) models when m ≥ 2. We show that there exists a class of non-linear AR (1) models in which a difference between these two extrapolations is arbitrary large. 相似文献
37.
人名、机构名在基于概念的文本分类中的应用研究 总被引:1,自引:0,他引:1
基于概念的文本分类方法,能对同义词、多义词进行比较好的处理,是一种比较优秀的文本分类算法.但是此方法往往对人名、机构名等具有分类特征的词不能很好地处理,依然停留在关键词的层次.提出了一种将语义词典与一部人名、机构名构成的专有名词词典相结合的新的概念分类方法,并经过实验验证了其有效性. 相似文献
38.
基于时空特征提取的城市轨道交通乘客出行目的地预测 《山东科学》2021,34(4):104-113
为满足城市轨道交通运营组织进行客流管控和行车调度的实时需求,提出了基于乘客OD时空特征的出行目的地在线预测方法。通过分析定义乘客OD时空特征矩阵,以乘客个体的历史自动售检票系统(AFC)数据为训练样本,提出了基于行程密度聚类的乘客OD时空特征提取方法。分析制定乘客实时进站刷卡信息与其OD时空特征矩阵的匹配规则,基于3种匹配情况分别提出了相应的目的地实时预测方法。以南京市轨道交通AFC数据为实例进行验证,结果表明本文提出的预测方法在高峰时段预测准确率、全天预测稳定性等方面效果良好,可为地铁运营组织提供参考。 相似文献
39.
基于朴素贝叶斯分类的高速公路交通事件检测 总被引:1,自引:2,他引:1
提出一种基于朴素贝叶斯分类的高速公路非重现交通事件检测算法.将交通事件的检测看作是0-1分类问题,采用交通波动理论建立交通事件的特征属性概念模型,并利用分段离散化的方法将连续特征变量转换为离散特征变量,设计基于朴素贝叶斯算法的交通事件分类器.以典型高速公路的一条路段进行VISSIM仿真试验.结果表明:该算法的检测率高,且在高强度状况下,算法鲁棒性良好,适用于高速公路交通事件检测系统. 相似文献
40.
混合式朴素贝叶斯分类模型 总被引:3,自引:0,他引:3
为了降低朴素贝叶斯分类模型的独立性假设约束,提出一种混合式朴素贝叶斯分类模型(MBN:Mixed Naive Bayes)。通过分析贝叶斯定理,把条件属性集合划分成若干个独立的属性子集,用树增广朴素贝叶斯分类对属性子集分别进行分类学习,通过公式进行整合。将该模型算法与朴素贝叶斯及树增广朴素贝叶斯进行实验比较,实验结果表明MBN分类器在多数数据集上具有较高的分类正确率。 相似文献