首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
朴素贝叶斯分类是一种简单高效的方法.但是当属性独立性假设不成立时,有可能导致待测样本类别判断错误;且当待测样本到各类别的概率相同时,无法判断该样本类别,从而影响了它的分类准确率.本文提出基于属性值贡献率的朴素贝叶斯改进算法,利用待测样本的各个属性值在各类别的总贡献率判别该样本的类别.在蘑菇数据实验结果表明,该算法能有效提高分类的准确率.  相似文献   

2.
为了增强图像分割技术的准确性并优化图像分割技术的细节分割效果,提出了一种基于属性加权朴素贝叶斯算法的OTSU图像分割方法。将OTSU算法中依据图像灰度特征选取的图像中的前景和背景通过属性加权朴素贝叶斯算法进行分类处理,计算图像中前景和背景的概率,训练该模型以获得最佳阈值进行图像分割处理,优化图像分割的效果。利用无人机航拍采集的图像数据进行实验,结果显示基于属性加权朴素贝叶斯算法的OTSU图像分割方法优化了图像的分割效果,较完整地展示了分割后的图像细节,具有较好的应用价值。  相似文献   

3.
目前,分布式隐私保护朴素贝叶斯挖掘算法仅考虑分布式参与方的局部数据隐私而忽略全局的数据隐私,故难以有效抵抗合谋攻击.为此,基于差分隐私、秘密共享、安全多方计算等技术,提出一种分布式隐私保护朴素贝叶斯新算法.该算法采用安全求和协议构建保护隐私的朴素贝叶斯协议,对参与方的局部数据进行隐私保护.利用差分隐私保护机制对全局学习得到的朴素贝叶斯分类模型进行隐私保护.针对可能存在的合谋攻击,基于秘密共享设计了随机选择协议,将添加Laplace噪声的参与者随机化,有效防御安全多方计算中的相邻节点合谋及多数节点合谋攻击,并在此基础上优化保护隐私的朴素贝叶斯挖掘算法.实验表明,该隐私保护算法具有良好的分类性能和扩展性.  相似文献   

4.
为了改善传统脑电信号分类时间长、精度不够准确且分类难度较大的问题,利用脑电传感器(Mind Wave传感器)及Real Term软件从串口抓取数据获取脑电波TGAM数据包,并对采集的脑电信号数据进行分解计算处理,得到各个波段数据,使用基于负熵的独立分量分析的固定点算法(FastICA)提取脑电信号特征,并用深度学习分类算法对脑电信号进行分类。传统机器学习算法不能准确分类复杂的脑电信号,运用卷积神经网络(Convolutional Neural Network,CNN)提取数据进行训练,构建分类器,实现了对脑电信号更高效更准确的分类。实验结果表明,与Fisher线性判别、BP神经网络、朴素贝叶斯相比,此算法可以更准确地区分是否清醒的状态,对脑电信号分类的研究具有重大意义。  相似文献   

5.
为了增强图像分割技术的准确性并优化图像分割技术的细节分割效果,提出了一种基于属性加权朴素贝叶斯算法的OTSU图像分割方法.将OTSU算法中依据图像灰度特征选取的图像中的前景和背景通过属性加权朴素贝叶斯算法进行分类处理,计算图像中前景和背景的概率,训练该模型以获得最佳阈值进行图像分割处理,优化图像分割的效果.利用无人机航...  相似文献   

6.
集成学习是一种受到广泛认可和使用的机器学习算法.为此提出一种新的多类集成学习算法,即AdaBoost belief.此算法改进多类集成学习算法AdaBoost·SAMME,使每个基分类器对于每个类别都有权重信息.这种类别上的权重被称为类别信念,可通过计算每次迭代中各个类别的正确率得到.将所提出的算法与原有的AdaBoost·SAMME算法从预测准确率、泛化能力以及理论支持等方面进行比较发现:在高斯数据集、多种UCI数据集以及基于日志的多类别入侵检测应用中,该算法不但具有更高的预测准确率和泛化能力,而且当类别数目增加,即类别更难以预测时,其分类错误率较原有AdaBoost·SAMME算法上升得更缓慢.  相似文献   

7.
基于数据挖掘与机器学习的蛋白质疏水性分析的研究   总被引:1,自引:0,他引:1  
蛋白质的疏水性对蛋白质的稳定性、构象和蛋白质功能具有重要意义,通过数据挖掘中的机器学习算法实现了将一个数据集中已知疏水性的多个蛋白质样本数据,分配给具有特征值的各个目标类.将这些已知其特定类归属的数据作为KNN,LR,决策树,SVM四类分类器的训练集,利用这些已知数据训练后的分类器来处理未知疏水性的蛋白质数据,最终判断该数据的分类.该算法对蛋白质疏水性的预测,其准确率可达90%以上.  相似文献   

8.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法.  相似文献   

9.
模糊k-最近邻(fuzzy k-nearest neighbor,FkNN)及其改进的分类方法忽略了样本存在分布不均匀以及噪声样本的情况,不能充分体现每个类样本特征的差异性,影响了分类的准确率.为此,提出了一种基于紧密度的模糊加权kNN数据分类方法.首先基于样本间紧密度计算样本的隶属度;然后根据特征的模糊熵值分别计算每个类样本特征的权重,并使用加权欧氏距离确定近邻训练样本;最后根据待分类样本所属的每个类别的隶属度确定其类别.对UCI多个数据集的实验结果表明该方法是有效的.  相似文献   

10.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率.  相似文献   

11.
针对多视角条件下的图像目标分类问题,提出一种基于压缩感知特征的稀疏识别方法. 该方法以原始图像的感知数据为特征描述,将测试样本与训练样本集的压缩感知特征纳入稀疏识别的框架,并通过求解一个l1范数优化问题来获取分类结果. 实验表明,该方法不仅有效利用了压缩感知特征的信息冗余性来保证稀疏识别的性能,而且无需进行预处理就能较好地实现多视角图像的目标分类.  相似文献   

12.
传统的基于PCA-HOG特征的行人头部分类算法存在降维后的子空间鉴别性不足的问题.为此,提出一种基于分步降维HOG-LBP特征的行人头部分类算法.首先,利用样本类别标签构建2类样本的HOG特征集合,在这2类特征集合中分别执行PCA降维,然后将所得的特征与LBP纹理特征进行级联得到最终的头部描述算子,最后通过训练SVM分类器对实际样本集进行分类.实验结果表明,与传统PCA降维方法相比,该方法可有效提高行人头部的分类性能.  相似文献   

13.
针对多层网络链接预测中层间信息融合的问题,提出了一种利用朴素贝叶斯模型的链接预测方法。该方法结合目标层的邻域信息和辅助层相对于目标层的全局信息进行链接预测。在目标层中,根据节点对的邻域信息,利用朴素贝叶斯模型计算其连接概率;在辅助层中,计算节点对在该层有边或无边时在目标层存在链接的概率。在真实数据和合成数据上的实验结果表明:该算法在正相关和负相关的多层网络中都有很好的预测性能。  相似文献   

14.
张菡玫 《河南科技》2023,(24):31-35
【目的】在选取图像特征对图像进行分类时,选取的特征属性是否冗余会影响到图像分类的正确率。为提高分类的准确率,使用Relief-PGS优化算法对特征子集和支持向量机参数同步进行优化。【方法】首先使用Relief算法对特征数据集进行筛选,其次将筛选出的特征子集数目和支持向量机参数一起编码到粒子群-遗传算法中进行同步优化,最后对处理后的数据集进行分类,能有效提高分类的准确率。【结果】选取UCI数据库中的5种数据集进行分类,与传统的SVM算法、PGS算法和Relief-SVM算法相比,Relief-PGS优化算法对图像分类的准确率分别提高了22.53%、6.05%和11.16%。【结论】研究结果表明,Relief-PGS算法在去掉不重要特征的同时,对支持向量机参数进行优化,能有效提高分类的准确率。  相似文献   

15.
隐私保护、数据丢失、网络错误等原因导致网络中大量数据存在不确定性.数据流系统中数据连续不断到达系统,故不能一次性获得全部数据,此外数据的概念特征经常发生变化.针对这种情况,构建了一个增量式分类模型来处理数据具有不确定性的隐含概念漂移的数据流分类问题.该模型采用非常快速决策树算法,在学习阶段使用霍夫丁边界理论迅速构建能处理数据不确定性的决策树模型;在分类阶段将加权贝叶斯分类器应用于决策树的叶子节点,以提高不确定数据分类的准确率;采用滑动窗口技术和替换树来处理数据流中的概念漂移现象.实验表明,无论对人工数据还是实际数据,该算法均有较高的分类准确率和执行效率.  相似文献   

16.
针对FP-growth算法存在的不能进行增量更新,以及已有基于FP-growth的增量更新算法效率不高、不支持连续更新等问题,在FP-tree基础上,提出了增量更新改进算法FPIUA2,其适用于数据集连续增加的情形,适用于稀疏型数据集和稠密型数据集、支持连续执行.实验表明:该算法的效率远高于FPgrowth和已有的增量更新算法,其执行效率较FP-Growth、FPUA和FIUA2算法提高了1个数量级,并且具有很好的可扩展性.  相似文献   

17.
针对人体行为识别难于兼顾速度与精度的问题,提出了一种结合运动历史图像(MHI)与卷积神经网络的行为识别算法.该算法首先从原始视频序列中计算MHI,不仅减少了待处理的信息量,还提取了行为识别中的关键时空信息;接着以MHI作为输入,搭建了深度卷积神经网络,可以更好地表达时空信息;最后利用随机梯度下降法与dropout策略训练网络,实现行为类别分类.对比不同卷积神经网络训练与测试实验,该算法在Weizmann行为识别数据集上取得了95%的平均识别率,相较于未改进的网络结构提升了1.2%;对于持续时间为1.6s的行为动作,该算法的识别时间为1.56s.实验结果表明,所提算法在维持较高识别准确率的同时,实现了人体行为的在线实时识别与分类.  相似文献   

18.
针对传统FCM算法无法获得令人满意的聚类结果的问题,提出了基于样本与特征双加权的自适应FCM聚类算法。采用特征和样本双加权的策略,以特征权重信息熵作为代价函数,与样本权重、特征权重相融合,通过迭代优化的方法动态计算各属性特征对不同类别的权重系数、每个样本对聚类的重要性权重值,综合考虑各个样本的贡献度和各个特征的重要性,从而达到提高聚类结果质量的目的。使用5个来自UCI的标准机器学习数据集,对聚类算法的有效性进行验证。结果表明,对于具有不同样本贡献度和不同特征重要性的数据集,提出的算法具有较好的聚类效果。  相似文献   

19.
20.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号