共查询到20条相似文献,搜索用时 31 毫秒
1.
基于广义朴素贝叶斯分类器的空值处理方法 总被引:1,自引:1,他引:0
给出了基于广义朴素贝叶斯分类器的空值处理方法,该方法利用广义朴素贝叶斯分类器的较强预测能力及灵活的效率选择方式,有效地解决了数据中的空值处理问题.利用模拟数据进行了对比实验,结果显示,其预测准确性明显提高. 相似文献
2.
确定出行目的是探究出行规律的重要环节,而公交智能卡数据中恰恰缺少此部分属性。将出行调查数据与智能卡数据融合,对调查数据中的上、下车时间、出行目的进行提取,基于贝叶斯概率模型对其进行分析;对应智能卡数据集,借助朴素贝叶斯分类器对缺少的出行目的属性加以补充。以石家庄市北国商城公交站为例进行实证分析,并基于不同出行目的,对乘客的日出行次数及每名乘客的出行周变规律进行分析。结果表明,该方法对出行目的估计准确率为85.6%,乘客通勤出行平均每周4.7次,因私出行每周2.9次,归家出行每周3.4次,并给出了相关统计结果。 相似文献
3.
模式分类旨在依据识别对象特征的观察值将其归并至某个类别,贝叶斯分类决策可实现模式分类.给出一类遵从特征观察量独立性假设的贝叶斯分类器即朴素贝叶斯分类器设计.并给出朴素贝叶斯分类器的分类误差估计方法.理论分析与实验结果表明,朴素贝叶斯分类器设计方案可行,且其分类误差估计方法有效,可用于模式分类事务处理. 相似文献
4.
基于贝叶斯网络的分类器研究 总被引:28,自引:2,他引:28
研究了贝叶斯分类器家族中具有代表性的分类器,即朴素(naIve)贝叶斯分类器、贝叶斯网络分类器和TAN(tree augmented Bayesian)分类器;发现属性变量之间的依赖相对于属性变量与类变量之间的依赖是可以忽略的,因此在所有树形分类器中TAN分类器是最优的. 相似文献
5.
朴素贝叶斯分类方法是一种广泛使用的分类算法,在独立性假设不完全满足的情况下计算效率和分类效果均较为理想.通过分析全局特征向量中各特征与类别属性之间的联系,提出将组合特征置换多源特征,用组合特征的共现率对多源特征进行概率调整的新方法,在不同数据集的实验中,调整后的朴素贝叶斯分类器(FRNB)的分类精度均好于传统朴素贝叶斯分类器.测试结果表明,改进后的算法是有效可行的. 相似文献
6.
朴素贝叶斯分类器具有高效率和可扩展性好等优点,它已经被广泛应用于文本分类、个人信用评估等数据挖掘任务中。但是其简单的结构和不合理的基本假设限制了该模型的分类精度和表述能力。应用集成学习算法和概率估计式对朴素更叶斯分类器作了两点改进,使得该模型的分类精度和表达能力都获得了一定提高。之后,将其用于一个典型的分类问题:根据患者的表面症状初步诊断病因,确定发病的人体生理系统,此模型在该问题上获得了较好的结果。 相似文献
7.
一种改进的朴素贝叶斯分类器在文本分类中的应用研究 总被引:1,自引:0,他引:1
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度. 相似文献
8.
通过对朴素贝叶斯分类器的讨论, 提出将贝叶斯方法应用于医学图像分割后的图像分类思想. 给出一种基于朴素贝叶斯分类器的图像分类方法, 对从尿沉渣图像中识别出的微粒进行正确分割及特征提取与选择, 并利用朴素贝叶斯分类器进行分类. 实验结果表明, 所提出的方法用于解决图像分类有效. 相似文献
9.
基于互信息的多关系朴素贝叶斯分类器 总被引:1,自引:0,他引:1
为进一步提高多关系朴素贝叶斯方法的分类准确率,分析了已有的剪枝方法,并扩展互信息标准到多关系情况下.基于元组号传播方法和面向元组的统计计数方法,给出了基于扩展互信息标准进行属性选择的方法和步骤,并建立了一种基于扩展互信息的多关系朴素贝叶斯分类器.标准数据集上的实验显示,基于扩展互信息标准进行属性选择,可以在不增加算法时间复杂度的前提下,找到与分类属性最相关的属性,并在仅有极少属性参与分类时,得到较高的分类准确率.Mutagenesis数据集上的实验则显示,这种属性选择可以使多关系问题退化为单关系问题,大大降低了分类代价. 相似文献
10.
陈弋兰 《安庆师范学院学报(自然科学版)》2008,14(3)
图像消噪是图像分割和识别的必要预处理。根据噪声的统计特征和频谱分布规律以及图像特点,人们提出并发展了多种不同的图像消噪方法。基于朴素贝叶斯分类决策的图像消噪效果良好,在图像消噪和细节保留上取得了合理的平衡。 相似文献
11.
12.
利用加权核Fisher准则,给出一种朴素贝叶斯分类器的改进算法。该算法通过寻找使类与类最大分离的最优投影矩阵,将样本数据进行投影变换,再利用朴素贝叶斯分类器对新样本进行分类。将该方法应用于双酚A生产过程在线监测数据集的分类中,仿真结果表明,相比于单纯朴素贝叶斯分类器,该分类算法具有更好的分类性能。 相似文献
13.
基于Matlab的贝叶斯分类器实验平台MBNC 总被引:22,自引:0,他引:22
为了测试评估贝叶斯分类器的性能,用不同数据集进行对比实验是必不可少的.现有的贝叶斯网络实验软件包都是针对特定目的设计的,不能满足不同研究的需要.介绍了用Matlab在BNT软件包基础上建构的贝叶斯分类器实验平台MBNC,阐述了MBNC的系统结构和主要功能,以及在MBNC上建立的朴素贝叶斯分类器NBC,基于互信息和条件互信息测度的树扩展的贝叶斯分类器TANC,基于K2算法和GS算法的贝叶斯网络分类器BNC.用来自UCI的标准数据集对MBNC进行测试,实验结果表明基于MBNC所建构的贝叶斯分类器的性能优于国外同类工作的结果,编程量大大小于使用同类的实验软件包,所建立的MBNC实验平台工作正确、有效、稳定.在MBNC上已经进行贝叶斯分类器的优化和改进实验,以及处理缺失数据等研究工作. 相似文献
14.
大数据时代要求数据在云端进行存储和计算,这导致敏感数据隐私泄露的问题。该文提出了一种在同态加密数据集上应用机器学习分类算法的方案:首先对明文进行预处理,保证其满足对数据进行同态加密的要求;然后在加密数据集上通过协议实现比较、排序等操作;最后获取分类结果。客户端将加密数据上传,可以保证服务器端不会获取任何敏感信息;选取同态加密算法,能够保证服务器端仍可对密文执行相关操作。实验结果表明:该方案适用于Bayes、超平面和决策树分类器,其经过修正具有良好的适用性能,准确率高。 相似文献
15.
在云计算环境下,数据挖掘应用中的数据共享和服务外包在产生巨大财富的同时,也带来了隐私泄漏的风险,其信息安全问题亟待解决。对云计算环境下神经网络预测分类服务外包中存在的风险以及全同态加密算法的应用进行了分析,使用平方函数作为神经网络中的非线性激活函数,设计并实现了一种密文域的数据分类预测方案,并对该方案运行过程中的5个主要步骤:模型训练、模型加密、数据加密、密文计算和解密结果进行详细描述。设计的测试实验结果验证了该方案的可行性,保证了模型和数据在整个神经网络处理过程中不被泄漏,可有效保障数据和模型的安全与隐私。 相似文献
16.
基于同态加密算法提出了一种保护边权值信息隐私安全的节点间最短距离计算方法.该方法对边的权值信息进行加密,然后将加密后的数据外包到云平台中.利用广度优先原理,云服务器能够直接针对加密的图状数据从初始节点向外扩展,迭代地计算初始节点到其他节点的最短距离,从而计算出任意两节点之间的最短距离.最短距离计算由客户端和云服务器端交互合作完成,主要的计算由服务器端完成,客户端只进行简单的解密和判断操作.本方法能够使得低计算能力客户端也可以使用云计算执行计算密集型的最短距离计算任务,并保证边权值、计算的中间结果以及最终结果等隐私信息不会被泄露.理论分析和模拟实验证明了本方法的安全性和正确性. 相似文献
17.
针对基于决策树和神经网络的增量学习算法的过量匹配和分类精度有限的缺点,提出了一种基于贝叶斯分类器集成的增量学习方法.综合朴素贝叶斯的增量分类和集成的增量学习方法,采用随机属性选择训练初始SBC(simple Bayesian classifiers),通过判断是否带有类别标签,将增量样本自动分组,并利用遗传算法对结果进行优化.实验结果表明,贝叶斯分类器集成的增量学习方法有效. 相似文献
18.
为了解决云存储用户数据完整性验证问题,在分析现有远程数据完整性校验方法的基础上,在标签生成的过程中加入同态哈希与伪随机数,提出一种支持动态数据与无限次挑战的同态哈希的数据完整性验证方案。通过安全性与性能的分析证明该方案的有效性,在保证远程数据完整性的同时,减少了存储空间的冗余和带宽消耗。 相似文献
19.
基于基因表达谱的肿瘤诊断方法有望成为临床医学上一种快速而有效的诊断方法,但由于基因表达谱数据存在高维数、小样本以及噪音大等特点,使得对其分类存在很大困难,所以很有必要寻找更为可行有效的分类方法.用贝叶斯分类器建立预测分类模型作为基因表达谱数据分类的一种新思路,以结肠癌的基因表达谱作为实验数据,利用MATLAB的贝叶斯网... 相似文献
20.
针对云环境下用户隐私数据的安全性和数据应用操作效率要求相矛盾的问题,提出了一种基于同态加密和基于属于加密的混合方案,实现对云用户隐私信息进行分类加密保护.方案中将用户数据分为绝对保密的数据和可信用户合理访问的数据2类,其中对绝对保密的数据采用同态加密算法;对可被部分授权用户访问的数据制定相应的访问控制树,并采用基于属于的加密算法.设计了云环境下混合加密方案,分为客户端和服务端,并将混合加密方案与基于属性的加密方法从加解密时间和存储开销进行了比较,可以看出混合加密方案具有很好的应用前景. 相似文献