首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
多阶段聚类—朴素贝叶斯的异常检测   总被引:1,自引:0,他引:1  
针对异常检测手段用来标定数据集中明显的不同于其他数据的对象,提出多阶段聚类旨在解决噪声数据的引入和缺失属性样本的处理,并改变传统的贝叶斯分类的被动学习为主动学习的方式来构造性能优越的分类器。在数据预处理阶段,利用密度聚类滤去噪声点,密度聚类的输出作为下一阶段的K-means聚类的输入,提高了K-means的分类准确率。K-means负责对缺失属性的样本进行处理。在分类阶段,利用adaboost学习算法优化朴素贝叶斯分类器,使其获得较好的分类效果。  相似文献   

2.
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。  相似文献   

3.
预测公交线路短时客流是实现公交动态调度的关键技术.文中通过分析客流特性,构建了基于K-means聚类算法的组合预测模型.首先利用K-means算法将短时客流数据按照时变特征的相似度划分为不同聚类,然后为每类客流数据分别建立最小二乘支持向量机、BP神经网络、自回归滑动平均模型,并考虑天气因素的影响,用遗传算法优化模型参数,对比预测结果,从中选择每个聚类的最佳预测模型构成组合模型.最后以长沙市104路公交客流数据作为实例进行预测分析,结果显示:客流数据时变特征对模型具有选择性,K-means聚类组合模型能够更好地根据不同时段客流数据的时变特征进行分类,因而有利于提高预测绩效;考虑了天气因素的K-means聚类组合模型能进一步提高公交线路的短时预测绩效.  相似文献   

4.
针对K-means聚类算法依赖初始点、聚类结果受初始点的选取影响较大的缺陷,给出了一种稳定的基于影响空间的初始点优化K-means聚类算法。该算法借助了影响空间数据结构和定义的加权距离吸引因子,将特殊中心点合并为K个微簇,并对微簇中的数据点加权平均得到K个初始中心点,然后执行K-means算法;最后,理论分析和实验结果表明,该初始点优化K-means聚类算法能够有效降低噪声数据对聚类结果的影响,在聚类结果、聚类过程效率方面有较大优势。  相似文献   

5.
为解决企业客户价值体现问题, 提出一种TFA客户细分改进模型, 以客户发展空间T、 购买频次F和平均购买额A为指标, 充分体现客户的价值和发展空间. 首先, 引入局部密度值ρ和信息熵H, 改进K-means聚类算法, 以优化传统K-means聚类方法初始聚类中心的选取问题;其次, 通过搭建机器学习框架, 对选取人工数据集及真实数据集进行聚类实验, 验证模型的有效性. 实验结果表明, 该模型能有效分类客户, 充分反映客户价值及其发展空间, 并通过改进聚类算法提升了算法效率.  相似文献   

6.
一种改进的K一均值聚类算法   总被引:2,自引:0,他引:2  
为了改进K-means聚类算法的不足,把混合粒子群优化算法引入到K-means聚类算法中,重新选取编码方式并构造适应度函数,在此基础上提出了一种改进的K-means聚类算法;通过两个经典数据集的测试,实验结果表明:改进的算法比K-means算法具有更好的全局寻优能力、更快的收敛速度,且其解的精度更高对初始聚类中心的敏感度降低.  相似文献   

7.
为精准有效地预测电商客户粘性,提升经济效果,研究数据挖掘技术在电商客户粘性预测中的应用。利用可变网格的K-means聚类算法,聚类获取电商客户粘性预测相关数据;通过有效性指标优化可变网格K-means聚类算法的聚类数,确定最佳聚类数,提升数据聚类效果;采用技术接受模型,依据聚类获取的数据,建立电商客户粘性预测指标体系;通过模糊层次分析法,结合指标体系,建立电商客户粘性预测模型,获取预测分值。实验结果表明,该模型可有效确定最优聚类数,精准聚类电商客户粘性预测相关数据;所建立的预测指标体系的指标相关性较低,结构较稀疏、较全面。总体说明,该模型可有效预测电商客户粘性。  相似文献   

8.
基于条件互信息下聚类的朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
 采用条件互信息来度量任意2个条件属性之间的关联程度,采用互信息度量各条件属性与类属性间的关联程度,以此作为将各条件属性进行聚类的准则,提出一种新的将条件属性进行聚类的分组技术.同时,结合朴素贝叶斯分类算法,构造了改进的朴素贝叶斯分类模型.通过仿真实验表明该文提出的算法具有较好的分类性能.  相似文献   

9.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法.采用K均值算法建立数据聚类模型.根据聚类类别数设定多个聚类中心坐标.设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别.根据参与聚类各节点和各自中心点的距离值建立适应度函数.引入菌群优化算法对K均值聚类过程进...  相似文献   

10.
为了提高智能推荐系统的性能,采用狼群优化的K-means聚类挖掘实现数据分类,通过协同过滤完成智能推荐。为了提高推荐效率,引入Spark平台多节点完成聚类和推荐。建立用户和资源的K-means聚类模型,采用狼群优化算法对初始类别中心点进行优化,以提高聚类准确度,根据用户和资源的类别属性获得用户-资源评分数据,最后建立协同过滤智能推荐模型。根据推荐效率要求,将推荐模型部署至Spark平台,实现聚类和智能推荐的分布式运算。实验证明,通过合理设置聚类中心点数目,结合Spark平台多节点运算,与常用推荐算法对比,所提算法可以获得更准确的推荐性能,在大规模数据的智能推荐系统中更能满足实时性要求,智能推荐效率高。  相似文献   

11.
基于机械比能理论的钻井效率随钻评价及优化新方法   总被引:1,自引:0,他引:1  
在原有破岩机械比能理论基础上,分析水力能量对破岩与井底净化起到的积极作用,建立水力参数条件下破岩比能模型,并完善相关理论。基于破岩比能模型与钻井参数和机械钻速的相互关系,通过分析钻进中井底工况,判断施加钻井参数的合理性,提出相应优化措施,并利用该模型预测机械钻速。结果表明:建立的破岩比能效率评价体系能够在钻前准确预测机械钻速、钻进中随钻诊断井底工况及优化参数、钻后优选钻头;该理论评价方法诊断准确率高、优化效果好且流程识别简单,具有良好的应用与推广价值。  相似文献   

12.
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。  相似文献   

13.
气体钻井地层出水定量准确预测是气体钻井可行性钻前论证的关键。目前,已有的出水量预测方法较少考虑气体钻井井底压差下地层渗流过程与地层应力变化的流固耦合作用对出水量的影响,在渗流力学和岩石力学的基础上,综合考虑地层渗流过程与岩石应力变化的流耦合作用对地层应力、孔隙度、渗透率以及孔隙压力的影响,建立气体钻井孔隙性地层和孔隙-裂缝性地层出水量预测动态流固耦合模型。结合工程实际,通过该模型计算得到气体钻井快速钻穿水层后出水量随时间的变化关系,计算结果与现场监测吻合。研究对于钻前准确预测出水量和筛选气体钻井层位具有重要意义。  相似文献   

14.
地层力学特性参数求解及其在苏里格地区的应用   总被引:3,自引:0,他引:3  
为了能充分利用测井等资料较精确地计算井壁受力状态和井壁坍塌压力,以帮助设计合理钻井液密度窗,保证钻井过程中井壁的稳定,通过对井壁失稳问题深入的研究,结合测井资料和目前常用的经验公式,分析并建立了一套快速计算地层三压力及地层相关力学特征参数的方法和模型.对长庆油田苏里格苏4、苏6井测井资料的分析计算结果表明,地层三压力和地层力学特性参数的计算结果以及其可行的安全密度窗与现场实际情况吻合.所提出的方法和计算结果,将为苏里格气田开发过程中的安全快速钻井技术提供可靠的技术基础.  相似文献   

15.
井底待破碎岩石所处的应力状态作为影响其破碎的关键因素而直接影响着钻井效率,建立综合考虑上覆岩层压力、水平地应力、液柱压力以及孔隙压力和地层温差完全耦合作用下井底岩石的三维物理模型,借助有限元软件进行求解,研究在不同液柱压力、不同井深、不同温差以及不同渗透系数作用下井底岩石应力分布的数值解。结果表明:液柱压力、井深以及温差越大,井底表面岩石最大主应力越大;渗透系数减小,井底表面最大主应力先增大后减小;在井眼轴向方向,在距离井底表面以下一定距离之后,液柱压力和井深越大,岩石最大主应力越小;温差对岩石最大主应力没有影响。  相似文献   

16.
综合地层应力、井底压力、孔隙压力以及牙齿吃入地层引起的应力,建立牙齿吃入深度的表达式,依据摩尔-库伦准则建立钻头牙齿吃入地层的岩石破碎模型。将综合地层和钻井参数因素的误差函数β与深度x的比值作为欠平衡钻井的应用参考参数,计算各种压差和β/x条件下的吃入深度,并分析其变化规律。结果表明:在压差的作用下,具有渗透率和孔隙度的待破碎薄地层内的孔隙压力并非原始地层孔隙压力,而是随时间和位置的变化而变化,其分布规律可以用一维不稳定渗流来表示和计算;牙齿吃入深度的表达式可以将压力、流体等因素对岩石破碎的作用清楚地表达出来;所建模型可以解释欠平衡钻井提高钻速的力学机制,以及定量描述随钻地层压力监测dc指数法的适用范围。  相似文献   

17.
钻井液流变性的准确分析与流变参数的准确计算一直是钻井水力分析与计算的基础,是提高井底压力计算精度的重要研究内容。基于高温高压流变实验数据,分析了旋转黏度计300 r/min和600 r/min下测量剪切应力随温度、压力的变化规律;进而建立了适用于各转速下高温高压(HTHP)剪切应力的通用预测模型,并给出了HTHP剪切速率预测模型系数的通用求解步骤。最后采用HTHP剪切应力预测模型对墨西哥湾一口实验井的合成基钻井液(屈服假塑性钻井液)进行了分析,同样具有很好的预测效果,表明该模型具有较广泛的适用性,可为高温高压井井底压力计算提供较为准确的HTHP流变参数。  相似文献   

18.
围压条件下井底环空循环吸入式粒子射流破岩试验   总被引:3,自引:2,他引:1  
井底环空循环吸入式粒子射流钻井是解决硬地层破岩钻井效率低下的有效途径。采用所研制的井底围压试验装置,试验探索井底环空循环吸入式粒子射流破岩的规律。结果表明:随着围压的增大,粒子射流破岩效率逐渐减小;随着射流压力、粒子直径和硬度的增大,粒子射流破岩效率逐渐增大;随着喷距和粒子质量分数的增大,射流破岩效率呈现先增大后减小的趋势;井底环空循环吸入式粒子射流高效破岩钻井方法确实可行。  相似文献   

19.
温度和压力对深水钻井油基钻井液液柱压力的影响   总被引:2,自引:0,他引:2  
根据不同温度和压力下油基钻井液密度的测量结果 ,建立了温度、压力影响下的油基钻井液密度计算模型。在模型中引入了热膨胀系数和弹性压缩系数 ,利用该模型计算了不同温度和压力下的钻井液密度值。模型计算的密度与实测值之间的最大相对误差小于 0 .3% ,平均相对误差为 0 .11%。利用该模型对深水钻井时不同条件下井眼内钻井液密度和液柱压力变化进行了计算和分析。结果表明 ,在深水钻井中 ,井眼内的钻井液密度通常大于井口钻井液密度 ;最大钻井液密度出现在海底泥线处 ;井眼内钻井液液柱压力的当量密度大于井口的钻井液密度。采用无隔水管钻井时的环空钻井液密度小于隔水管钻井时的钻井液密度。  相似文献   

20.
基于孔隙水压力梯度对孔壁及裂缝尖端应力作用,提出了煤层导向压裂扩展方法.通过研究有效应力变化,建立了导向压裂起裂压力及裂缝扩展压力计算模型.采用RFPA~(3D)-Flow流固耦合软件建立了孔隙压力梯度场下的导向压裂数值模型.对7组不同数值模型计算分析,研究了导向孔的布置方式、距离、控制水压三个主要因素对导向压裂作用效果.研究结果表明:孔隙压力梯度能有效降低压裂孔起裂压力及裂缝扩展压力.起裂压力及裂缝扩展压力降低幅度与导向孔控制水压呈正相关关系,与导向孔距离呈负相关关系.数值计算得到的起裂压力变化规律与理论计算预测相符合,论证了导向压裂起裂压力计算模型的正确性以及导向压裂裂缝控制方法的可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号