首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 143 毫秒
1.
针对现有非平衡数据处理方法存在的局限性,提出一种考虑边界4稀疏样本的混合采样方法(considering boundary sparse samples-hybrid sampling,CBSS-HS)。通过计算每个样本的边界因子识别边界点,将样本空间划分为边界域和非边界域,对非边界域内的负类样本进行欠采样,而由于边界域上样本的稀疏性,对其上正类样本使用基于最大距离的合成少数类过采样技术(max distance-synthetic minority oversampling technique,MD-SMOTE)进行过采样,最大限度地保留正类样本的信息,最终达到2类样本基本平衡。将Recall,F1-value,G-mean和AUC(area under the curve)值作为评价指标,使用CBSS-HS+支持向量机(support vector machines,SVM)算法在5个不同平衡度的数据集上验证其有效性,并与其他4种组合模型的分类效果做对比。结果表明,提出的CBSS-HS算法在不同数据集上各个评价指标都有良好的表现,平均提高了4.6%。因此,该方法可以作为处理非平衡数据的一种有效手段。  相似文献   

2.
针对非平衡数据集分类中"少数类样本精度难以提高"这一瓶颈问题,提出了一种基于协同进化机制的欠采样方法.此方法将少数类样本与多数类样本划分为两类种群,采用种群协同进化原理,利用提出的动态交叉变异算子自适应协同进化过程,实现种群间自动调节和自动适应.仿真试验结果表明,此采样方法增强了局部随机搜索能力,改善了种群的分布特性,加强了算法的全局收敛能力,在不降低多数类样本分类性能的基础上有效提高了少数类样本的精度.与其他经典重采样方法相比,本文办法抗噪能力好,具有更强的鲁棒性.  相似文献   

3.
针对管道运行状态数据的非平衡性会造成管道泄漏诊断准确率下降的问题,提出了一种基于非平衡数据的管道泄漏检测与定位方法.首先,将管道各工况非平衡数据采用基于K均值聚类的欠采样方法处理,使其达到数据平衡.然后,将Fischer-Burmeister函数引入到双支持向量机学习过程中,以避免目标函数求解时矩阵的求逆计算,并将平衡数据作为改进双支持向量机算法的输入,识别管道泄漏.采用相关分析法实现泄漏点定位.根据Flowmaster搭建的管道模型,运用该方法识别管道泄漏.仿真实验表明,与经典双支持向量机和拉格朗日双支持向量机相比,该方法能更快速识别管道泄漏孔径及定位.  相似文献   

4.
针对kNN分类算法对不平衡数据进行分类可能偏向多数类的问题,提出了象限壳近邻分类算法。该算法仅选择测试样本象限方向上的最近邻的训练样本来判断其所属类别,从而有效地避免了kNN算法对选取k个最近邻训练样本时可能产生偏向多数类的问题。通过在UCI真实不平衡数据集上的实验,该文提出的分类算法在Recall、F-value和G-mean等评价标准明显优于传统的kNN分类算法。  相似文献   

5.
设计并实现了采用非监督特征学习方法对模拟阅读事件相关电位实验中多名受试者脑电信号的特征提取,并对提取的特征向量进行了模式分类.实验中共采集5名受试者脑电信号,每名受试者的特征样本集由其接受模拟阅读靶视觉刺激后100400ms在通道PO3、O1、Oz、O2、PO4、P4、P8、CP6的脑电信号样本组成,各受试者样本集均含400个试次样本.非监督特征学习过程由含6个神经节的BP神经网络完成,后选用支持向量机作为分类器.对比了1试次,2试次、5试次、10试次样本叠加等几种不同情况下采用非监督特征学习方法提取特征的分类正确率.实验结果表明:采用多神经节人工神经网络对5名使用者5试次叠加信号样本提取的特征向量的分类正确率高于90%,显著优于对各单通道时域特征向量的分类正确率,该方法可为以脑电信号为特征的身份识别系统提供一种可行的特征提取方式.  相似文献   

6.
为提高互联网入侵检测方法的准确率,提出一种卷积神经网络与注意力机制结合的入侵检测方法。利用Borderline-SMOTE过采样算法和Min Max归一化对数据进行预处理,有效缓解入侵数据量差异较大问题,提升非平衡数据检测性能;使用卷积神经网络Inception结构多尺度对数据进行特征提取,并配合注意力机制进行维度更新,提高模型处理海量数据时特征表达的准确性。研究结果表明:入侵检测方法的平均准确率为99.57%;相较于SVM方法、CNN方法、RNN方法、BLS-GMM方法,准确率分别提升了4.48%、1.35%、1.62%和0.04%,召回率分别提高了4.48%、1.36%、1.62%和0.14%。  相似文献   

7.
非平衡数据集Fisher线性判别模型   总被引:4,自引:0,他引:4  
非平衡数据是指两类问题中正类样本与负类样本个数不相等,甚至相比悬殊.非平衡数据集会导致许多分类器的性能下降,这与分类器的构造原理有关.本文首先阐述了Fisher线性判别的分类机制,指出当两类样本的协方差矩阵不同时,样本不平衡会导致Fisher线性判别的性能下降.在此基础上,提出了一种加权Fisher线性判别(WFELD),以减小样本不平衡的影响.然后,从UCI中选择了8个非平衡数据集,并采用ROC曲线下面积作为评估指标进行比较,实验结果证明了WFLD模型的有效性.  相似文献   

8.
分析了影响大学生创业的各种因素,并依据非平衡统计物理理论进行调查,确定出影响大学生创业的主要因素,研究结果对提高大学生创业素质和创业能力,促进大学生创业工作能起到积极的作用.  相似文献   

9.
刘志勇  刘燕勇  董彬 《江西科学》2007,25(6):730-732
简单讨论了非平衡格林函数理论,并利用非平衡格林函数理论推导了电子相互作用体系的电流公式,获得了一些一般性的结果。  相似文献   

10.
物质平衡方法在气藏开发中占有重要位置。对于水驱气藏来说,水侵主要维持地层压力,直到水突破之后,将会直接影响到气藏的采收率。因此如何在早期识别气藏的类型,从而进行开发的部署显得相当重要;另外气藏地质储量、采收率的确定已经动态指标的预测也贯穿了整个开发历程。目前不少学者对于气藏物质平衡进行了大量的基础性研究工作,为了更深入的了解物质平衡方法在实际气藏开发中有哪些应用,从水驱气藏的早期识别、水驱气藏水侵量的计算、地质储量的确定、采收率的确定、动态指标的预测等五个方面进行详细综述。针对水侵气藏早期识别时,综合对比了视地层压力法、采出程度法和视地质储量法,并给出不同方法的优缺点和使用范围。对于地质储量的确定,以异常压力气藏为例,说明了单单利用p/Z-Gp外推法得到的储量是不准确的,从物质平衡角度出发,给出了新的计算异常压力气藏地质储量的方法,并用实例进行了验证。  相似文献   

11.
癫痫是最常见的神经系统疾病之一。脑电图是大脑电活动的记录,已成为检测癫痫发作的一种有效工具。如何通过数据分析以挖掘癫痫脑电的本质特征,是实现癫痫性发作自动检测的关键。提出了一种新的脑电信号相似性的分析方法,进而在这一方法的基础上定义了待测脑电与模版脑电之间的最大余弦相似度为癫痫脑电特征,并将其应用于癫痫性发作的自动检测。采用BONN和CHB-MIT两个公开数据库来验证该文所提方法的性能。和已有方法相比,该文所提自动检测方法将检测准确率从97. 53%提高至99. 85%。该文所提出的脑电信号相似性分析方法可以成功应用于癫痫性发作的自动检测。  相似文献   

12.
一种新型的Web管理信息系统设计与应用   总被引:1,自引:0,他引:1  
针对Web-MIS系统的特点,分析了当前流行的Web-MIS系统在开发方法上存在的不足,阐述了MVC模式的设计理论,提出了一种新型的基于MVC模式的Web-MIS系统设计方法,将表现与逻辑分离,以Xml xslt方式解决导出数据的友好性和与客户端的兼容性,并采用标签库方式开发足够复杂的表现样式界面.  相似文献   

13.
一种流动单元自动分层新方法及其应用   总被引:1,自引:0,他引:1  
探讨了利用测井等定量资料进行流动单元自动分层的方法。根据岩心分析和测井资料,基于流动单元内部均质的思想,利用流动带指数、储层品质因子等参数,提出了一种新的对储层自动细分的切片合并法,并分析了该方法的合理性和石油地质意义?利用该方法叮同时得到流动单元划分和识别结果,在大庆油田的应用结果证明了该方法是有效的。  相似文献   

14.
探讨了利用测井等定量资料进行流动单元自动分层的方法.根据岩心分析和测井资料,基于流动单元内部均质的思想,利用流动带指数、储层品质因子等参数,提出了一种新的对储层自动细分的切片合并法,并分析了该方法的合理性和石油地质意义.利用该方法可同时得到流动单元划分和识别结果,在大庆油田的应用结果证明了该方法是有效的.  相似文献   

15.
采集的野外地震数据伴随有随机噪声干扰,需要将其消除。软硬阈值法能够压制地震数据的噪声信号,但是降噪效果并不理想。因此,提出了一种改进的软硬阈值算法用于地震数据降噪。首先利用软硬阈值法原理构建了一种新的阈值降噪法,并对新算法相关特性进行了研究,通过仿真实验确定了新阈值算法的小波基为sym 3,利用均方差和信噪比对新阈值降噪法的降噪效果进行了评价。最后,将新阈值降噪法用于实际地震数据降噪,结果发现新阈值降噪法能够去除地震数据中的随机噪声,降噪效果较软硬阈值法更理想。  相似文献   

16.
针对应用于密立根实验数据处理中的“倒过来验证法”的缺点,文章提出了一种新的数据处理方法,使数据处理结果能够直接、真正地反映实验目的。  相似文献   

17.
李姗  叶国菊  刘尉  赵大方 《科学技术与工程》2021,21(26):11034-11039
由于客观事物具有的复杂性和不确定性,决策问题往往不能获得确切的权重信息,只能得到模糊语言形式的权重。为研究模糊语言形式的权重,首先定义了一种更广泛的四段折线型模糊语义量化函数,并给出了该函数的诸多基本性质,如单调性、非负有界性和归一性等,同时证明该函数在特殊情况下可退化为传统的三折线模糊语义量化函数。接着,根据定义的四段折线型模糊语义量化函数建立了一种新的权重确定方法。利用此方法确定的权重,便于计算其orness值,该值可用于度量决策者的乐观程度。最后,利用该赋权方法,对有序加权平均(OWA)算子中的权重进行赋值,并将其应用到一类权重为模糊语言形式的多属性决策问题中。所得结果表明了此方法的有效性与直观性。  相似文献   

18.
针对Web-MIS系统的特点,分析了当前流行的Web-MIS系统在开发方法上存在的不足,阐述了MVC模式的设计理论,提出了一种新型的基于MVC模式的Web-MIS系统设计方法,将表现与逻辑分离,以xml+xsh方式解决导出数据的友好性和与客户端的兼容性,并采用标签库方式开发足够复杂的表现样式界面。  相似文献   

19.
半参数回归分析及其在测绘数据处理中的应用   总被引:3,自引:1,他引:3  
在测量实践和科学研究中,随机因素和确定因素往往是共同存在的,经典测量平差是建立在随机模型基础上的,即认为观测值中仅含有偶然误差,不存在具有确定性的系统误差,而实际上,系统误差的存在是客观的,如果忽略这一点,平差结果将是有偏的。为此,我们希望能在平差模型和平差过程中,对上述两种误差加以区分,以获得最优无偏估计,基于上述目的,本文从最小二乘配置的理论和模型出发,在分析、研究近年来关于统计分析和测量数据处理有关文献的基础上,引入半参数回归分析的概念。并讨论了正则化参数α对解的影响,通过模拟计算得出结论:只要正则化参数取值合适,就能得到令人满意的结果。  相似文献   

20.
基于XML与Java凭借跨平台的优势及其互补性的特点,为下一代Web应用开发的基础数据描述格式与主要开发环境,针对Java处理XML数据的几种接口的缺陷,研究了通过XMLSchema到Java类的映射,实现基于数据绑定的Java应用对XML数据的操作,并用典型实例给予验证.该方法较SAX及DOM具有能够双向数据操作,对系统资源要求低的特点,特别适合XML文档表示配置信息的情况.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号