首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
虽然最邻近决策规则能很好地解决数据集的非线性和非平衡性问题,但其没有学习过程.在此基础上,提出了一种利用聚类方法来浓缩训练样本,再根据最近邻准则进行决策的方法——核最近表面分类方法.通过实验将其与几种常用的统计分类方法进行对比,结果表明,核最近表面分类方法具有决策速度快、存储空间需求小等优点,同时也能够很好地处理非平衡...  相似文献   

2.
近年来,面向不平衡数据集的分类器学习与推广问题越来越受到人们的关注,在此以机器学习数据库、美国邮政编码、2维元音等国际上典型的分类问题为应用背景,重点研究如何用线性分类器解决样本数不平衡的问题;对Fisher、伪逆和单层感知器等3种典型的线性分类器做了深入的研究,并将这3种线性分类方法应用到不平衡数据集的分类中;通过实验及分析,这些新方法对平衡数据集的线性分类起到了良好的分类效果。  相似文献   

3.
在处理不平衡数据集时,为了降低类重叠对分类效果的影响,避免过采样造成的过拟合现象,以及欠采样造成的信息丢失问题,本文提出一种基于欠采样与属性选择的多决策树方法UAMDT(multi-decision tree based on under-sampling and attribute selection)。其首先利用Tomek link欠采样与集成欠采样两种技术相结合对数据进行处理,并获得多个平衡子集;然后在每个平衡子集上构建单决策树,采用结合信息增益和基尼指数的混合属性度量作为属性选择标准,选择最优属性作为每棵单决策树的根节点的分裂属性;最后将单决策树进行集成构建多决策树。通过对10个不平衡数据集的多个评估指标进行实验,验证了本文算法的有效性和可行性。  相似文献   

4.
5.
考虑的问题是线性约束下极小化二次目标函数的数学规划问题(QP)。在可行域是非空紧集假设下,利用KKT条件,将原问题等价转化为带线性互补约束、线性目标函数的问题(LPC),对(LPC)提出了一个全局优化算法。该方法的主要思想是生成一个点对序列,使它或在有限步迭代后终止于(LPC)的最优解或收敛于(LPC)的最优解。证明了算法的收敛性,并通过求解构造的实例说明了此方法的有效性。  相似文献   

6.
常压下,利用直流负电晕放电技术使CO2和水蒸汽合成燃料。结果表明:在反应温度105oC、气速0.05 L/min、放电频率10.245 k Hz、水的进料流速3.43 m L/min时,CO2的转化率为15.9%,乙醇和甲醇的产率分别为3.21%和2.23%。此外,探讨了磁场对反应的影响并对CO2和水蒸汽合成乙醇的反应机理进行了初步的研究。  相似文献   

7.
8.
针对传统的SMOTE方法在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比,实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。  相似文献   

9.
针对交互文本句子短、成分缺失、多领域下类分布不均衡导致的高维、特征值稀疏、正样本稀少的难点,提出面向目标数据集实例迁移的数据层面采样方法。该方法提出目标数据集和源数据集共性特征的Top-N信息增益和值占比函数,选择评价两个数据集实例相似度的特征;提出目标数据集和源数据集特征空间一致性处理方法,克服两者特征空间不一致的问题;提出分领域的实例选取与迁移方法,克服多领域下的类分布不均衡问题。实验结果表明:该方法有效缓解了交互文本的非平衡问题,使支持向量机、随机森林、朴素贝叶斯、随机委员会4个经典分类算法的加权平均的接收者运行特征曲线(receiver operating characteristic,ROC)指标提升了11.3%。  相似文献   

10.
欠抽样是一类常见的解决非平衡数据分类的技术。传统抽样方法(如Kennard-Stone抽样和密度保持抽样)只考虑保持数据分布。已有欠抽样方法侧重抽取分类边界附近的样本,这样抽取的样本可能改变数据的原始分布特征,从而影响分类效果。提出数据冗余度的概念,即如果一个多数类样本处于多数类的密集区且距离分类边界或少数类样本较远,则样本冗余度较高。去冗余抽样(Redundancy-removed Sampling,RRS)采用传统抽样规则去掉多数类中冗余度相对较高的样本。这样的样本子集尽量包含对分类最有帮助的样本和保持原始数据分布,且两类样本数量相对均衡。实验结果表明,经RRS抽样的分类结果的总体精度高于其他抽样方法,尤其在分类精度较低的数据集上。同时,少数类样本的判别精度也有所提高。  相似文献   

11.
通过构造二次函数的线性下界函数给出非凸二次约束二次规划问题(QP)的松弛线性规划,提出分支定界算法,数值计算表明算法是有效可行的.  相似文献   

12.
针对非凸二次约束二次规划(QCQP)问题,将问题中二次函数的凸函数部分保留,达到所得松弛规划的可行域更加紧致的目的,得到原问题更好的下界.利用正交变换的方法得到原问题的一个凸规划松弛模型,再利用分支定界算法求其全局最优解.根据问题的最优性和可行性原则,提出一种能整体删除或缩小算法迭代过程中产生的分割子区域的区域删减策略...  相似文献   

13.
针对传统的合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比。实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。  相似文献   

14.
本文提出一种常规型游梁式抽油机的平衡节能新方法“二次平衡法”,并进行了相应的理论分析与优化计算,还提出了一种“二次平衡”法的具体实施方案。试算表明,采用这种方法,节能效果在25%以上,比现有常规型游梁式抽油机改造为偏置相位抽油机其节能效果为13%有较大幅度提高。  相似文献   

15.
16.
生物医学复杂关系提取已经成为文本挖掘领域的焦点,而用于训练预测模型的注释语料库高度非平衡,且大多是针对单个注释语料库训练的监督模型,极大地限制了系统性能。因此,提出一种显著空间SVM自训练半监督学习方法,通过平衡初始模型诱导未标签训练数据,将领域知识纳入事件提取模型,识别多数类子集,构建预测模型。通过设计实验评估证明了训练语料库的有效性。  相似文献   

17.
本文给出了一类非光滑问题的逐次二次规划方法.问题的目标函数是凸函数和一个非光滑合成函数之和.方法利用二次规划的解作为搜索方向,新的迭代点由不精确线搜索得到.在较弱的条件下,证明了方法的全局收敛性.  相似文献   

18.
带有二次约束的一些非凸二次规划问题的全局最优性条件   总被引:3,自引:1,他引:3  
利用Z.Y.W u等人最近提出的一种新的研究全局优化问题的全局最优性条件的方法,研究了一些带有二次约束的非凸二次规划问题的全局最优性条件,得到了一些带有二次约束的非凸二次规划问题的全局最优性充分条件,同时也得到了一些无约束非凸二次规划问题的全局最优性充分条件,并证明了在一些特殊情况下,本文的一些结果与文献中的一些结论是一致的。在有些情况下,本文的有些结果还推广了现有文献中的一些结论。  相似文献   

19.
讨论了非方广义系统的奇异二次指标最优控制问题.在一些常规条件下,分别对有限及无限时间区间情形给出了问题的解,并把最优控制综合为最优状态的线性反馈,对系统闭环的特性做了探讨.  相似文献   

20.
终端受限的线性-非二次最优控制问题   总被引:3,自引:0,他引:3  
该文研究一类(输出)终端受限的线性—非二次最优控制问题,在系统输出能控、目标泛函(是依赖于控制函数与相应的输出函数的泛函且)在一定程度上可以不定等条件下用一列终端不受限(因而易于求解)的线性。非二次最优控制问题作为原终端受限问题的近似,建立起很强的收敛性结果——近似问题的最优控制(函数)列与最优值数列分别一致收敛与收敛到原问题的最优控制(函数)与最优值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号