首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 112 毫秒
1.
针对传统决策树分类算法在多数据流分类的正确率和处理速度存在的不足,提出了一种基于基因表达式编程(GEP)的多数据流分类并行算法,以提高多数据流分类的正确率和处理速度.根据GEP在数据分类上的优势,运用GEP原理和数据流段中分类目标相似属性合并构造多数据流分类算法,并对多数据流分类算法进行并行设计与分析,在多核PC上进行对比实验.实验结果表明:该串行与并行分类算法均优于传统算法,且在多样本上具有较好的加速比.  相似文献   

2.
针对代价敏感学习问题,研究boosting算法的代价敏感扩展。提出一种基于代价敏感采样的代价敏感boosting学习方法,通过在原始boosting每轮迭代中引入代价敏感采样,最小化代价敏感损失期望。基于上述学习框架,推导出两种代价敏感boosting算法,同时,揭示并解释已有算法的不稳定本质。在加州大学欧文分校(University of California,Irvine,UCI)数据集和麻省理工学院生物和计算学习中心(Center for Biological&Computational Learning,CBCL)人脸数据集上的实验结果表明,对于代价敏感分类问题,代价敏感采样boosting算法优于原始boosting和已有代价敏感boosting算法。  相似文献   

3.
为了提高代价敏感分类算法MetaCost的准确率,降低错分代价,提出了多类别问题下的一种代价敏感分类算法(简称D-MetaCost算法).该算法利用MetaCost算法,通过多次取样生成多个模型,依据它们的分类准确率,选择其中准确率较高的前几个基分类器,将它们与最后阶段新生成的分类器聚集在一起得到最终分类模型.实验表明,D-MetaCost算法在准确率和代价方面比经典的MetaCost算法有明显的改进和提高.  相似文献   

4.
为了得到一个低误分类代价的特征子集,本文通过定义样本间的代价距离并将代价距离引入了现有的特征选择架构,把流形学习和代价敏感特征选择问题相结合得到了一个新的代价敏感特征选择方法,称之为基于流形学习的代价敏感特征选择算法。以前提出的代价敏感特征选择算法在选择特征的过程中只考虑到了特征与误分类代价的关系,并对特征一个一个的进行选择,而本文所提出的代价敏感特征选择算法同时考虑了特征与误分类代价的关系和特征之间内在的判别信息,从而提高了代价敏感特征选择效果。在六个现实世界数据集上的实验证明了本文所提出的算法效果优于现有的相关算法。  相似文献   

5.
三支决策是近年来提出的一种新的决策理论模型,为了将该模型应用于数据的分类中,提出一种基于三支决策的代价敏感数据分类方法。首先根据三支决策模型,定义一种新形式的误分类代价,并提出相应的最小化误分类代价特征选择算法,然后在该特征选择算法的基础上,提出三支决策模型的代价敏感数据分类算法,该算法将数据分类结果分成三种情形,分别为标记特定类别、不标记特定类别和暂不标记。最后通过仿真实验证明了文中所提出的算法具有更好的代价敏感分类效果。  相似文献   

6.
针对入侵检测的代价敏感主动学习算法   总被引:3,自引:2,他引:1  
入侵检测系统通过提供可能由恶意攻击导致的告警信息来保护计算机系统.为了能够利用历史数据自动提升入侵检测的性能,机器学习方法被引入入侵检测.但是,高质量训练数据的获取往往需要繁重的劳动或代价昂贵的监控过程.同时,不同类型的误分类导致的代价也是不一样的,入侵检测需要使误分类代价最小.针对这两种需要综合考虑的问题,提出一种基于代价敏感主动学习的入侵检测分类器构造方法ACS.该方法结合代价敏感学习和主动学习方法,其目标为减少学习代价敏感分类器的标注次数,使代价敏感分类器的误分类代价最小.该方法在主动学习的学习引擎中使用代价敏感学习算法替代传统的错误最小学习算法,同时在采样引擎中使用最大误分类代价的采样标准.ACS方法在主动学习中版本空间的构造、更新过程都针对代价敏感环境作了对应的改进,使该算法能够以较高的收敛速度收敛到误分类代价最小的目标函数.在入侵检测数据集KDDCUP99上的的实验表明,ACS方法能够有效地减少学习代价敏感分类器的标注次数.  相似文献   

7.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类。可以将代价敏感用于分类器的训练;但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数;并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好地处理不平衡数据。  相似文献   

8.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

9.
针对传统邮件分类模型中较少对邮件主题进行描述和分析的问题,提出一种代价敏感多主题学习的邮件分类算法,用以实现垃圾邮件过滤.首先,基于LDA(潜在狄利克雷分布)对邮件的多个主题进行提取,对邮件语义进行描述;其次,利用CS-SVM(代价敏感支持向量机)对邮件进行代价敏感学习,实现对不同类别邮件的惩罚;最后,结合MI-SVM(多示例支持向量机)进行代价敏感的多主题学习,实现邮件分类.实验采用四组ling-spam处理数据集.实验结果证明:该分类算法较比传统邮件分类算法,可以取得更高的准确性、特异性与敏感性.  相似文献   

10.
基于模拟退火的基因改进型GEP算法   总被引:3,自引:1,他引:2  
基因表达式编程具有强大的函数挖掘能力,有助于在实验数据上提炼数学模型、揭示事物本质规律.尽管标准GEP算法通过改进遗传操作在一定程度上克服了早熟现象,但在解决实际问题中仍常表现出算法的不稳定;此外,标准GEP算法挖掘出的函数表达式往往冗长,可解释性差.针对这些问题本文做了如下工作:(1)对标准GEP算法的基因进行了新的定义,改进了标准GEP算法的基因构成,提高了GEP算法的通用性;(2)将模拟退火引入到标准GEP算法的选择算子中,提出了基于模拟退火的基因改进型基因表达式编程算法(RG-GEP-SA);(3)实验表明,RG-GEPSA算法比标准GEP算法具有更高的稳定性,RG-GEPSA算法比标准GEP算法成功率提高了11%,挖掘出的函数表达式更具有可解释性.  相似文献   

11.
基因表达式编程(GEP)是遗传算法研究的新分支.针对股票对象的特点,提出了适应股票规律的GEP—STOCK模型,包括n时段—STOCK—GENE,STOCK—fitness以及STOCK-GEP算法,并以上海证券交易指数时间序列数据为对象做了实验.进行了误差和指数涨跌分析.实验结果表明GEP—STOCK模型预测精度较高,20d的平均绝对误差为11.08,平均相对误差为0.64%.从涨跌情况预测来看,模型对6d后指数的涨跌判断,正确率高于80%以上.  相似文献   

12.
为提高电路演化的效率和成功率,对电路设计中涉及的多个目标进行了定义与量化,并针对多目标优化问题,在基因表达式编程(GEP:Gene Expression Programming)的基础上,提出了基于多目标基因表达式编程的电路演化算法(MGEP:Multi-Objective Gene Expression Progra...  相似文献   

13.
遗传编程(GP)和基因表达式编程(GEP)是在遗传算法的基础上发展而来的遗传算法的新分支,它在个体的表示、个体的处理和结果的形式等方面与传统遗传算法有着显著的区别和优势.本文针对汇率市场对象的特点,分别研究了用遗传算法,遗传编程,基因表达式编程进行预测,取得了满意的效果.  相似文献   

14.
基于多样化进化策略的基因表达式编程算法   总被引:1,自引:0,他引:1  
针对传统GEP(Gene Expression Programming )算法的未成熟收敛以及陷入局部最优问题,提出一种基于多样化进化策略的基因表达式编程算法(DS-GEP:Gene Expression Programming based on diversified development strategy)。该算法通过基因空间均匀分布策略,自适应地交叉和变异算子以及淘汰算子等方法,对种群给予不同的进化策略,以保持种群的多样性,从而增强算法的寻优能力。通过对函数挖掘的实验证明,多样化进化策略各个部分均对改善挖掘效率发挥了作用,提高了DS-GEP函数挖掘算法的成功率。与传统GEP算法相比较,该算法的平均成功进化代数缩短了11%,成功进化时间缩短了8%,进化成功率提高了20%。  相似文献   

15.
基于目标语统计的译文选择的研究   总被引:1,自引:0,他引:1  
译文选择是词义消歧研究在机器翻译中的分支.本文介绍了基于目标语统计的译文选择的原理,并以英汉机器翻译中汉语译文的选择为例,详细讨论了基于目标语统计的方法的实现.通过对词典译文的处理得到统计数据.为适应实用化系统的要求,统计数据进行压缩,并采用特殊的检索算法.提出了多项式级的逐步渗透译文选择算法,实验结果表明,该算法可以将译文选择正确率提高10%以上.  相似文献   

16.
对传感器进行非线性校正是提高其工作性能的重要环节.在分析传感器的工作特征的基础上,设计了带有正态分布兴趣度函数的适应度函数,引进了上下限函数作为工具,提出了基于基因表达式编程的用于解决传感器系统非线性校正问题的SGEP算法,并进行了校正实验,实验表明,该方法比传统方法更灵活有效.  相似文献   

17.
针对传统的空气动力学模型在四维飞行轨迹预测上误差较大的问题,提出了一种基于改进的基因表达式编程(GEP)的预测模型.该模型通过历史飞行时间数据找出飞行位置、高度和过固定点时间的函数对应关系,预测下次飞行过每个固定点的高度和时间,对全程采样固定点的预测实现完整的四维轨迹预测.仿真试验验证了该预测模型更为理想,更加符合实际情形.  相似文献   

18.
分析了仿生学应用于空间数据挖掘的必要性及可行性;阐述了神经网络、遗传算法和基因表达式编程的应用研究;探讨了空间数据挖掘仿生学方法以及空间数据挖掘仿生学方法的未来发展.  相似文献   

19.
基于Kubelka-Munk理论的一种涂料配色光谱规划方法   总被引:2,自引:0,他引:2  
在涂料计算配色中,较难解决的问题是配色样品的吸收与散射系数的比值与各颜料配比之间的非线性关系,本文应用一阶光谱近似,将非线性关系简化为线世关系,并通过线性规划方法算出最佳配方,结果表明,其配色精度与预期结果一致。  相似文献   

20.
根据JJF1059-1999《测量不确定度评定与表示》技术规范的要求,对水中锌的火焰原子吸收光谱法测定结果的不确定度进行评定.方法考虑火焰原子吸收光谱法测定水中锌的不确定度的来源包括标准贮备液定值、贮备液稀释至使用液过程、校准曲线拟合、重复测量样品及分析仪器等因素,计算出各种不确定度分量并将其合成,以此计算出水中锌测定结果的不确定度,结果为(0.705±0.018)mg/L.结果表明,影响锌测量不确定度的主要因素有校准曲线拟合、重复测量样品及分析仪器误差.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号