共查询到20条相似文献,搜索用时 93 毫秒
1.
属性约简分类是粗糙集在数据挖掘中一个重要的研究方向.其大多数研究是基于小规模空间信息系统;基因表达式编程是一种新出现的进化算法,具有高度并行、极强的函数挖掘的特点.提出了将粗糙集中的充要强度作为GEP的适应度函数,创建一种新的属性约简分类算法,以减少粗糙集在大规模知识库中知识约简的复杂程度,加快收敛速度. 相似文献
2.
基因表达式编程(GEP)是遗传算法研究的新分支.针对股票对象的特点,提出了适应股票规律的GEP—STOCK模型,包括n时段—STOCK—GENE,STOCK—fitness以及STOCK-GEP算法,并以上海证券交易指数时间序列数据为对象做了实验.进行了误差和指数涨跌分析.实验结果表明GEP—STOCK模型预测精度较高,20d的平均绝对误差为11.08,平均相对误差为0.64%.从涨跌情况预测来看,模型对6d后指数的涨跌判断,正确率高于80%以上. 相似文献
3.
提出一种基于基因表达式编程算法(GEP)的人口预测新方法,并将该方法应用于东莞市人口预测实例问题研究。实验结果表明:由于基因表达式编程算法采用基因型与表现型相统一的编码方式、高效的遗传算子以及全局搜索的寻优方式,基于GEP算法的人口预测模型能够在样本少的情况下给出相对准确的预测结果。其验证数据的预测绝对值平均误差为0.96%,与灰色系统GM(1,1)预测模型及径向基人工神经网络预测模型相比,预测精度分别提高了18.34%、30.54%。GEP人口预测模型能够更好地挖掘人口发展的复杂非线性模式,有效防止过度拟合现象的发生,提供更为准确、合理的拟合及预测结果。 相似文献
4.
针对基因表达式程序设计GEP、免疫基因表达式IGEP改进算法收敛速度慢、易陷入局部最优等缺陷,提出把小生境技术用到IGEP中.不管是GEP还是IGEP,当陷入局部最优值时,依靠基本迭代很难跳出该值.为此,使用小生境技术处理局部最优值,并且把找到的局部最优值用来更新免疫记忆库,再用免疫算法选择种群,能避免再次陷入记忆库中的局部最优值.通过仿真实例,结果表明该方法在防止算法早熟上起到良好的作用,并且比一些改进GEP的算法更加优秀. 相似文献
5.
基于基因表达式编程的代价敏感分类算法 总被引:3,自引:1,他引:2
针对传统分类算法在稀有类上的分类效果不佳,通过引进代价矩阵,改进了基因表达式编程的适应度函数,提出了一种基于基因表达式编程的代价敏感分类 (CSC-GEP:Cost-Sensitive Classification-Gene Expression Programming) 算法,并在UCI数据集上对该算法进行了实验。实验结果表明,CSC-GEP的召回率、精度和F-度量值较C4.5分类器分别提高了7.07%,2.89%,5.12%,证明了CSC-GEP是一种有效的代价敏感分类算法。 相似文献
6.
基于多样化进化策略的基因表达式编程算法 总被引:1,自引:0,他引:1
针对传统GEP(Gene Expression Programming )算法的未成熟收敛以及陷入局部最优问题,提出一种基于多样化进化策略的基因表达式编程算法(DS-GEP:Gene Expression Programming based on diversified development strategy)。该算法通过基因空间均匀分布策略,自适应地交叉和变异算子以及淘汰算子等方法,对种群给予不同的进化策略,以保持种群的多样性,从而增强算法的寻优能力。通过对函数挖掘的实验证明,多样化进化策略各个部分均对改善挖掘效率发挥了作用,提高了DS-GEP函数挖掘算法的成功率。与传统GEP算法相比较,该算法的平均成功进化代数缩短了11%,成功进化时间缩短了8%,进化成功率提高了20%。 相似文献
7.
应用基因表达式编程(GEP)优化PID调解器参数,提出了基于GEP的PID参数优化策略和适应度函数的设计方法;提出了基于GEP的PID参数优化的GEP-PID算法。实验表明,与Ziegler-Nichols(ZN)法相比,该算法使系统阶跃响应的超调量下降了65.45%,上升时间和调整时间分别缩短了38.5%和61.5%。 相似文献
8.
针对传统决策树分类算法在多数据流分类的正确率和处理速度存在的不足,提出了一种基于基因表达式编程(GEP)的多数据流分类并行算法,以提高多数据流分类的正确率和处理速度.根据GEP在数据分类上的优势,运用GEP原理和数据流段中分类目标相似属性合并构造多数据流分类算法,并对多数据流分类算法进行并行设计与分析,在多核PC上进行对比实验.实验结果表明:该串行与并行分类算法均优于传统算法,且在多样本上具有较好的加速比. 相似文献
9.
为了更好的解决车间调度问题,提出了一种基于时延Petri网(TdPN)和基因表达式编程相结合的调度算法。在该方法中,基因表达式编程根据时延Petri网模型中的部分变迁序列来确立染色体,每条染色体表示一种车间调度方案。作者选用了基因表达式的选择、交叉、变异三种类型进行遗传操作,利用延时Petri网对车间调度过程的仿真,根据变迁的赋时时间获得每条染色体的相应的时间。最后本文结合基因表达式编程具有较好的寻优能力和Petri网对动态的离散事件的过程能进行很好的描述的优点,在文章实验中验证了此方法的可行性。 相似文献
10.
由于获得的变形监测数据存在着偶然误差,而直接进行基因表达式编程的模型建立,则预测结果往往与真实值相差较大。本文对含噪声的观测值进行小波包去噪,再分别使用去噪数据与原始数据进行建模,实验对比分析表明噪声对基因表达式编程模型的预测产生着一定的影响,并得出在建模前应该进行相关的去噪工作,从而建立的模型进行预测其结果与真实值相差较小,可达到对大坝的变形预测分析及大坝的安全监控的目的。 相似文献
11.
基因表达式编程(GEP)融合了遗传算法和遗传编程的优点,进化速度提高了2~4个数量级,但在解决复杂问题时仍存在早熟现象. 为解决这个问题,做了下列工作:(1)定义了种群多样性度量和选择压力,分析了传统GEP算法选择操作的不足;(2) 把聚类思想引入选择操作中,提出了基于聚类竞争GEP算法CC-GEP(GEP based on Cluster Competition),证明了CC-GEP能自适应地根据种群多样性调节选择压力;(3) 实验表明CC-GEP比传统GEP成功率高36%,模型精度R-square提高8%,多次运行的最优适应度平均值提高了8%,说明CC-GEP算法更加稳定,较好地克服了GEP的早熟问题. 相似文献
12.
根据分等级规则挖掘的具体要求,结合遗传编程的特点建立了一种新型的规则挖掘模型。对规则的编码方式和遗传算子进行了详细的设计,构造了满足遗传编程挖掘的树型染色体规则结构,并综合考虑支持度、可信度和相关度3个指标和等级系数等约束因素来设计适应度函数。最后通过实例对基于遗传编程的分等级规则挖掘模型的可靠性进行了验证。 相似文献
13.
为了在网格的动态分域调度机制中,更前瞻性地动态选取域内“计算结点”,解决原传统算法中需要依赖专业知识,而使选取过程具有主观性和盲目性的问题,提出了基于基因表达式编程(GEP)的网格调度域计算结点的选取算法.并通过对基于传统遗传算法进行选取和基于GEP进行选取的算法的比较,实验证明了该算法的优越性与实用性. 相似文献
14.
目的 分析时序数据变化状况、记录数据特性值随时间而发生波动的过程是否处于控制状态,如有异常,则可对该时间段数据进行挖掘,通过挖掘发现知识;方法 以统计学的正态分布与中心极限定理为理论基础,结合免疫进化的思想,提出免疫控制图原理及学习算法;结果 理论分析和仿真实验表明了免疫控制图方法的实用性和有效性;结论 免疫控制图在质量数据的分析与控制、顾客的消费行为分析、股票市场波动的异常反映、网络安全管理等领域有着广泛的应用。 相似文献
15.
本文以某省移动通信网管数据分析平台项目为背景,阐述了在移动通信网管中引入数据仓库技术,采用数据挖掘方法,解决目前网络分析中的数据瓶颈问题。 相似文献
16.
本文讨论了采用面向对象技术开发开采沉陷数据处理软件中 ,数据的结构类设计、数据的组织、链表和数组类的使用、输出类的设计等 ,从而提高程序的运行效率和系统的开发周期 相似文献
17.
一种基于Rough Set的分类规则挖掘方法 总被引:1,自引:2,他引:1
结合国内外的最新研究成果,提出了一种运用动态约简算法挖掘出大型数据库中稳定的分类规则的有效方法,可以对不断变化的数据库中新出现的对象进行分类,最后通过对其时间复杂度的分析证明了算法的高效性. 相似文献
18.
在数据挖掘隐私保护进行协作数据分析时,部分数据集可能分属不同的数据对象,处理时就需要采取不同的数据失真方法.提出了一组全新的数据失真优化策略,通过将属性划分与奇异值分解法(SVD)、非负矩阵因子分解法(NMF)、离散小波变换法(DWT)相结合,运用4种方案对隐私保护原始数据集的子矩阵进行扰动,并用一些衡量指标来衡量这些策略的效果;利用基于支持向量机(SVM)的二元分类来进行数据实用性的检测.结果表明与数据失真单策略相比,新提出的方案在实现数据隐私和数据实用性的良好平衡方面效果十分显著,为协作数据分析提供了可行性解决方案. 相似文献
19.
序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。 相似文献
20.
基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上. 相似文献