首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对知识化制造环境下的自适应调度问题,提出基于状态-动作不确定性偏向Q学习(state-action uncertainty bias based Q-learning,简称SAUBQ学习)的知识化制造自适应调度策略. 该策略针对传统Q学习收敛速度慢,训练时间长等问题,引入信息熵的概念定义了状态不确定性测度,据此定义了Q学习动作偏向信息函数,通过对Q学习奖励函数采用启发式回报函数设计,将动作偏向信息利用附加回报的方式融入学习系统,并证明了算法的收敛性和最优策略不变性. 在学习过程中,Q学习根据偏向信息调整搜索空间,减少了Q学习必须探索的有效状态-动作对数目,同时偏向信息根据Q学习结果不断进行调整,避免了不正确的误导. 经仿真实验比较,结果表明,该策略具有对动态环境的适应性和大状态空间下收敛的快速性,提高了调度效率.  相似文献   

2.
本文讨论了利用多种异质特征数据诸如空间状态、信号幅度、多普勒频移等信息来实现多目标关联跟踪的方法。文中由品质函数的概念定义了一种关联测度,通过关联测度定量地将可能获得的多特征数据引入关联跟踪算法中。文中阐明这一关联测度是常规关联决策的推广。为验证这一方法的性能,本文还进行了计算机仿真实验,并给出实验结果。  相似文献   

3.
针对复杂瞬变的多用户多队列多数据中心云计算环境中作业调度困难的问题,提出一种基于深度强化学习的作业调度方法.建立了云作业调度系统模型及其数学模型,并建立了由传输时间、等待时间和执行时间三部分构成的优化目标.基于深度强化学习设计了作业调度算法,给出了算法的状态空间、动作空间和奖赏函数.设计与开发了云作业仿真调度器,完成作...  相似文献   

4.
提出了一种雷达引信故障诊断和预报的新算法。该算法利用时间序列的信息熵构造信息花费函数,以雷达引信的实测数据为基础选取好小波基,利用小波的多尺度分辨分析对雷达引信的漏脉冲进行分析,以互相关和统计算法分别建立了雷达引信正常工作和故障状态下的模型。实验结果表明,该算法能定量地分析雷达引信的工作状态,准确地预报雷达引信的故障程度。  相似文献   

5.
基于深度随机博弈的近距空战机动决策   总被引:1,自引:0,他引:1  
针对空战中作战信息复杂、难以快速准确地感知态势做出决策的问题,提出一种博弈论与深度强化学习相结合的算法.首先,依据一对一典型空战流程,以随机博弈为标准,构建近距空战中红蓝双方对抗条件下的双机多状态博弈模型.其次,利用深度Q网络(deep Q network,DQN)处理战机的连续无限状态空间.然后,使用Minimax算...  相似文献   

6.
针对Boost变换器母线电压稳定控制存在模型不确定性和非线性的问题,提出了一种基于无模型深度强化学习的智能控制策略。结合强化学习DDQN(double DQN)算法与DDPG算法设计了Boost变换器控制器,包括了状态、动作空间、奖励函数以及神经网络的设计以提高控制器动态性能;基于ModelicaGym库开发工具包reinforment learning modelica(RLM)实现了Boost变换器模型与强化学习智能体的联合仿真。通过与双环PI控制器的对比仿真表明:强化学习控制器在三种工况下的母线电压稳定控制结果具有更好的动态性能。  相似文献   

7.
一种基于量子机制的分类属性数据模糊聚类算法   总被引:3,自引:0,他引:3  
分类属性数据的样本间的分布不平衡、样本的分布与空间距离无关的特点与量子力学中粒子的分布状态由能量决定、粒子分布具有不平衡性的特点相似.基于此,参照量子聚类QC算法确定聚类中心的聚类策略,重写距离量子势能公式,定义相似性度量测度和相异性度量测度的新概念,提出了针对分类属性数据的量子聚类CQC算法,并对算法的聚类有效性进行了研究,通过同其它几个已有的算法的仿真实验比较,证明该算法是有效的、有一定的可扩展性,算法的一些性能优于已有的其它几个算法.  相似文献   

8.
针对指挥信息系统历史状态样本有限的特点,基于支持向量机(support vector machines, SVM)设计了一种面向不平衡数据的SVM增量学习方法。针对系统正常/异常状态样本不平衡的情况,首先利用支持向量生成一部分新样本,然后通过分带的思想逐带产生分布更加均匀的新样本以调节原样本集的不平衡比。针对系统监控实时性要求高且在运行过程中会有新样本不断加入的特点,采用增量学习的方式对分类模型进行持续更新,在放松KKT(Karush-Kuhn-Tucker)更新触发条件的基础上,通过定义样本重要度并引入保留率和遗忘率的方式减少了增量学习过程中所需训练的样本数量。为了验证算法的有效性和优越性,实验部分在真实系统中获得的数据集以及UCI数据集中3类6组不平衡数据集中与现有的算法进行了对比。结果表明,所提算法能够有效实现对不平衡数据的增量学习,从而满足指挥信息系统状态监控的需求。  相似文献   

9.
基于Metropolis准则的多步Q学习算法与性能仿真   总被引:1,自引:0,他引:1  
强化学习是目前智能体和机器学习研究的热点。针对强化学习中标准Q学习算法更新速度慢的缺点,通过引入多步信息更新策略和模拟退火中的Metropolis准则,提出了一种新颖的多步Q学习算法,称为SAMQ算法。仿真实验表明,与现有的算法相比,该算法能够有效提高收敛速度,较好地解决智能体选择动作时面临的新知识探索还是当前策略遵循的关键问题。  相似文献   

10.
陈俊英  何波  王羡慧 《系统仿真学报》2012,24(9):1777-1779,1789
为了弥补单种特征提取算法描述模型特征的不足,提出基于HPal信息熵的三维模型多特征动态融合检索算法。针对给定的查询模型,利用各特征集上的检索结果列表动态计算各特征相对应的HPal信息熵,基于HPal信息熵确定融合权值,然后通过距离加权计算模型之间的相似度。与融合中最好单特征集相比,该方法的检索准确率明显提高,并且实验结果也表明该方法比其他3种流行的算法更为有效地提高了检索效果。  相似文献   

11.
针对地磁仿生导航过程中对搜索偏向性考虑不足的问题,提出了一种基于探索与开发权衡的导航方法。依据时序进化搜索策略的结构特征,从统计学角度建立了磁趋势性运动模型,分析了探索与开发和磁趋势性运动的关系,并将搜索偏向权衡问题归结为对种群多样性的合理调控,引入分布熵的概念度量种群多样性,设计了分布熵约束下的磁趋势性搜索策略,给出了导航搜索流程。通过仿真分析,给出较为合理的参数设置,并将该方法与时序进化搜索方法进行对比实验,结果证实了所提方法能够有效提高导航效率。  相似文献   

12.
针对Flow-shop排序问题的固有复杂性,设计了一种遗传强化学习算法.首先,引入状态变量和行动变量,把组合优化的排序问题转换成序贯决策问题加以解决;其次,设计了一个Q-学习算法和基于组合算子的遗传算法相集成,遗传算法利用染色体的优良模式及其适应值信息来指导智能体的学习过程,提高学习效率和效果,强化学习则对染色体进行局部优化进而改良遗传群体,二者有机结合共同解决Flow-shop排序问题;再次,提出了多种适应性策略,使算法关键参数能够周期性递变,以更好地在深度搜索和广度搜索之间均衡;最后,仿真优化实验结果验证了该算法的有效性.  相似文献   

13.
1 IntroductionRough set thcory, introduced by Pawlak [lj, is a relatively new soft computing tool todeal with vagueness and uncertainty. It has been applied to many areas successfullylncluding machine learning, data analysis, pattern recognition, decision support, datamining, process control and predictive modeling [1--6j.Rough set theory gives a formal definition of knowlcdge and provides a series of toolsto deal with know1cdge by set a1gebra. In rough set theory, know1edge can be regarded a…  相似文献   

14.
基于资源基础理论和战略匹配理论,以探索式创新和利用式创新为中介变量,战略柔性为调节变量,构建了数字化情境下,创业导向和网络导向对新创企业成长的影响的理论模型。通过对403家新创企业展开实证研究,结果表明:在初创期和成长期,创业导向对新创企业成长的影响大于网络导向,探索式创新在网络导向与新创企业成长间起中介作用,利用式创新在创业导向和网络导向与新创企业成长间起中介作用,战略柔性正向调节创业导向、探索式创新和利用式创新与新创企业成长间的关系;初创期,利用式创新对新创企业成长的影响更大,而成长期探索式创新对新创企业成长的影响更大。  相似文献   

15.
针对现有的直觉模糊熵只考虑了隶属度与非隶属度的偏差,而未考虑直觉模糊集自身包含的犹豫度信息的缺憾,本文提出了一类新的直觉模糊熵,它可以充分表达决策者的犹豫度信息.在此基础上,针对属性权重完全未知和属性权重信息部分已知的直觉模糊多属性决策问题,分别通过熵权法和利用最小化直觉模糊熵建立的最优化模型求解属性权重,给出了直觉模糊多属性决策的折中比值法.最后,通过应用实例说明了所提出方法的有效性和可行性.  相似文献   

16.
一种小种群自适应遗传算法研究   总被引:6,自引:0,他引:6  
分析了变异算子在标准遗传算法和自适应遗传算法中的作用和当前研究的不足,提出一种新颖的能够大大提高遗传算法性能的变异策略,并进而提出一种小种群自适应遗传算法.该方法在采用赌轮选择和单点交叉的情况下,利用一种可伸缩的变异策略使得算法在探测和开发之间取得很好的平衡,从而能够用小规模的种群进行有效的全局搜索和局部搜索,避免早熟收敛,并能够以较快的速度收敛到全局最优解.对多峰函数的仿真实验表明了算法的有效性.  相似文献   

17.
介绍了一种用于矿井方案优化设计预处理的混合专家系统——基于神经网络与规则推理的专家系统;阐述了该混合专家系统的基本结构及实现过程,提出输出向量的模糊分类;此外,简要介绍了该系统的实际应用。  相似文献   

18.
针对现有反导目标威胁评估方法忽略目标属性犹豫度和权重并造成评估精度不高的问题,引入直觉模糊粗糙集(intuitionistic fuzzy rough set, IFRS)理论,提出基于改进IFRS相似度和信息熵的反导作战目标威胁评估方法。首先,细分IFRS犹豫度,提出改进的IFRS相似度模型,并证明其性质。之后,针对现有的IFRS信息熵存在与直觉事实不相符的问题,提出基于余弦函数的IFRS信息熵,确定目标属性权重。在此基础上,构建并量化反导作战目标威胁评估体系,并通过比较威胁目标的各个属性值与正、负理想解的相似度,实现目标威胁排序。仿真实例验证了该方法的可行性和有效性,可为不确定环境下反导作战威胁评估提供新的参考和尝试。  相似文献   

19.
在线投资组合问题是计算金融领域的基本问题之一.金融市场瞬息万变,投资者需要根据各种资本市场信息动态地调整资产头寸.在不对资产价格做任何概率假设的前提下,研究了带边信息的在线投资组合策略.用相对熵函数定义两个投资组合向量之间的距离,提出了一种带边信息的在线投资组合指数梯度策略,并从理论上证明了它是一个泛证券投资组合策略,即与离线的最优状态定常再调整策略具有相同的渐近平均指数增长率.采用实际股票数据对该策略进行了测试,并分析了交易费用对策略的影响,结果表明其能获得更高的收益.  相似文献   

20.
基于边界域的知识粗糙熵与粗集粗糙熵   总被引:5,自引:0,他引:5  
传统的知识粗糙熵表征了知识整体的统计特征,是总体的平均不确定性的量度,知识和粗集的不确定性值被放大。从Pawlak拓扑的角度,给出了一种基于边界域的知识粗糙熵新定义,并修正了粗集粗糙熵的定义,集合的不确定性可以通过边界域来描述,能更精确的度量知识不确定性;证明了知识粗糙熵和修正后的粗集粗糙熵都随着信息粒度的变小而单调减少等重要结论。最后,通过弹簧振子系统定性仿真例子,结合定性推理技术,构造属性约简的启发式算法,消去定性描述中的冗余,获得了其系统的定性微分方程,说明了粗集理论在定性推理与定性仿真技术中的重要应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号