排序方式: 共有48条查询结果,搜索用时 78 毫秒
41.
针对不确定环境的规划问题,提出了基于预测状态表示的Q学习算法.将预测状态表示方法与Q学习算法结合,用预测状态表示的预测向量作为Q学习算法的状态表示,使得到的状态具有马尔可夫特性,满足强化学习任务的要求,进而用Q学习算法学习智能体的最优策略,可解决不确定环境下的规划问题.仿真结果表明,在发现智能体的最优近似策略时,算法需要的学习周期数与假定环境状态已知情况下需要的学习周期数大致相同. 相似文献
42.
本文考虑时不变线性多变量系统的分散控制问题.引入了分散控制下可控可观子空间的概念,并得出系统没有分散固定模的充要条件是可控可观子空间为全空间的结果,因此给出一种不用直接求固定模而可判断固定模是否存在的判据. 相似文献
43.
基于Agent的多层次多群体协同工作的建模 总被引:3,自引:1,他引:3
在分析计算机支持的多层次多群体协同工作(CSMMCW)的需求和特点的基础上,提出了一种CSMMCW的5元组结构模式,以及基于多Agent的CSMMCW协作模型,并就Agent设计与实现中的主要问题,如Agent组成结构、通信机制等作了分析与探讨。所提出的模型在计算机支持的协同工作系统NetCoop以及多媒体远程教育系统MDLS中得到实际应用。 相似文献
44.
人工免疫算法在函数优化中的应用 总被引:22,自引:0,他引:22
基于自然免疫系统中体液免疫响应的机制提出了一种函数优化算法,该算法模拟了抗体的产生、抗体与抗原的黏合、激励、克隆、超突变及未受激励细胞的消亡等自然过程,其主要步骤包括:抗原、B细胞的算法定义,B细胞与抗原之间的亲和度计算与选择,B细胞的克隆、变异和记忆细胞的产生等.算法的主要特点是模拟了不同的自然机制,具有并行性,产生了高亲和度、长寿命的记忆细胞并不断对其更新.用两种不同类型的测试函数进行了仿真实验,并与基本遗传算法进行了比较,结果表明所提算法能以较快的速度完成给定范围的搜索和全局优化任务. 相似文献
45.
基于赋时着色Petri网的协同工作建模和性能研究 总被引:2,自引:0,他引:2
提出了利用赋时着色Petri网(Timed Colored Petri Net)对协同工作进行建模和性能分析的方法;从性能角度提出一种新的协调策略,即从任务动态分配的角度对协同性能进行分析,并比较了各种资源优化分配的不足之处;提出利用模糊策略的方式,按照协同成员(组)的不同能力,在满足完成时间的要求下进行任务分配,从而达到了整体协作性能提升的效果.同时,用Deisgn/CPN对该策略进行了仿真分析,其结果证明了该方法的有效性和可行性.所提的调度策略已在CooPDesigner系统中得以实现. 相似文献
46.
基于"当前"统计模型的交互式多模型算法 总被引:6,自引:0,他引:6
提出了一种基于"当前"统计模型的交互式多模型算法。在交互式多模型算法框架内,计算"当前"统计模型的概率,自适应地调整"当前"统计模型中目标加速度,使其能够反映目标的机动特性,充分发挥了"当前"统计模型和交互式多模型算法的优点,扩大了"当前"统计模型的应用范围,提高了"当前"统计模型的自适应性。Monte Carlo仿真结果表明了该算法的有效性。 相似文献
47.
用于神经网络直接逆控制的连续空间遗传算法 总被引:2,自引:0,他引:2
为解决神经网络直接逆控制中训练样本的获取问题 ,提出了一种神经控制器的设计方法。通过对连续空间遗传算法的编码和遗传算子进行适当改进 ,采用保留精英的线性排序选择 ,避免成熟前收敛 ,并给出算术交叉算子和乘法变异算子 ,使算法同时具有好的搜索精度和搜索效率 ;然后采用这种改进的遗传算法对非线性动态系统的控制进行优化 ,获得了基于一定性能指标的期望的状态轨迹及相应的最优控制序列 ,并以此训练神经网络控制器。最后给出了以同步机为控制对象的仿真结果。 相似文献
48.
基于种族优生的进化规划用于混合非线性整数规划 总被引:2,自引:0,他引:2
混合非线性整数规划是在许多工程应用中经常遇到的重要问题。本文提出一种基于种族优生的进化规划算法用于求解混合非线性整数规划。一方面,该算法基于多种群并且每一代都选择各种群的最优秀个体作为下一代的种群祖先。另一方面,该算法的进化步长、种群规模和处理约束条件时所取的参数在进化过程中是动态变化的。实验表明该方法求解混合非线性整数规划问题的仿真结果优于现有的研究成果(GA,ES,SA)。 相似文献