首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
在"经验权重魅力值学习模型"(EWA)中引入公平因素而构建公平博弈学习模型,模型用公平思考引起的心理效用来代替策略物质效应,以此来修正决策参与者的策略收益,改变策略魅力值,进而研究动态博弈过程中博弈均衡的移动;通过对公平博弈学习模型和EWA学习模型的最后通牒博弈决策模拟比较,结果发现公平博弈学习模型能更快地收敛于均衡策略;我们继而设计并进行了冰淇淋蛋糕分配实验,实验证明了参与者在实验过程中存在公平思考及学习等行为;最后用实验数据检验公平博弈学习模型与EWA学习模型,结果显示:两个模型都可以收敛于均衡策略,但公平博弈学习模型具有更快的收敛速度和对参与者决策行为更好的预测能力,实验结果表明人类的公平思考行为影响着决策行为。  相似文献   

2.
针对知识化制造环境下的自适应调度问题,提出基于状态-动作不确定性偏向Q学习(state-action uncertainty bias based Q-learning,简称SAUBQ学习)的知识化制造自适应调度策略. 该策略针对传统Q学习收敛速度慢,训练时间长等问题,引入信息熵的概念定义了状态不确定性测度,据此定义了Q学习动作偏向信息函数,通过对Q学习奖励函数采用启发式回报函数设计,将动作偏向信息利用附加回报的方式融入学习系统,并证明了算法的收敛性和最优策略不变性. 在学习过程中,Q学习根据偏向信息调整搜索空间,减少了Q学习必须探索的有效状态-动作对数目,同时偏向信息根据Q学习结果不断进行调整,避免了不正确的误导. 经仿真实验比较,结果表明,该策略具有对动态环境的适应性和大状态空间下收敛的快速性,提高了调度效率.  相似文献   

3.
针对小波神经网络实现故障模式识别时存在的“维数灾”问题 ,提出了利用遗传算法在小波网络的学习过程中优化网络结构的方法 ,可有效减少小波基元 ,加速收敛。同时为提高遗传优化的收敛速度和精度 ,避免“早熟”现象 ,采用基于实数编码的遗传算法。给出了各个控制算子的自适应调整策略 ,并设计了增加和删除操作对遗传算法进行改进。仿真结果证明了该算法的有效性。  相似文献   

4.
基于混沌粒子群优化的系统级故障诊断策略优化   总被引:4,自引:0,他引:4  
针对诊断设计优化过程中的关键问题--故障诊断策略优化,提出了基于混沌粒子群优化算法的系统级故障诊断策略优化方法。该算法利用混沌优化不重复遍历系统所有状态的特点,引导粒子在全局范围内搜索,从而克服了粒子群算法“早熟”收敛的缺点。这使算法不仅具有较快的收敛速度,又保证了获得的最优解的可靠性,为获得有效的系统级故障诊断策略提供了可行的方法。最后,给出了该算法在诊断策略优化过程中的关键步骤,通过仿真证明了该算法对于系统级故障诊断策略优化的有效性。  相似文献   

5.
带一类自适应非线性特性的变步长BP学习算法   总被引:4,自引:1,他引:3  
针对前馈神经网络的反向传播(BP)学习算法收敛速度慢、易陷入局部最小等缺点,本文提出了在BP搜索进入误差代价函数曲率较小、收敛速度较慢处时,在变步长BP学习算法的基础上,引入一个非线性特性项,并将该特性项的强度系数构造为具有升温、降温策略控制的自适应非线性函数.仿真结果表明,该算法的收敛稳定、快速,具有较好的效果.  相似文献   

6.
具有广泛学习策略的回溯搜索优化算法   总被引:1,自引:0,他引:1  
回溯搜索优化算法(backtracking search optimization algorithm, BSA)是一种新型的进化算法。同其他进化算法类似,该算法仍存在收敛速度较慢的缺点。针对这一问题,在详细分析该算法原理的基础上,提出了具有广泛学习策略的改进算法。为了充分利用种群搜索到的较优位置,该策略首先利用提出的最优学习进化方程,通过与引入的随机进化方程之间随机选择来提高算法的收敛速度和搜索精度;另一方面,该策略利用提出的最优学习搜索方程,通过控制种群的搜索方向,促使种群尽快收敛至全局最优解。最后对20个复杂测试函数进行了仿真实验,并与其他3种目前流行的算法进行了比较,统计结果和Wilcoxon符号秩检验结果均表明,所提出的改进算法在收敛速度以及搜索精度方面具有明显优势。  相似文献   

7.
针对细菌觅食优化算法寻优过程中精度差、易陷入早熟收敛等缺点,提出一种变概率混合细菌觅食优化算法。借鉴粒子群算法的信息共享机制,采用能综合反映细菌自身学习及群体合作的趋化方向,以提高算法的寻优精度和效率;基于群体适应度方差理论引入变概率迁徙策略,帮助细菌快速跳出局部极值,避免了早熟收敛和精英细菌逃逸;采用改进型佳点集方法构造初始种群及迁徙后的新个体,保证了种群多样性和解空间随机性。实验结果表明,本文提出的算法在全局收敛能力及优化精度和速度方面均表现更优。  相似文献   

8.
本文首先采用超网络方法建立了海关监管超网络模型CSSN,其次利用演化博弈方法研究了CSSN中海关和企业这两个通过货物交互的异质群体间的策略选择和学习等问题,最后进行了该模型中的异质群体演化博弈仿真,分析了海关与企业两个异质群体之间的策略互动及其动态调整过程,证明了海关监管改进能够有效促进合作,引导演化博弈的结果收敛于最优并保持监管系统的稳定。  相似文献   

9.
基于信息熵的自适应PBIL算法及其应用   总被引:7,自引:0,他引:7  
分析了基于群体的增量学习(Population-based Increased Learning,简称PBIL)算法的基本原理和存在问题,提出了一种具有自适应学习和变异能力的改进策略。新的算法采用信息熵衡量种群的进化程度,并根据熵值的变化自适应地调整学习速率和变异率。应用该算法求解典型的Flow Shop调度问题,通过与简单PBIL算法和遗传算法的结果进行比较,表明该算法的计算效率和局部搜索能力得到提高,且收敛过程非常稳定。  相似文献   

10.
针对正余弦算法存在易陷入局部最优、求解精度不高、收敛速度较慢等问题, 提出一种基于动态分级策略的改进正余弦算法。首先, 引入拉丁超立方抽样法, 将搜索空间均匀划分, 使初始种群覆盖整个搜索空间, 以保持初始种群的多样性。其次, 采用动态分级策略, 根据适应度值的排序情况, 将种群动态划分为好中差3个等级, 并应用破坏策略与精英引导方法对其进行扰动, 以提高算法的收敛精度, 增强跳出局部最优的能力。最后, 引入反向学习方法, 设计了动态反向学习全局搜索策略, 以提高算法的收敛速度,同时对改进算法在复杂度、收敛性和稳定性方面进行性能测试, 选取15个标准测试函数在低维和高维状态下进行仿真实验分析, 并与粒子群算法、回溯搜索算法和其他改进正余弦算法进行比较。仿真分析结果表明, 所提算法有效地提高了算法的收敛性和稳定性。  相似文献   

11.
针对个体策略学习可能对共享资源捐赠习俗演化路径产生影响,提出用EWA学习模型刻画个体在现实场景下的策略调整过程,建立多个体EWA学习的演化博弈模型,并基于EWA学习给出算法流程,进行计算机仿真实验。仿真结果表明,在EWA学习支配下,随着迭代期次的增加,供给策略对个体的吸引度越来越大,个体的平均支付及联合支付也相对较高,能够克服共享资源供给上的囚徒困境,使共享资源捐赠习俗发育成为可能。  相似文献   

12.
采用仿真模拟评估方法进行体系作战效能评估包括配置想定、多次运行仿真系统和调用效能评估模型计算多个复杂步骤。针对此流程复杂、耗时长的问题,提出一种基于深度学习回归思想的体系作战效能智能评估方法,引入基于进化策略的作战效能优化流程。以全连接深度回归网络为预测模型,通过多个数据集的试验结果给出网络隐层数和样本量选择的指导原则。进一步结合遗传算法调整网络输入得到优化输出,迭代性能较好。以某仿真系统为例初步验证了其有效性和使用价值。  相似文献   

13.
The purpose of objective and quantitative evaluating the organizational learning ability is to make the enterprise have reliable criterions and operable procedures during the process of improving the organizational learning ability and founding learning organization. In this paper, an evaluating indicator system is established by analyzing the whole process of organizational learning; both qualitative and quantitative analyses are used, and a new combined evaluating method is presented. A measurement case involving twenty enterprises is given to prove the validity of this method. In conclusion, learning strategies are presented according to measurement result. This paper applies 4 models synthetically. The evaluating effect is superior to other methods.  相似文献   

14.
有限预知信息的可恢复加拿大旅行者问题   总被引:2,自引:0,他引:2  
加拿大旅行者问题是指旅行者针对行走过程中遭遇的突发性道路堵塞,如何设计一个有效路径选择策略,使得旅行者从出发地抵达目的地的行走时间尽可能地少的问题。从占线问题与竞争策略的角度讨论有限预知信息情形下的可恢复加拿大旅行者问题,给出决策者在车辆到达一交叉口时可以获取后一交叉口的关联路段是否堵塞及堵塞恢复时间情形下的等待策略和贪婪策略,以及相应策略下的竞争比,并与不可预知信息情形下问题的策略进行了比较。  相似文献   

15.
Stock index forecasting has been one of the most widely investigated topics in the field of financial forecasting. Related studies typically advocate for tuning the parameters of forecasting models by minimizing learning errors measured using statistical metrics such as the mean squared error or mean absolute percentage error. The authors argue that statistical metrics used to guide parameter tuning of forecasting models may not be meaningful, given the fact that the ultimate goal of forecasting is to facilitate investment decisions with expected profits in the future. The authors therefore introduce the Sharpe ratio into the process of model building and take it as the profit metric to guide parameter tuning rather than using the commonly adopted statistical metrics. The authors consider three widely used trading strategies, which include a na¨?ve strategy, a filter strategy and a dual moving average strategy, as investment scenarios. To verify the effectiveness of the proposed profit guided approach, the authors carry out simulation experiments using three global mainstream stock market indices. The results show that profit guided forecasting models are competitive, and in many cases produce significantly better performances than statistical error guided models. This implies thatprofit guided stock index forecasting is a worthwhile alternative over traditional stock index forecasting practices.  相似文献   

16.
针对移动边缘计算网络中不合理的服务放置和资源分配所导致的服务质量下降问题, 提出了一种基于分布式深度学习的边缘服务放置策略。首先, 以最小化所有用户服务请求时延与加权服务放置成本总和为优化目标, 将优化问题建模为混合整数非线性规划问题。其次, 在给定服务放置策略情况下, 利用凸优化理论求解出边云最优的计算资源分配方案。最后, 利用分布式深度学习解决了服务放置问题。理论证明及仿真结果表明, 所提策略能够有效降低用户服务请求时延和应用服务提供商的服务放置成本, 并且逐渐逼近全局最优的服务放置策略。  相似文献   

17.
This paper considers the optimal investment problem for an insurer in the sense of maximizing the adjustment coefficient of the risk process.The authors propose a modified periodic risk model in which the periodic risk process is perturbed by a standard Brownian motion.The insurer can invest in multiple risky assets and one risk-free asset and the correlations between the risky assets and the risk process are considered.Optimal strategy is obtained explicitly,which is a function of time and related to the risk process.The effects of market parameters on the optimal strategy are discussed and a numerical example is also given.  相似文献   

18.
近年来无人潜航器对国家海洋国土安全带来的威胁逐渐增大,其低噪声特性和隐蔽入侵方式也给反潜行动带来极大困难。为此,提出了一种两阶段规划算法,用以学习优化反潜策略,在部署阶段,建立了基于不确定性马尔可夫决策过程的反潜资源分配模型,并设计了鲁棒性部署策略强化学习算法,用以求解不确定条件下分配模型的纳什均衡解。在搜索阶段,建立了基于部分可观察马尔可夫决策过程的搜潜模型,并设计了基于多智能体强化学习的搜潜策略学习算法。最后,通过仿真实验验证了本算法与比对算法相比具有更高的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号