首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
传统酒店动态定价研究大多考虑改进需求预测方法或考虑需求环境已知,而现实生活中需求分布通常是未知的.本文考虑需求分布未知的情境,建立基于马尔可夫决策过程的酒店客房多周期动态定价模型,并利用强化学习方法,提出基于SARSA(λ)的改进算法对客房动态定价模型进行求解.为提升算法的求解能力和收敛速度,提出了基于改进ε-greedy策略的ε-SARSA(λ)算法和基于改进模拟退火策略的ISA-SARSA(λ)算法.通过数值实验对比SARSA(λ), ε-SARSA(λ), SA-SARSA(λ)和ISA-SARSA(λ)四种算法的收益优化结果,验证了改进算法的有效性,结果显示, ISA-SARSA(λ)算法求解性能最好.  相似文献   

2.
电子商务中面向产品线的动态定价方法研究   总被引:1,自引:0,他引:1  
研究电子商务零售中产品线动态定价决策的优化问题.决策的实时性需求和计算复杂性是该问题的难点.对此,首先提出市场需求状态模型和需求状态的估算方法,在此基础上,进一步提出产品线动态定价的优化模型,最后,提出一种基于自组织神经网络的Q学习算法来求解产品线动态定价的优化问题.模拟实验结果表明,用该算法求解产品线动态定价问题具有较高的效率和效用.  相似文献   

3.
针对动态的车队管理问题中,由于车辆故障、天气条件和交通阻塞等情况所引起的车辆行驶时间具有很大变动性的情况,提出了一个具有随机行驶时间的动态车队管理问题的随机模型.为了求解该问题,将其构造为一个动态规划问题,并基于时间和位置信息,将其分解为多个子问题.在每个子问题中,利用高维状态变量表示随机行驶时间信息,并采用价值函数的近似进行求解.实验结果表明,提出的方法能够得到高质量的解.  相似文献   

4.
针对战时定点修理任务重、修理时间有限、约束复杂的问题,进行了面向定点修理的战时装备维修任务多目标动态调度研究。提出了战时定点修理装备维修任务调度军事问题,考虑修理时间窗、非遍历性等约束,构建了战时装备维修任务多目标动态调度模型。采取分步求解思路处理修理小组分配以及修理任务排序两阶段优化问题,并从状态转移规则、信息素更新规则、先验信息获取3个方面对最大最小蚂蚁系统(max-min ant system, MMAS)算法进行改进,结合变邻域搜索(variable neighborhood search, VNS)算法增强算法的局部搜索能力,设计了基于Pareto改进VNS-MMAS算法实现模型求解,并通过示例仿真验证了模型及算法的科学性与有效性。  相似文献   

5.
欧式期权的动态定价过程可归结为实际价格观测、模型选择、状态变量估计以及下一时刻期权定价的动态循环.为使这一定价过程兼具序贯性、准确性及易行性,设计了一种基于Hull-White扩展模型的动态定价方法:以平稳仿射随机波动率模型作为基础模型,在仅存有限个期权合约时,根据实际期权价格曲面,使用粒子滤波方法估计瞬时方差,并在固...  相似文献   

6.
欧式期权的动态定价过程可归结为:实际价格观测、模型选择、状态变量估计以及下一时刻期权定价的动态循环。为使这一定价过程兼具序贯性、准确性及易行性,设计了一种基于Hull-White扩展模型的动态定价方法:以平稳仿射随机波动率模型作为基础模型,在仅存有限个期权合约时,根据实际期权价格曲面,使用粒子滤波方法估计瞬时方差,并在固定显式参数下,更新Hull-White扩展模型;进而利用前向特征过程,实现下一时刻的期权定价。实证表明:相比于固定参数及参数学习下基于对比模型的一般风险中性定价,使用基于Hull-White扩展模型的动态定价方法时,期权定价准确性和稳定性均显著提升。  相似文献   

7.
针对制造行业中广泛存在的无等待流水车间调度问题,提出一种改进的离散状态转移算法进行求解。基于流水车间调度问题的特性,设计工件的编码方式,采用基于工件加工时间标准差为优先级的NEH(Nawaz-Enscore-Ham)方法构造初始解,设计基于插入和交换的多邻域组合搜索策略以提高初始解的质量;提出一种基于群状态的离散状态转移算法,并利用带二次状态转移操作的三种离散操作算子扩大算法的搜索范围;为进一步提高离散状态转移算法的求解性能,设计了基于莱维飞行的破坏重构局部搜索方法,对全局搜索发现的优质解进行细致搜索。仿真实验表明,改进的离散状态转移算法能够有效求解无等待流水车间调度问题。  相似文献   

8.
多元精馏体系仿真中的问题及对策   总被引:3,自引:0,他引:3  
多元精馏体系是典型的多变量系统,而且各变量之间关联严重,对其进行动态建模和仿真,协调各变量之间的关系,有利于先进控制的实施,因为其动态机理模型十分复杂,在其系统建模、模型求解、仿真平台的开发中存在较多的问题,针对这些问题,从实际应用和机理分析出发,将模型中重要状态变量温度的代数方程表达式替换为微分方程形式,更好的反映了精馏塔的动态特性,合理选择了系统模型和微分方程的求解方法,并进行了探讨,开发了与之对应的基于MATLAB/SIMULINK的乙烯精馏塔动态仿真平台,并取得了较好的仿真效果,提高了计算效率而且计算精度合理。  相似文献   

9.
考虑库存能力约束的批量问题与定价的联合决策   总被引:1,自引:0,他引:1  
针对多周期离散时间情形,研究了库存能力约束下如何有效地协调定价决策与批量决策,使得企业利润最大化。建立了非线性混合整数规划模型。分析了最优解的特征,详细讨论了子问题的求解方法。提出了基于动态规划的精确算法,可以在多项式时间内求解出联合决策问题的最优定价与最优生产计划。实验结果分析了库存能力与最优利润、最优生产计划之间的关系。  相似文献   

10.
多车场多车型最快完成车辆路径问题的变异蚁群算法   总被引:3,自引:1,他引:2  
一般车辆路径问题的目标是总路程或总费用最小, 而在应急管理或特殊配送中要求以最快的速度完成配送任务, 该文研究了以最快完成为目标的多车场多车型车辆路径问题的变异蚁群算法. 首先介绍了多车场多车型最快完成车辆路径问题, 然后分别给出求解多车型和单车型问题的车辆分割的动态规划方法, 并把单车型问题的动态规划方法和改进的Split方法进行对比, 同时利用改进的最大流算法将车辆分配给各车场, 从而把该问题转化为寻找最优顾客排列的问题. 随后给出了求解该问题的变异蚁群算法, 最后给出了计算实例.  相似文献   

11.
未来的来袭导弹可能具备较强的机动性,其弹道不可预测,针对拦截弹追击此类目标的追逃问题,基于微分对策(differential-game, DG)理论建立追逃博弈模型并给出求解方法。模型在分析两者相对运动的基础上,考虑地球重力和自转的影响,以推力角为控制变量,离地高度、速度和经度角为状态变量,建立微分方程组。然后将追逃DG模型转化为单边最优对策问题;并给出改进的高精度五阶Gauss-Lobatto多项式配点法来近似状态变量对时间的导数,将微分方程组转换为代数约束,降低非线性规划问题复杂程度。最后给出了本文研究的仿真实例。  相似文献   

12.
试图建立一套用于动态冲突决策分析的理论与方法,给出了描述动态冲突决策分析、选择的几类基本概念,得到了冲突状态转移的基本途径以及冲突状态转移的定量描述与相关结论,同时获得在证券投资交易中的应用.  相似文献   

13.
运用微观经济学、博弈论及动态规划等有关理论,探讨了在国内外企业处于完全信息(即确定性)且同时决策的假设条件下,面对国内政府的反倾销及行政复议,国外企业为实现其在国内市场上所获取的利润贴现值的总和达到最大化的动态定价问题,同时对影响出口产品的定价因素进行了简要的分析;解决了我国出口企业出口产品的动态优化定价的理论问题,得出了我国出口企业、政府应人长远的利益出发,建立各行业协会,避免各自为政、低价倾销的被动局面,统一和协调各行业的出口价格、出口数量及出口地区等重要结论。  相似文献   

14.
基于直接配点法的远程交会轨道优化设计与仿真   总被引:1,自引:0,他引:1  
介绍了直接配点法在空间飞行器远程轨道交会最优化问题中的应用。首先给出了空间飞行器远程轨道交会最优化控制问题模型,其中运动方程在地心惯性坐标系下建立;性能指标选为轨道交会过程中燃料消耗最小;控制变量为推力、方位角和高低角;终端状态受到位置和速度的约束。然后,采用直接配点法将最优控制问题离散化为非线性规划问题,选取各配点上的状态量和控制量作为优化参数。最后应用适合求解大型非线性规划问题的SNOPT软件包对参数最优化问题进行求解。仿真结果表明直接配点法对于空间飞行器远程交会轨道初始参数取值不敏感,具有一定的鲁棒性,且求解过程具有一定的实时性。  相似文献   

15.
针对传统空战态势威胁评估存在“状态失衡”以及难以体现决策者个体行为差异的问题, 首先针对空战过程中多时刻态势信息, 提出基于变权理论的态势权重解析方法, 并结合基于正态累积分布生成时间序列权重的算法, 解决属性参数与权值动态匹配的问题。其次, 基于混杂态势信息, 综合考虑飞行员有限理性和个体行为存在差异的特点, 提出基于模糊动态交互式多准则决策(fuzzy dynamic interactive multi-criteria decision-making, FD-TODIM)算法的混杂空战多目标威胁评估方法。最后, 进行了仿真验证和分析。仿真结果表明, 该模型可充分挖掘历史信息影响, 有效融合多个时刻混杂空战态势的混杂信息, 并根据不同飞行员个体差异, 生成具有实际意义的空战威胁态势评估结果。  相似文献   

16.
考虑资源约束和变质期的订货批量与定价的联合决策   总被引:4,自引:0,他引:4  
传统的订货计划一般假定需求事先已知.研究了需求是价格的函数、订货能力有限情形时,订货商对变质性产品协调地进行定价决策和订货决策,使得利润最大化.建立了二次规划数学模型. 提出了基于动态规划的算法,可以在多项式时间内求解原问题的最优定价策略和最优订货计划.实验结果表明,与分散决策相比,联合决策可以给订货商带来更多的利润.通过订货能力的灵敏度分析,表明订货能力变化对利润和价格产生显著影响,有助于订货商选择恰当的订货能力水平.通过变质期的灵敏度分析,揭示了变质期对订货策略影响显著.  相似文献   

17.
针对集成在线序贯极端学习机(EOS-ELM)预测精度不高和动态适应性差的问题,提出一种具有选择与补偿机制的加权集合序贯极端学习机.该加权集合序贯极端学习机在序贯学习过程中,通过对当前预测模型精度的判断决定是否进行递推更新操作,同时为提高预测模型的动态跟踪能力,在加入新样本的同时对旧样本进行剔除;然后,利用EMD对残差序列处理后进行预测,并将初始预测结果与残差预测结果相加得到最终预测模型.通过对上证指数的预测,结果表明所提方法具有更好的泛化性能,预测精度相比EOS-ELM提高了近36.1%.  相似文献   

18.
针对动态温度调控的空调系统能耗预测问题,设计了动态温度调控策略并通过EnergyPlus仿真得到空调系统逐时能耗数据集.在采用集成方法分析能耗的基础上,建立改进PSO算法优化BP神经网络(improved particle swarm optimization-back propagation neural netwo...  相似文献   

19.
动态武器目标分配问题中策略优化的改进算法   总被引:2,自引:0,他引:2  
动态武器目标分配(Weapon Target Assignment,WTA)中的目标选择策略问题可以通过建立马尔可夫决策过程(Markov decision processes,MDP)模型进行研究,但目前尚无有效求解此类较大规模的MDP问题中最优策略的算法.通过分析动态WTA问题的MDP模型特点,给出了求解该问题最优策略的改进算法.该算法主要在初始策略选取规则、策略改进规则以及最优策略的判断准则等方面进行了改进.该算法具有计算量小,节省内存,并可得到最优解等优点.最后,通过算例将该算法与传统算法进行了比较.改进算法可以用于解决较大规模的动态WTA中的策略优化问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号