首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
传统酒店动态定价研究大多考虑改进需求预测方法或考虑需求环境已知,而现实生活中需求分布通常是未知的.本文考虑需求分布未知的情境,建立基于马尔可夫决策过程的酒店客房多周期动态定价模型,并利用强化学习方法,提出基于SARSA(λ)的改进算法对客房动态定价模型进行求解.为提升算法的求解能力和收敛速度,提出了基于改进ε-greedy策略的ε-SARSA(λ)算法和基于改进模拟退火策略的ISA-SARSA(λ)算法.通过数值实验对比SARSA(λ), ε-SARSA(λ), SA-SARSA(λ)和ISA-SARSA(λ)四种算法的收益优化结果,验证了改进算法的有效性,结果显示, ISA-SARSA(λ)算法求解性能最好.  相似文献   

2.
考虑消费者购买行为,建立生鲜食品多阶段动态定价模型,力图使零售价格能够动态地反映生鲜食品的价值波动,采用基于正负反馈机制的改进蚁群算法求解模型。通过不同算例仿真分析,表明该模型优于传统模型;同时将本文算法与其他3种算法进行对比,从收敛性能和运行时间方面证实本文算法更优。  相似文献   

3.
将MAIDs在时间上进行扩展,提出一种新决策模型——多Agent动态影响图(MADIDs),对动态环境中的协作关系进行建模;给出MADIDs的一种分层分解的分布近似方法,进而通过将决策结点和效用结点的推理引入到BK算法中,给出MADIDs环境模型的一种扩展BK(EBK)近似推理算法;引入一种BP神经网络学习MADIDs的局部效用函数。最后,针对一个表示协作关系的MADID模型,进行算法比较和仿真实验,实验结果显示了MADIDs模型的有效性。  相似文献   

4.
基于信息素异步更新的蚁群算法   总被引:3,自引:0,他引:3  
针对基本蚁群算法中蚂蚁速度无限且信息素同步更新的假定前提,提出一种基于信息素异步更新的改进蚁群算法。该算法以蚂蚁的速度有限为前提,采用异步更新规则来调整各个蚂蚁的信息素浓度,从而间接改变蚂蚁间合作方式。该算法更忠实于实际蚁群的寻路过程,算法具有更好的全局搜索能力。基于旅行商问题的实验验证了算法的有效性、鲁棒性及解的多样性。  相似文献   

5.
针对一类考虑了投资者微观结构随机变迁、投资者行为存在羊群效应以及非理性情绪的高维行为资产价格模型,推导出行为期权定价偏微分方程,构建了基于深度学习算法的行为期权定价方法:首先,基于费曼卡兹公式推导出行为期权价格的迭代方程;然后,用神经网络来逼近迭代方程中的期权价格关于标的模型空间变量的梯度函数;最后,通过深度神经网络参...  相似文献   

6.
电子商务中竞争环境下的耐用品动态定价模型   总被引:2,自引:1,他引:2  
郭哲  汪定伟  吴俊新 《系统仿真学报》2006,18(11):3046-3049,3054
电子商务竞争环境下,耐用品的动态定价中考虑成本和顾客期望,采用多个周期两阶段定价的方法,两个阶段分别选取成本加成和顾客期望定价模型,并组合在一起形成一个周期的定价策略。以电子商务运营商的在线销售利润和销售额为算法的性能衡量指标,采用PSO算法,寻找最优降价时间和两阶段的最优价格。实验结果证实该方法在收敛速度上和计算效率上是可行的,性能也优于多周期只考虑成本的单阶段定价方法。  相似文献   

7.
一种具有动态最优学习率的BP算法   总被引:5,自引:2,他引:3  
提出具有动态最优学习率的BP算法,动态最优学习率是通过迭代的方式得到的,这种算法具有运算简单,收敛速度快,精度高特点。仿真结果说明此算法是有效的。  相似文献   

8.
复杂的链式规则求导计算是动态神经网络在线学习算法中梯度向量计算的主要瓶颈,针时这一问题,根据P.Campolucci等人提出的动态系统梯度信息信号流图分析方法,设计了动态神经网络的在线学习算法,该算法可以直接从网络的信号流图及其伴随流图中获取目标函数关于网络参数的梯度信息,从而简化了算法梯度向量的计算.为了确保算法的稳定,根据Lyapunov稳定性定理,提出并证明了可以保证算法收敛的自适应学习速率,并且学习速率容易获得.利用NARX神经网络对非线性动态系统在线辨识的仿真实例也表明了本算法的有效性.  相似文献   

9.
经典的资产定价理论认为,不完全市场中存在多个 定价核,导致期权存在多个可能的理论价格,与现实中期权只有一个价格不符. 考虑到期权定价时投影定价核具有与原始定价核 完全相同的意义,并且投影定价核的信息隐含于相关历史信息中,动态的经验定价核隐含了投资者风险偏好的时变性,本文建立了一种基于动态经验投影定价核的期权定价方法. 通过对Rosenberg-Engle的经验定价核的动态性和标的资产未来收益率估计方法进行扩展,本文还给出了动态投影经验定价核的估计方法. 这种方法能适用于单只期权单只标的资产、多只期权单只标的资产和若干只期权单只标的资产等情形. 本文基于此方法为沪深交易所的部分具有欧式性质的权证进行了实证研究,结果表明:考虑了投资者时变偏好的动态经验投影定价核期权定价方法的定价效果远好于 Black-Scholes-Merton 和常弹性方差(CEV)期权定价模型.  相似文献   

10.
运用微观经济学、博弈论及动态规划等有关理论,探讨了在国内外企业处于完全信息(即确定性)且同时决策的假设条件下,面对国内政府的反倾销及行政复议,国外企业为实现其在国内市场上所获取的利润贴现值的总和达到最大化的动态定价问题,同时对影响出口产品的定价因素进行了简要的分析;解决了我国出口企业出口产品的动态优化定价的理论问题,得出了我国出口企业、政府应人长远的利益出发,建立各行业协会,避免各自为政、低价倾销的被动局面,统一和协调各行业的出口价格、出口数量及出口地区等重要结论。  相似文献   

11.
认知无线电和动态频谱分配技术是解决频谱资源短缺问题的有效手段。随着近年来深度学习和强化学习等机器学习技术迅速发展, 以多智能体强化学习为代表的群体智能技术不断取得突破, 使得分布式智能动态频谱分配成为可能。本文详细梳理了强化学习和多智能体强化学习领域关键研究成果, 以及基于多智能体强化学习的动态频谱分配过程建模方法与算法研究。并将现有算法归结为独立Q-学习、合作Q-学习、联合Q-学习和多智能体行动器-评判器算法4种, 分析了这些方法的优点与不足, 总结并给出了基于多智能体强化学习的动态频谱分配方法的关键问题与解决思路。  相似文献   

12.
在股票价格中引入漂移率、波动率和随机跳跃三种状态, 建立动态状态空间模型, 并通过局部风险中性定价关系(RNVR)推导无套利定价模型. 以非高斯条件ARMA-NGARCH为基准模型, 构建S&P500指数的离散动态Lévy过程, 并基于序贯贝叶斯的参数学习方法, 进行模型估计和期权定价研究. 结果表明: 动态Lévy过程能够联合刻画时变漂移率、条件波动率和无穷活动率等特征, 且贝叶斯方法的引入提高了期权隐含波动率的定价精度. 同时, 无穷活动率模型在期权定价方面具有显著优势. 在五类滤波中, 无损粒子滤波估计精度最高, 速降调和稳态过程(RDTS)的期权定价误差最小, 而非高斯模型在收益率预测方面没有表现出显著的差异.  相似文献   

13.
For multi-agent reinforcement learning in Markov games, knowledge extraction and sharing are key research problems. State list extracting means to calculate the optimal shared state path from state trajectories with cycles. A state list extracting algorithm checks cyclic state lists of a current state in the state trajectory, condensing the optimal action set of the current state. By reinforcing the optimal action selected, the action policy of cyclic states is optimized gradually. The state list extracting is repeatedly learned and used as the experience knowledge which is shared by teams. Agents speed up the rate of convergence by experience sharing. Competition games of preys and predators are used for the experiments. The results of experiments prove that the proposed algorithms overcome the lack of experience in the initial stage, speed up learning and improve the performance.  相似文献   

14.
实体店及其网上商店产品的动态定价及订货策略   总被引:4,自引:0,他引:4  
以实体店和网上商店两种销售模式通常共用一个订货渠道来满足顾客的不同需求为背景,分析了拥有实体店和网上商店公司的最优订货策略、最优的价格调整次数问题,并推导出了不同时期的最优定价策略.然后,利用数值算例分析了价格调整次数未知与已知两种情况下的最优决策.最后,指出了未来可能的几个研究方向.  相似文献   

15.
研究了一种基于智能体动作预测的多智能体强化学习算法. 在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联合状态和联合动作.基于此,提出使用概率神经网络来预测其他智能体动作的方法,从而构成多智能体联合动作,实现了多智能体强化学习算法. 此外,研究了该方法在足球机器人协作策略学习中的应用,使多机器人系统能够通过与环境的交互学习来掌握行为策略,从而实现多机器人的分工和协作.  相似文献   

16.
竞争环境下季节性产品网上直销动态定价模型   总被引:1,自引:0,他引:1  
以同一大型网站中提供同一季节性产品的两个厂商为对象,研究竞争环境下厂商的动态定价策略.模型中,厂商通过网上渠道直接将产品销售给顾客,并通过动态定价最大化自身的收益,同时还要考虑顾客退货对动态价格体系的影响.通过建立的模型,探讨了收益函数的相关性质,并分析了厂商在销售期初和期末的价格均衡.研究表明:两厂商均会在销售期初和期末采用最低价.最后应用算例分析展现了模型的实际应用过程.  相似文献   

17.
设计了一种动态模糊系统模型,该模型能够动态地进行规则自学习,从而减少了规则学习的计算量。提出优化该模型的双重遗传算法:外层采用整数编码,用来训练系统的结构,内层采用实数编码,用来训练系统的参数;内层GA得到的最佳染色体适应值用来评价外层GA相应染色体。该模型结构简单,便于实现,并可离线优化,在线预测。通过应用于实际股市行情的预测和效率分析,不论从预测的结果还是从运行效率看,都收到了满意的效果。  相似文献   

18.
在线零售商能够方便地提供历史价格和未来价格预期以供消费者参考,但这种为消费者提供的便利同时给零售商的动 态定价带来困难,聪明的消费者会根据未来产品的价格以及历史参考价格做出购买与否的判断,给零售商的利润带来很大的 影响. 论文将消费者的策略性行为和参考价格效应结合,准确地描述消费者在历史和预期价格影响下零售商的动态定价策略,建立了多阶段动态定价策略模型,并针对两阶段简化为正常价和清仓价的模型,给出两种不同的价格策略以及实施的前提条件,讨论了两阶段最优价格和期望最大利润跟消费者效用折扣因子、策略性消费者所占比例、消费者对历史价格的依赖程度的关系,结论表明忽视消费者策略行为以及价格参考效应会给零售商带来较大的负面影响.  相似文献   

19.
研究了一个同时考虑商品采购数量和动态定价的季节性商品销售策略问题.顾客可以通过网络订购 和现场购买两种方式购买该商品,且网络订购商品由销售商免费派送.两种方式下的商品需求量都是关于商品价格 和购买时间的函数,而网络顾客在收到商品之前, 会以一定的概率取消订单.销售商在销售期内, 需要通过动态调整 价格的策略来刺激消费者购买商品,以保证在销售季节内完成商品销售任务并提高销售商收益.提出了一个可以同时确定最佳采购数量和最优商品动态定价策略的数学模型,优化的目标是最大化销售商的收益, 并给出该模型的求解 算法.最后的算例表明, 模型和算法是有效的, 且相对静态价格策略,动态价格策略能为销售商带来更多的收益.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号