首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。  相似文献   

2.
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平稳策略。  相似文献   

3.
研究无界报酬折扣半马氏决策规划问题.证明了: 策略π·=(π1·,π2·,…πn·,π·n+1,…)是最优策略,则π1·(∞)及(π1·,π2·,…,πn·)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn·(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。  相似文献   

4.
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优平稳策略的存在性,从而一般策略类中的矩最优性等价于平稳策略类中的矩最优性。(k-1)矩最优策略π为(k)矩最优的充要条件是(-1)~(k 1)V_k(π)满足最优方程,这里V_k(π)为使用π时的总折扣报酬的k阶矩。对平稳策略,给出了折扣报酬的各阶矩的递推公式,如果每个状态可用的行动集为有限集,证明了矩最优平稳策略的存在性,并建立了构造所有矩最优平稳策略的迭代算法。  相似文献   

5.
连续时间折扣模型最优策略的结构   总被引:2,自引:0,他引:2  
本文研究了连续时间马氏决策规划折扣模型在(c)上最优策略的若干重要性质和它的结构。由于引进了映像及,使证明大为简化。特别是证明了:一随机平稳策略,它在(c)上是最优的充要条件是它可表为若干个决定性平稳最优策略的凸组合。  相似文献   

6.
讨论了无界报酬非时齐扣马氏决策模型,且哲扣因子βt依赖于前一阶段所处的状态和采取的行动,从而推广了常数折扣因子的马氏决策模型,在一定的假设下,得到了最优方程,证明了存在ε-最优马氏策略。  相似文献   

7.
本文讨论了状态空间可列、行动集为一般点集且具有多项式无界报酬率的连续时间平均马氏决策问题。在对折扣最优报酬函数的适当假设下,证明了平稳最优策略的存在性,所用的条件比以往的工作弱得多。  相似文献   

8.
本文在状态集可数、行动集任意的条件下,讨沦报酬函数满足一种推广的绝对平均相对有界的非时齐折扣马氏决策规划;建立了模型的最优方程,证明了ε(>0)最优马氏策略的存在性;最后给出最优策略(最优马氏策略)存在的必要充分条件.  相似文献   

9.
本文讨论在一般状态和行动空间下,Lippman[1]的无界报酬折扣半马氏决策规划的ε(≥0)最优平稳策略的存在性问题,最优策略的性质及这类模型的不变问题,最后给出在有限行动空间下不变问题最优策略的一种算法。  相似文献   

10.
本文讨论了离散参数马氏规划(简记为DTMDP)的最优策略存在问题,对状态空间和行动集均为可列集的模型,给出了保证平稳最优策略存在的条件。  相似文献   

11.
分析了管理主义的盛行、现代性的过度追求导致公共政策制定过程中的公共性缺失。认为要提高公共政策绩效,实现良好的社会治理,政府需要对传统公共政策制定模式进行改革。提出了政策环境中的利益相关者的互动、博弈、调适使政策网络构建成为可能以及对政策网络进行优化,构建一个合适的平台,让各利益相关者进行平等地协商、理性地说服,从而为科学、民主的公共政策制定奠定基础。  相似文献   

12.
中国省级政府数据开放政策量化研究   总被引:1,自引:0,他引:1  
苏飞  刘红 《科技促进发展》2019,15(2):127-132
本文应用政策文本量化分析方法,从政策形式和政策内容两方面对当前省级政府数据开放政策进行了研究。研究发现,我国各省数据开放工作整体进展较为缓慢,在政策制定上依然处于摸索阶段,同时各部门合作较少,对开发数据价值重视不足,建议政府成立专门机构负责数据开放工作,完善考核机制,创新与社会主体的合作形式,最大程度发挥出政府开放数据的价值。  相似文献   

13.
政策网络是为应对复杂社会环境形成的新型治理模式.政策网络不仅包括政策制定主体之间的府际关系,还包含政策之间的关联关系.将政策网络中多样化节点与关系可视化有助于了解政策的全貌,为进一步进行政策设计和修订提供依据.本文引入本体技术,结合政策网络的节点与关系特征,构建了基于本体的政策网络模型.以北大法宝国家发布的科技创新政策为数据来源,通过LDA模型实现政策主题抽取,借助Protégé实现政策网络的可视化.研究表明,基于本体构建的政策网络模型可以从政策主体、政策客体和政策主题三个维度展示政策之间的关联,不仅可以帮助政府发现创新政策制定中府际关系合作特征,还可以发现不同部门所制定的政策主题特征及关联特性,帮助识别政策冲突.  相似文献   

14.
分析了当前中国人的高购房力,认为导致高房价的原因是住房政策改革、住房信贷政策、城市发展政策、高等教育政策、就业政策,计划生育政策和社会保障政策综合作用的结果。  相似文献   

15.
20世纪80年代,美国政府将经济遏制战略的首要目标指向前苏联,同时积极调整对中国的贸易管制政策,逐步实行对华技术转让政策。前苏联对美国全球战略的挑战,是美国对华实行技术转让政策的根本原因;前苏联对美国亚洲安全的威胁,是美国实行对华技术转让政策的重要原因;中国的对美倾斜外交,是美国实行对华技术转让政策的直接原因。  相似文献   

16.
朱焰  余万林 《科技信息》2013,(23):185-186
农业保险是农业支持保护体系的重要组成部分,农业保险政策创新对农业保险的壮大会起到显著的推动作用。农业保险政策创新包括理念创新、举措创新、方法创新、功能创新、形态创新五个方面。农业保险政策创新是一个动态的过程,必须结合当地的实际情况进行调整,要建立完善的推进农业保险政策创新的决策机制,促进农业保险政策创新的循环。  相似文献   

17.
文章论述的基于策略框架的防火墙安全管理平台是一种信息模型统一的、独立于具体硬件的分布式软件平台。采用Policy工作组的策略框架实现XML统一描述和目录服务器统一存储防火墙策略,采用SNMP-Conf工作组的策略框架实现防火墙策略的翻译和配置,利用SNMPv3、LDAP4-IPsec、HTTP4-SSL达到策略的安全分发、安全访问和网页保护。并提出用策略数据的XML结构与SNMP结构相互转换来达到安全分发。  相似文献   

18.
长期以来,对高科技产业支持的财政政策,其核心在于增加对高科技产业的直接投资,使得财政对社会资本进入高科技产业的引导和放大功能难于实现。本文在分析了过去财政支持高科技发展状况及存在的问题基础上,提出我国高科技产业发展金融支持的新的财政政策设计,其核心是弱化政府的直接投资功能,政策的出发点将是为社会化风险资本的进入创造条件,同时提出了相应的对策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号