期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	30篇
免费	0篇

专业分类

系统科学	10篇
综合类	20篇

出版年

2013年	1篇
2012年	2篇
2009年	2篇
2008年	2篇
2007年	1篇
2006年	2篇
2005年	4篇
2004年	3篇
2003年	4篇
2001年	2篇
2000年	3篇
1998年	1篇
1997年	1篇
1996年	1篇
1993年	1篇

排序方式： 共有30条查询结果，搜索用时 15 毫秒

1 [2] [3] 下一页 » 末页»

基于POMDP模型的机器人行动的仿真优化

马军殷保群《系统仿真学报》2008,20(21):5903-5906

策略梯度优化算法是一种很重要的强化学习算法,对实现机器人的自主导航有着重要的应用价值.在部分可观Markov决策过程(POMDP)的基础上,实现了两个有限记忆的策略梯度优化算法:基于模型的GAMP算法和无模型的IState-GPOMDP算法,并利用该算法对机器人走迷宫的问题进行了仿真.通过分析仿真结果,对这两种算法引入了基于观测的优化;并发现在所给报酬函数下,策略梯度算法中的步长参数也在一定程度上影响着优化策略的效率. 相似文献

一类闭排队网络引入遗忘因子的优化算法研究 总被引：1，自引：0，他引：1

周亚平殷保群奚宏生唐昊《系统仿真学报》2003,15(3):386-388,392

在闭排队网络服务策略的优化中，基于对系统一条样本轨道的仿真进行策略优化是一种很有实用意义的方法，但在具体优化过程中，过多的仿真次数是影响寻优速度的重要因素。该论文提出了一种引入遗忘因子，利用参数取旧值时的仿真中所获得的信息进行优化的方法，使寻优速度有显著提高。相似文献

隐马氏模型中的标量估计

陈波周亚平殷保群奚宏生《系统工程与电子技术》2005,27(6):1083-1086

通过测度变换的方法构造一个概率空间,利用观测变量在该构造空间中独立的性质,研究了一类在实际中应用广泛的隐马尔可夫模型———零延迟隐马尔可夫模型;然后通过测度的逆变换,将构造空间中得到的结果返回到实际的空间中来,克服了通过半鞅的方法得到标量估计的困难。最后给出了零延迟隐马尔可夫模型中标量估计的一般公式,并且应用该公式给出了状态、跳跃次数、状态到达次数等标量估计,以阐明该方法的应用。相似文献

Markov控制过程基于神经元动态规划的优化算法

唐昊奚宏生殷保群《中国科学技术大学学报》2001,31(5):549-557

论文在Markov性能势理论基础上,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法,分析了它们在一个无限长的样本轨道上概率1的收敛性,并给出了一个三－状态受控Markov过程的数值实例。相似文献

一种新型BitTorrent-like网络系统动力学模型(英文)

张海鹏殷保群陆效农《中国科学技术大学学报》2012,42(10):854-860

针对BitTorrent-like文件共享系统,提出了一个新型动力学模型.新的动力学模型从微观的角度描述了P2P文件共享系统特性,通过采用新的状态去描述系统节点间的交互演化过程.通过该模型,研究了影响系统的诸多因素,主要通过策略因素的形式来体现,其中包括节点选择策略、文件片选择策略、带宽分配策略和节点阻塞策略.最后,通过实验验证模型的正确性. 相似文献

一类连续时间Markov链的灵敏度分析和性能优化

李衍杰殷保群奚宏生代桂平《中国科学技术大学学报》2004,34(6):704-709

从连续时间Markov链(CTMC)性能势的角度,借助于定义的折扣Poisson方程,给出了CTMC基于性能势的灵敏度公式及折扣代价准则(简称折扣准则)下的最优性方程.此外,建立了在折扣准则与无穷时间平均代价准则(简称平均准则)下灵敏度公式及最优性方程之间的联系. 相似文献

基于POMDP的VOD接入控制建模与仿真

芦珊黄静殷保群《中国科学技术大学学报》2009,39(9)

为分布式视频点播(video on demand,VOD)接入控制建立了基于POMDP(部分可观Markov决策过程)的数学模型,应用策略梯度优化算法仿真求解模型的最优策略.仿真结果表明,基于POMDP模型的仿真有效地缩短了仿真时间;与传统分布式系统的接入控制方法相比,更合理地利用了系统的资源,可以给运营商带来更大的效益. 相似文献

非线性采样观测器的误差分析

金辉宇殷保群唐波《中国科学技术大学学报》2008,38(10)

通过分析非线性系统采样观测器的误差,给出了观测器误差一致最终有界的条件,估算了误差的最终边界.分析结果表明,采样周期固定时,选择精度更高的数值方法可以减小观测器的误差. 相似文献

M/G/1排队系统的性能灵敏度估计与仿真 总被引：4，自引：2，他引：2

代桂平殷保群周亚平奚宏生《系统仿真学报》2003,15(7):950-952

对具有一般分布的排队系统-M／G／l排队系统给出了一种通过其嵌入Markov链来计算系统势能及性能导数的仿真算法。由于该算法基于分析系统的一条单一样本轨道，故可直接用于系统的控制与优化。最后提供一个数值例子来表明该算法的应用。相似文献

10.

基于POMDP的流媒体网络数据调度建模与仿真 总被引：1，自引：0，他引：1

汪耒林福寿殷保群《中国科学技术大学学报》2013,43(4):295-299,339

针对P2P流媒体网络的数据调度问题,提出了一种新的调度算法,即将节点的数据请求作为随机事件,运用基于事件的方法,对P2P流媒体网络的数据调度问题,建立基于部分可观Markov决策过程(POMDP)的数学模型,并运用梯度算法仿真求解模型的最优策略.仿真结果表明了所提方法的有效性. 相似文献

1 [2] [3] 下一页 » 末页»