首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 729 毫秒
1.
基于POMDP模型的机器人导航控制方法   总被引:1,自引:0,他引:1  
基于部分可观测马尔可夫决策过程(POMDP)模型实现了机器人导航行为控制,给出了一种基于POMDP模型的机器人导航控制方法.该方法考虑动作的不确定性和状态的部分可观测性.首先介绍了POMDP的原理及模型;然后给出了基于POMDP模型进行导航的控制系统、对控制系统的状态空间的表示、动作空间的表示以及对声纳模型进行了比较详细的阐述,讨论了控制模型的求解过程;最后对采用POMDP模型的机器人导航控制进行了仿真实验,并对仿真结果进行了分析.  相似文献   

2.
在认知无线电(CR)技术中,无线网接入是一个极为重要的问题。针对这一问题,当前主流的解决思路包括博弈算法和基于部分可观测马尔科夫决策过程模型(POMDP)的算法。相比于博弈算法,基于POMDP模型的算法具有更好的环境适应性。在此背景下,本文提出了基于POMDP模型的快速蒙特卡罗值迭代算法(Fast MCVI)解决无线网接入问题。与其它解决POMDP模型的算法不同,该算法可解决值连续状态空间下的POMDP模型,具有更好的可靠性和稳定性。另外,相比于传统MCVI算法,快速MCVI算法使用非可支配排序遗传算法(NSGA2)进行优化,加快了算法收敛速度,使其在相同运行时间内能获得更好的决策结果。实验证明,通过值连续状态空间的POMDP模型对CR接入问题建模并使用快速MCVI算法进行决策,网络吞吐率比传统MCVI算法提高了1~1.7个百分点,比贪心算法提高了2.8~5个百分点。  相似文献   

3.
在认知无线电(CR)技术中,无线网接入是一个极为重要的问题。针对这一问题,当前主流的解决思路包括博弈算法和基于部分可观测马尔科夫决策过程模型(POMDP)的算法。相比于博弈算法,基于POMDP模型的算法具有更好的环境适应性。在此背景下,提出了基于POMDP模型的快速蒙特卡罗值迭代算法(fast MCVI)解决无线网接入问题。与其他解决POMDP模型的算法不同,该算法可解决值连续状态空间下的POMDP模型,具有更好的可靠性和稳定性。另外,相比于传统MCVI算法,快速MCVI算法使用非可支配排序遗传算法(NSGA2)进行优化,加快了算法收敛速度,使其在相同运行时间内能获得更好的决策结果。实验证明,通过值连续状态空间的POMDP模型对CR接入问题建模并使用快速MCVI算法进行决策,网络吞吐率比传统MCVI算法提高了1~1.7个百分点,比贪心算法提高了2.8~5个百分点。  相似文献   

4.
针对可伸缩视频流在无线通信中的数据包调度问题,提出了一种基于部分可观测马尔可夫决策过程(POMDP)的决策调度策略,在用户状态不确定或部分可观测条件下,采用POMDP建立了完整的最优化调度模型,以实现视频接收质量的最佳化.仿真实验结果表明,与传统的调度算法相比,该方法有效提高了视频流的平均峰值信噪比(PSNR).随着调度规模的扩大,其性能能够逐渐逼近用户状态完全确定的理想马尔可夫决策过程(MDP)模型.  相似文献   

5.
以主动雷达弹对抗为背景,研究了单平台机载电子对抗资源的调度问题。为解决导弹导引头状态观测不确定性问题,引入部分可观测马尔科夫决策过程(POMDP)理论,分析了POMDP模型的要素,建立了针对主动雷达制导导弹的干扰资源优化POMDP模型,并利用最优策略可达空间的连续近似法(SARSOP)进行求解。将电子支援措施(ESM)的观测值输出与电子干扰措施(ECM)的优化策略相结合,提出了一种基于POMDP的电子对抗资源实时调度优化算法。仿真结果表明,该方法能够实现目标状态不确定情况下的干扰资源有效调度,相比现有的调度策略,可以使导引头更多维持在搜索状态,更少停留在稳定跟踪状态。  相似文献   

6.
针对智能轮椅应用的动态环境,提出了一种自主规划和导航算法.采用分层递阶体系结构,设计了基于地图匹配的自定位方法,将路径全局预规划和在线重规划相结合,获得动态环境下导航的次优路径,并且设计了基于局部观测地图的行为控制与行为选择算法.智能轮椅样机的实验结果表明,所提出的方法在动态环境下具有较好的路径优化特性和安全性.  相似文献   

7.
我们为分布式业务系统提出了一种基于模型与预测的接入控制方法.首先,使用部分可观Markov决策过程(POMDP)来为业务系统建模.接着,将服务分配策略融入系统参数并且使用随机策略作为接入控制策略来使系统性能达到最优,优化目标是最大化系统的收益.基于POMDP模型,我们提出基于观测的策略梯度算法来求解最优策略.最后,使用基于HMM的方法来侦查和预测系统的变化,并且采用动态自适应的方法来更新系统模型机接入控制策略.实验结果显示,和尽力而为的服务策略相比较我们的最优策略获得了较好的性能.  相似文献   

8.
针对传统的智能轮椅都是依靠开发者单独设计的控制系统及软件框架,在功能模块上不同产品之间的通用性极其不好的问题,提出一种基于机器人操作系统(robot operating system,ROS)的智能轮椅导航方法.由于激光传感器在测距上准确率较高,该方案采用激光测距仪作为主要传感器,并运用基于扩展卡尔曼滤波器同时定位与地图创建方法进行建图.设计了基于ROS的导航软件系统,将其分为底层运动控制和上层导航功能模块两部分,通过Ad-hoc网络连接,以server/client的方式完成控制.配置了基于ROS的语音功能包,可完成语音自主导航等功能.通过多次实验证明,该方案能构建与实际环境一致的地图,并能成功地完成智能轮椅的语音导航任务.  相似文献   

9.
为了推理移动用户在智能空间的活动,提出了基于隐马尔科夫模型的上下文感知活动计算.首先按照上下文的定义,采用元组方法表示移动用户和智能空间,然后根据活动理论基本构成元素和面向客体活动原理来描述用户活动和智能空间的状态变化,最后引用隐马尔科夫模型建立起用户活动与智能空间状态变化之间的联系,从而实现活动计算.该模型可以完整地描述活动分解为动作的过程,还可以根据每种活动的动作链标记用户活动数据,却不需要用户直接参与数据的标记.将该模型的动作状态数与上下文感知经验采样工具(ESM)的动作状态数进行比较,结果表明该模型的平均活动识别准确度比ESM高25%.  相似文献   

10.
针对认知无线电(cognitive radio,CR)信道的动态特性,以部分可观测马尔科夫决策过程(POMDP)为模型对认知无线电网络用户的频谱感知和频谱接入过程进行研究,提出了基于POMDP模型的分布式机会频谱接入算法.该算法利用网络信道的历史频谱感知信息对主用户接入信道的状况作出估计,以认知用户吞吐量最大化为目标进行频谱接入.同时,通过贪心算法得到此优化策略的次优解,降低了最优策略的计算复杂度.论文分析了认知用户接入吞吐量与网络中信道数目以及信道状态转移概率之间的关系,将贪心算法与随机检测接入算法进行了仿真比较.仿真结果显示,该算法获得的吞吐量比随机检测接入算法提高了约25%,能够更有效地做出接入策略.  相似文献   

11.
A navigation method based on the partially observable markov decision process (POMDP) for smart wheelchairs in uncertain environments is presented in this paper. The design key factors for the navigation system of a smart wheelchair are discussed. A kinematics model of the smart wheelchair is given, and the model and principle of POMDP are introduced. In order to respond in uncertain local environments, a novel navigation methodology based on POMDP using the sensors perception and the user's joystick input is presented. The state space, the action set, the observations and the sensor fusion of the navigation method are given in detail, and the optimal policy of the POMDP model is proposed. Experimental results demonstrate the feasibility of this navigation method. Analysis is also conducted to investigate performance evaluation, advantages of the approach and potential generalization of this paper.  相似文献   

12.
基于POMDP的贪婪算法次优频谱接入   总被引:1,自引:1,他引:0  
在ad hoc网络中, 由于受硬件和能量的限制,在没有数据发送的情况下,次用户无法监控到频谱,不能执行全频谱的感知,因此,针对现有的机会频谱接入(OSA)算法大都基于信道状态具有完全知识的马尔科夫建模的情况,本文提出了基于部分可观察的马尔科夫(POMDP)的决策论方法,该方法综合考虑了机会频谱共享系统的感知和接入优化策略。由于受维数灾难的影响,本文设计了一种基于贪婪算法次优的频谱接入方法,并从理想感知和感知错误存在两方面进行仿真分析。结果表明,在POMDP模型下该方法能有效地避免主次用户之间的资源使用冲突,实现对频谱的有效利用。  相似文献   

13.
针对当前认知无线电动态频谱接入算法实现复杂度高的缺点,提出了在硬件受限制的情况下,基于部分可观察马尔科夫决策过程的动态频谱接入算法.该算法利用多次对外界信道的检测得到对外界环境的估计,然后根据此估计以当前和未来收益总和最大化为目标,实频谱接入,并实现了最优解和贪心法次优解.该算法比随机检测接入算法多获得约25%的带宽,贪心法的次优解在阶段数较少时与最优解性能非常接近.  相似文献   

14.
根据服务主导逻辑理念和价值共创理论,构建了共创用户体验、用户共创价值和行为意向的影响关系模型;并进行了结构方程模型实证研究.同时运用层次回归分析法分析了用户共创价值在共创用户体验和行为意向关系中的中介效应.研究结果表明,共创用户体验对用户共创价值具有显著的正向影响;实用价值和享乐价值均对行为意向产生了显著的正向影响,并且享乐价值的影响更为显著;用户共创价值在共创用户体验和行为意向关系中具有部分中介效应作用.  相似文献   

15.
A Workflow Authorization Model Based on Credentials   总被引:1,自引:0,他引:1  
0 IntroductionWoofrfkifcleo wau ttoypmicatailolyn ,re mpraensuefnatcstu rpirnogce sasneds imnavnoylve odth ienrsystems . The various activities in a workflowcan usually beseparatedinto well definedtasks .These tasks can be executedonly by users who were authorized.To ensure these tasks be-ing executed by authorized users ,proper authorization mecha-nisms ought to bein place.Kandala S presented a secure role-based workflow mod-els[1]based onthe well-known RBAC96 framework[2]. Theirmain contr…  相似文献   

16.
提出了一种支持用户在网上的浏览活动的语义标注方法.该方法从语义上同类型的标注信息中提取特征,通过获取标注信息以建立用户意图模型,再利用概率判断识别用户意图;语义转换后得到的信息可以和其它的或被评估的用户意图进行比较;最后利用启发式函数量化具体用户意图和信息的相似度,以达到用户在浏览语义异构网络信息空间时获取相关信息的目的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号