首页 | 本学科首页   官方微博 | 高级检索  
     

基于POMDP模型的智能雷达干扰决策方法
作者姓名:冯路为  刘松涛  徐华志
作者单位:海军大连舰艇学院信息系统系
基金项目:中国博士后基金(2015M572694,2016T90979)资助课题;
摘    要:为了有效提高复杂电磁环境下对非合作方工作模式未知的智能雷达的干扰效率和准确率,提出了一种基于部分可观测马尔可夫决策过程(partially observable Markov decision process, POMDP)的干扰决策方法。首先,根据智能雷达的工作特点构建了智能雷达对抗系统的POMDP模型,采用非参数的、基于样本的信念分布反映智能体对环境的认知,并利用贝叶斯滤波更新智能体对环境的信念。然后,以信息熵作为评估准则,令干扰机选择信息熵最大的干扰样式不断尝试。最后,通过仿真实验与传统Q-学习法和经验决策法的干扰决策性能进行比较,验证所提方法的优越性。结果表明,所提方法能够根据未知雷达状态变化动态地选择最优干扰方式,且能更快实现对智能雷达的干扰决策。

关 键 词:智能雷达  强化学习  部分可观测马尔可夫决策过程模型  贝叶斯滤波
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号