首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于策略多样性熵指标的无人机群智系统激发-汇聚程度度量方法研究
引用本文:王文,汪亮,吴俊锋,陶先平,胡昊.基于策略多样性熵指标的无人机群智系统激发-汇聚程度度量方法研究[J].中国科学:信息科学,2023(4):547-564.
作者姓名:王文  汪亮  吴俊锋  陶先平  胡昊
作者单位:南京大学计算机软件新技术国家重点实验室
摘    要:新一代无人机群系统的重要特征是具有群体智能,是一类典型的群智激发汇聚系统.目前,多智能体强化学习技术展现出较强优势,是构建新一代自主智能无人机群系统的重要方法.但多智能体强化学习的训练过程尚处于“黑盒”状态,缺乏对群体智能的激发和汇聚程度的有效度量手段.针对这一问题,从多智能体强化学习中智能体的策略出发,以策略多样性度量无人机群在多智能体强化学习的训练过程中的激发-汇聚程度.为了对策略的多样性进行度量,借鉴物种多样性和信息论中的相关概念,明确了策略多样性的内涵包括丰富和均匀程度两方面,提出了“策略距离二次熵”和“动作分布信息熵”这两种策略多样性的计算方法.设计了无人机群突防场景对本文所提出的策略多样性指标和两种计算方法的有效性和有用性进行了验证,并通过敏感程度分析对两种计算方法进行了对比.实验结果表明这两种计算方法在该场景中均能有效区分策略多样性的变化,且两种计算方法间具有一致性,从而验证了策略多样性指标及其计算方法的有效性.在有用性方面,验证了策略多样性与奖赏之间的关联关系,以及环境的动态改变与策略多样性之间的相互影响和关联关系,体现了策略多样性在认知群智系统,指导群智激发汇聚过程上...

关 键 词:群智激发-汇聚度量  策略多样性  策略距离二次熵  动作分布信息熵  无人机群导航
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号