基于双重竞争策略的学习自动机算法 |
| |
引用本文: | 狄冲,齐开悦,吴越,苏宇,李生红.基于双重竞争策略的学习自动机算法[J].上海交通大学学报,2018(10). |
| |
作者姓名: | 狄冲 齐开悦 吴越 苏宇 李生红 |
| |
作者单位: | 上海交通大学网络空间安全学院;上海交通大学电子信息与电气工程学院 |
| |
摘 要: | 学习自动机是增强学习理论体系中的重要组成部分,在应用数学的随机函数优化、信息安全的异常检测等理论和实际问题中发挥着重要作用.估计器算法是目前学习自动机中最为主流的一类算法,具有最高的算法性能.但是,由于估计器本身的局限性导致在学习初期估计值不准确,行为选择概率向量无法一直保持最优更新,且概率向量的更新完全依赖于固定步长,一次错误的更新需要大量额外的迭代来对其进行弥补,算法的收敛效率仍存在提升空间.针对上述问题,通过改进估计器算法的概率向量更新策略,提出一种基于双重竞争策略的学习自动机算法,并对其ε-收敛特性进行数学证明.实验结果显示,该算法提高了学习自动机的收敛效率,从而验证并确立了所提策略的有效性和算法的优越性.
|
本文献已被 CNKI 等数据库收录! |
|