首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
传统的Q学习已被有效地应用于处理RoboCup中传球策略问题,但是它仅能简单地离散化连续的状态、动作空间。文章提出一种改进的Q学习算法,提出将神经网络应用于Q学习,系统只需学习部分状态—动作的Q值,即可进行Q学习,有效的提高收敛的速度。最后在RoboCup环境中验证这个算法,对传球成功率有所提高。  相似文献   

2.
基于知识的人工神经网络是集成学习方法领域中最主要的研究方向,它利用领域知识决定神经网络的初始拓扑结构和联接权值的设置。一方面利用领域知识加速了网络的学习,另一方面利用神经网络的鲁棒性减少了领域理论不完善和数据噪声的影响,从而较好的解决了不完善领域理论的学习问题。本文对这方面的几个主要系统KBANN、RAPTURE进行了分析和评价,指出了它们在网络拓扑结构的动态改变、深层网络的加速学习和结果网络到规则的转译等方面的弱点,并因此提出了一种有效的集成学习方法——基于解释的人工神经网络。  相似文献   

3.
模式识别在RoboCup中的应用   总被引:5,自引:0,他引:5  
在RoboCup仿真比赛中,球员的个体技术是比赛成功的重要因素,在充分分析RoboCup比赛个人技术中的两类技术,即判别函数、动作函数的确定方法的基础上,将模式识别的理论应用于RoboCup仿真比赛的个体技术中,分别使用判别域代数界面方程法确定判别函数,神经网络法确定动作函数,以射门和截球为例,详细叙述了设计过程,最后,使用传统方法和使用模式识别方法的球队在RoboCup仿真比赛中进行比赛,试验证明使用模式识别方法的球队,在比赛中个体技术显著提高。  相似文献   

4.
基于时变神经网络的迭代学习辨识算法   总被引:1,自引:1,他引:0  
为了实现在有限时间区间上可重复运行的离散时变非线性系统辨识,给出基于时变神经网络的迭代学习辨识算法.对于每一个固定时刻,以该时刻的神经网络逼近该时刻系统输入输出间的映射关系,提出了在同一时刻沿迭代轴训练网络权值的带死区迭代学习最小二乘算法,为防止收敛速度下降过快,进一步提出了协方差阵可重调的改进算法.所提算法有较快的收敛速度,且时变神经网络对非线性时变系统的辨识精度也较高.  相似文献   

5.
协同神经网络聚类型学习算法   总被引:5,自引:1,他引:5  
协同神经网络是一类全新的神经网络 ,它可以根据竞争神经网络的一般原则划分为匹配子网和竞争子网。其中 ,匹配子网的学习是协同神经网络的一个中心问题。改善匹配子网的学习效率有 2种途径 :对伴随向量求解算法的改进和原型向量选取方法的改进。文章浅析了这 2种类型的学习算法 ,着重研究了聚类算法在原型向量选取中的应用 ,并以一组交通标志图像作为识别样本 ,验证了选取原型向量 2种思路的有效性。  相似文献   

6.
无线通信技术已经应用到社会人、机、物等多种元素中,承载着包含多种隐私数据的无线信号。无线传输信道的开放性使其安全性受到了不断的挑战,无线隐蔽通信技术在实现了通信意图安全的同时保证了信息安全和通信路径安全。该文介绍了无线隐蔽通信系统的经典模型,并总结、归纳了传统方法下的隐蔽性能分析和隐蔽系统设计;介绍了利用对抗神经网络解决不同隐蔽通信场景下的干扰设计、中继功率分配和可重构智能表面设计等问题;以利用公开信号作为掩体的隐蔽通信场景为例,介绍了一种利用生成对抗网络生成有限长隐蔽信号的方案,并进一步给出应用该网络设计全双工接收机的干扰信号;探讨了神经网络方法在中继隐蔽通信、非正交多址接入(NOMA)下的隐蔽通信,瑞丽衰落下的隐蔽通信,干扰辅助的隐蔽通信场景下的应用前景以及进一步的研究方向。  相似文献   

7.
在计算机视觉领域中,大多数的视频表示方法都是有监督的,需要大量带有标签的训练视频集,但标注大量视频数据会花费极大的人力和物力.为了解决这个问题,提出了一种基于深度神经网络的无监督视频表示方法.该方法利用改进的稠密轨迹(iDT)算法提取的视频块交替地训练深度卷积神经网络和特征聚类,得到可提取视频特征的深度卷积神经网络模型;通过视频的中层语义特征,实现了无监督视频表示.该模型在HMDB 51行为识别数据库和CCV事件检测数据库上分别进行了动作识别和事件检测的实验,获得了62.6%的识别率和43.6%的检测率,证明了本文方法的有效性.  相似文献   

8.
把模糊集理论和神经网络引入模式聚类的研究 ,在无须事先知道模式集数目的条件下 ,为提高聚类精度 ,提出模糊超球神经网络结构和聚类算法 ,同时给出仿真实验的结果 ,以说明模糊集理论和神经网络在模式聚类研究中的活力 .  相似文献   

9.
在RoboCup仿真组比赛中,仿真模型引入了真实世界的很多复杂特性,使得智能体在场上执行动作时受到限制.首先分析了视觉信息特征和视觉感知噪声模型,在这个基础之上给出了一种视觉信息处理策略,即基于视觉噪声的粒子滤波定位法,最后进行了实验模拟.通过对实验数据的对比分析可以看出,这种视觉信息处理策略能够在Agent内部维护一个相对更为精确的比赛场上的全局模型.  相似文献   

10.
扩展了一个在线的优先权更新算法,即一个基于RBF神经网络的非线性不连续时间多元动态系统的识别技术,这种技术适合神经网络结构.描述了独立表示的在线算法的2个不同问题,通过建立识别问题和在适当的控制理论中揭示某些技术之间的连接,给出了一个能满足单一变量系统需要的算法.  相似文献   

11.
神经网络预测系统中的输入输出指标研究   总被引:3,自引:0,他引:3  
建立了一个用一串BP网络组成的、用于地区主要经济指标预测的人工神经网络系统,给出了该模型在两个地区应用中得出的不同结果;在分析这两种预测结果的基础上讨论了预测模型中输入输出指标变化对预测结果的影响.说明在神经网络预测模型中,输入输出指标的选择起着不可忽视的作用.  相似文献   

12.
针对目前局部回归神经网络误差函数在线计算复杂的缺陷,利用信号流图(SFG)基本理论,通过分析信号流图(SFG)和转置信号流图(ASFG),将神经网络的误差导数的信号流图(SFG)和转置信号流图(ASFG)分别级联在原始信号流图(SFG)和转置信号流图(ASFG)上,构成单输出自回归神经网络.依据因果非线性时变系统流图计算仅仅与网络拓扑结构有关的理论,推导了一种与网络结构无关的在线后向BP学习算法,较好地解决了对任意结构的局部回归神经网络的在线学习问题.仿真结果表明了本算法的有效性.  相似文献   

13.
为了加强个体机器人的动作执行力和时机选择的准确率、提高动作执行效率,本文提出了双层世界模型的决策结构.在Robocup机器人足球比赛的仿真平台上观察分析了该模型下的动作执行效果,结果表明该结构能够满足决策对实时性的要求,解决了动作实现达不到决策预想效果的问题.  相似文献   

14.
基于CMAC(cerebella model articulation controller)提出一种动态强化学习方法(dynamic cerebellamodel articulation controller-advantage learning,DCMAC-AL)。该方法利用advantage(λ)learning计算状态-动作函数,强化不同动作的值函数差异,以避免动作抖动;然后在CMAC函数拟合基础上,利用Bellman误差动态添加特征值,提高CMAC函数拟合的自适应性。同时,在RoboCup仿真平台上对多智能体防守任务(takeaway)进行建模,利用新提出的算法进行学习实验。实验结果表明,DCMAC-AL比采用CMAC的advantage(λ)learning方法有更好的学习效果。  相似文献   

15.
针对当前神经网络集成方法在提高泛化能力方面的不足,提出了神经网络动态集成技术。该技术首先对神经网络集成中的个体之间进行负相关处理提高个体的差异度,然后选择训练误差较小的个体来提高个体的精确度。最后,以广东省某市的宏观经济数据为例,证明了该技术的有效性。  相似文献   

16.
分析了利用具有多层反馈的动态回归神经网络作为控制器的可行性 ,构造了基于RNN的控制系统,并对典型的非线性化工对象连续搅拌釜反应器(CSTR)和化工过程Benchmark问题进行了实时的控制应用。结果表明,多层反馈的回归神经网络控制器具有结构简单、控制效果好的优点,特别是在对Benchmark控制中采用了多入多出的RNN控制器构造的串级控制系统,体现了RNN控制系统的强适应能力,可用于复杂动态过程的控制。  相似文献   

17.
针对已提出的很多烟雾检测方法中都是基于手工制作的特征或者使用原始图片直接作为神经网络的输入,减少了深度学习的鲁棒性。为解决这些问题,提出一种基于卷积神经网络(convolutional neural network,CNN)的烟雾检测方法。使用图片归一化方式消除光照的影响,利用烟雾颜色检测烟雾候选区域,CNN自动提取烟雾候选区域的特征,进行烟雾识别,根据分类结果得到报警信号。针对烟雾产生初期烟雾区域相对较小的问题,利用扩大候选区域的策略提高烟雾检测的及时性。由于训练数据少或不平衡引起的过度拟合,使用数据增强技术从原始数据集生成更多训练样本解决该问题。实验结果表明,该方法能有效地检测烟雾,且具有更高的准确率和更好的鲁棒性。  相似文献   

18.
基于复杂网络和机器学习的P2P用户违约预测   总被引:1,自引:0,他引:1  
互联网的发展不断冲击着各个行业,P2P行业作为2013年开始兴起的互联网金融中的重要组成部分最近一段时间由于信用违约等原因,给许多用户带来了不小的财产损失.对于P2P行业来说,对用户的信用预测及防范违约风险是事关公司利润的核心问题.本文利用用户手机通讯录之间的包含关系构建社交网络,并从复杂网络的视角加以分析.通过将分析结果转化为机器学习的输入特征,我们用支持向量机的方法挖掘其内在的关联,从而利用用户的社会网络结构性质预测其信用情况.我们的模型基于知名互联网金融公司闪银所提供的大规模脱敏数据,得到了很好的预测效果.  相似文献   

19.
本文论述了近年来受到普遍关注的模糊神经网络技术的优点,详细叙述了模糊神经网络的融合方式及其特点,并且介绍了两种典型的算法结构和具体的实现过程,最后指出了研究中有待解决的问题.  相似文献   

20.
强化学习是通过对环境的反复试探建立起从环境状态到行为动作的映射。利用人工神经网络的反馈进行权值的调整,再与高学习效率的并行强化学习算法相结合,提出了基于人工神经网络的并行强化学习的应用方法,并通过实验仿真验证了迭代过程的收敛性和该方法的可行性,从而有效地完成了路径学习。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号