首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于智能体 (Agent)系统强化学习原理和基于动态规划的Q -学习算法的基础上 ,提出了一种新的Agent强化学习算法 .该算法在Agent学习过程中不断调整Agent知识库的加权值 ,在强化学习的每个阶段 ,通过选取合适的信度分配函数来修正Agent强化学习动作的选取策略 .与标准的Q -学习方法相比 ,具有更加合理的物理结构 ,并且能保证算法收敛 .仿真实验说明该方法加快了标准Q -学习算法的收敛速度 ,具有较好的学习性能  相似文献   

2.
流形学习算法是维度约简与数据可视化领域的重要工具,提高算法的效率与健壮性对其实际应用有积极意义.经典的流形学习算法普遍的对噪音点较为敏感,现有的改进算法尚存在不足.本文提出一种基于监督学习与核函数的健壮流形学习算法,把核方法与监督学习引入降维过程,利用已知标签数据信息与核函数特性,使得同类样本变得紧密,不同类样本变成分...  相似文献   

3.
基于云模型的自学习进化算法   总被引:4,自引:0,他引:4  
结合进化论和遗传理论的最新进展,提出基于学习算子的自学习进化算法;并将正态云模型引入进化过程中,提出云学习算子和基于云学习算子的自学习进化算法.最后的仿真实验表明,该算法具有精度高、收敛速度快等优点,能在很大程度上解决了现存进化算法的低效问题.  相似文献   

4.
对在动态学习的环境中的IGA算法做了研究,改进了梯度方向上的步长恒定不变的不足,引入了变学习率,并介绍了调节学习率的方法——WoLF原则,加速其收敛。最后根据该方法,对Q学习算法做了改进,并通过仿真试验证明了算法的有效性。  相似文献   

5.
为了克服CMAC(Cerebellar Model Articulation Controller)算法收敛不稳定问题,该文提出了一种提高CMAC神经网络收敛性的改进算法.首先将收敛条件扩展到一般情况,得出了当量化区间内训练样本均匀分布且学习速率不恒为1时,得到CMAC收敛的频域条件,分析并证明了学习速率对收敛范围的影响,并以此为基础提出改进算法.改进前后的算法进行对比仿真,结果表明改进算法能大大提高CMAC收敛过程的稳定性.改进算法用于克服CMAC的收敛不稳定性问题是可行的、有效的.  相似文献   

6.
对多Agent系统的Q值强化学习算法进行研究,将历史信息因素的影响添加到Q值学习中,提出了一个新的基于多Agent系统的Q值学习算法.该算法在保证多Agent系统利益达到相对最大化的同时,也有效降低了Agent之间的冲突率.最后,通过仿真测试验证了该算法的有效性.  相似文献   

7.
前馈神经网络中BP算法的一种改进   总被引:8,自引:0,他引:8  
在传统的BP算法基础上,提出了一种改进的BP学习算法,先加入描述网络复杂性的量,使算法能够考虑到网络的连接复杂性,进而有可能删除掉冗余的连接甚至节点;接着提出对网络的学习步长的动态调整,以此来尽量避免传统学习中的学习速度过慢和反复震荡;然后给出新的算法是高阶非线性收敛的证明;最后通过实验说明的新的BP算法在一定程度上可减少网络的复杂性,有着比传统算法更快的收敛速度。  相似文献   

8.
与主量分析密切相关的Hebbian算法大都局限于线性模型精确输入恢复前提,本文考察了一类非线性的竞争性Hebbian学习,提出了一个确切的基于纯竞争机制的优化算法,仿真实验表明,该算法较之于现有的算法更为快速、有效。  相似文献   

9.
随着工程技术要求的提高,许多实际优化问题从低维问题发展成高维的大规模优化问题,自然计算算法在面对该类问题时容易陷入局部最优,而协同粒子群算法是解决大规模优化问题的重要手段之一。本文将子种群划分自学习策略和惯性权重自适应策略引入到协同粒子群算法中,增强了算法的自学习能力,提高了算法的全局寻优能力。实验结果表明,所提算法的性能超过了传统协同粒子群等算法,具有求解大规模问题的较大潜力。  相似文献   

10.
基于强化学习,设计了一个面向三维第一人称射击游戏(DOOM)的智能体,该智能体可在游戏环境下移动、射击敌人、收集物品等.本文算法结合深度学习的目标识别算法Faster RCNN与Deep Q-Networks(DQN)算法,可将DQN算法的搜索空间大大减小,从而极大提升本文算法的训练效率.在虚拟游戏平台(ViZDoom)的两个场景下(Defend_the_center和Health_gathering)进行实验,将本文算法与最新的三维射击游戏智能体算法进行比较,结果表明本文算法可以用更少的迭代次数实现更优的训练结果.  相似文献   

11.
论革除恶性竞争性学习、建立合作学习的重要性   总被引:1,自引:0,他引:1  
文章分析了恶性竞争学习存在的原因,指出恶性竞争学习给学习者和社会带来的危害和不良后果,阐述了以合作学习取代恶性竞争性学习是构建和谐社会、学习型社会的迫切需要,是素质教育、人才培养的必由之路.介绍了合作学习的理念和特点.  相似文献   

12.
由于多年来我国英语教学的低效率和社会对外语的过分重视,使得英语学习速成论受到众多的英语学习者的青昧。然而,成功的英语学习者的经历证明,学习英语是没有捷径的,英语学习能速成的说法是不符合学习者的认知规律的。只有在英语学习的认知过程得以完成的情况下,英语学习才能真正成功,而英语学习的效率则可以通过调控学习策略来提高。  相似文献   

13.
Letter-to-Sound conversion is one of the fundamental issues in text-to-speech synthesis. In this paper, we address an approach to automatic prediction of word pronunciation. This approach combines example-based learning and dynamic-programming searching to predict sub-word pronunciation. Word pronunciation is formed by concatenating sub-word pronunciations. We conducted comparative experiments over a large-scale English dictionary. Experimental results show that this approach can achieve accuracy of 70.1%, which outperforms those published results.  相似文献   

14.
计算机支持的协作学习设计模式   总被引:2,自引:0,他引:2  
童春  杨贯中 《科学技术与工程》2007,7(14):3483-34883507
提出了代表协作学习构造最佳实践的协作学习设计模式(CLDP),建立软件开发人员与协作学习专家之间的概念共同点,探讨了用教育建模语言IMSLD对它们进行形式化的方法,使之可被软件系统处理。最后讨论了基于CLDP的学习设计创作工具的设计开发,帮助教师根据特定学习场景的需求,通过重用和定制模式,创建有效的协作学习设计。  相似文献   

15.
西方学习型组织理论是马克思主义学习型政党概念的思想渊源。科学理论武装、具有世界眼光、善于把握规律、富有创新精神是马克思主义学习型政党概念的涵义。马克思主义学习型政党概念具有未然性、复合性和整体性。  相似文献   

16.
以布鲁纳的知识结构组织理论和发现学习理论、罗杰斯的非指导学习理论、约翰逊的合作学习模式等现代教育理念为依据,结合大学生的认知特点,构建了以提高学生的元认知能力为特色的计算机创新实验平台,通过调查表明该创新实验平台不但有利于学生提高理论和实践水平,而且学生的元认知能力也有了较大的提高.  相似文献   

17.
为了提高鉴别式学习策略训练的贝叶斯网络分类器的分类精度,分析了贝叶斯网络结构与数据中变量分布之间的差异对贝叶斯网络分类器性能的影响,实验以网络结构的实际联合概率分布的树型近似描述为基准,删除在条件对数似然函数极大化过程中不起作用的边,生成具有同一联合概率分布的不同描述程度的网络结构.实验结果表明,只有当网络结构表现力不足时,鉴别式参数学习才能起积极作用;而当网络结构中有多余的边时,反而容易受其制约.从而验证了网络中多余的边对分类器性能没有影响的观点是片面的.  相似文献   

18.
采取自编问卷,对高中生化学学习动机的影响归因展开调查,对调查结果按内部学习动机和外部学习动机分类分析,结果表明内部学习动机对高中生的影响较大,而外部学习动机的作用学生看法分歧较大,同时教师的教学艺术和师生关系以及教材、考试的难易等也对学生的学习动机产生一定影响.提出了相应的建议,为改进化学教学提供了指导.  相似文献   

19.
现代信息技术的发展,给我国教育带来了深刻的变革; 资源共享、知识的公共性带来了教育的开放,教育的开放又必然导致学习理念的变更; 建构主义教学理论指导下的教育信息化正在引领社会进入开放的学习型社会,建构主义的学习理论对于开放教育环境下个人自主的信息化学习(E-learning)有着重要的促进作用.  相似文献   

20.
对于数据流的处理,多任务多核学习已逐渐成为在线学习算法研究的热点,它在一定程度上可提高数据流预测的准确性。多核方法尽可能使用最少的核函数得到最好的实验效果,当数据量增大、训练模型稳定时,通过阈值限定的方法对核函数进行遗忘,从而减少基本核函数的使用个数,使得计算更加简单;对于算法的优化,通过引入一个遗忘变量,从对偶的角度来进一步优化权重更新过程,这里的权重指多个任务的共有特征权重和每个任务间的特有权重,以提高算法的收敛速度。实验部分对核函数的选取进行了较为详细的分析,通过对UCI数据集和实际的机场客流量数据集进行分析,证明该本算法的合理性和高效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号