首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 359 毫秒
1.
在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解。然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机。在多agents系统中,由于agents之间的协作使该问题更加复杂。为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理。同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性.  相似文献   

2.
基于多步回溯Q(λ)学习算法的多目标最优潮流计算   总被引:1,自引:1,他引:1  
为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励,通过不断的试错、回溯、迭代来动态寻找最优的动作.将该算法在多个IEEE标准算例中与其他算法进行比较,取得了良好的效果,验证了多步Q(λ)学习算法在处理多目标最优潮流问题时的可行性和有效性.  相似文献   

3.
数据分类是数据挖掘的主要内容之一,通过分析训练数据样本,产生关于类别的精确描述.贝叶斯分类是数据挖掘领域中一种常用的有效分类方法.在关系学习中,贝叶斯分类算法有很多种,对这些算法进行总结、比较,指出其优点与不足,对提高分类效率有很大帮助.本文对已有的关系学习中贝叶斯分类算法作了详细的比较,并进行归纳总结.在单关系学习中重点介绍了几种基于粗糙集的贝叶斯分类器和加权贝叶斯分类算法,并分析了各种方法的模型、权值确定方法、优缺点及进一步工作方向.在多关系学习中主要比较了几种基于语义关系图的贝叶斯分类算法,重点介绍了MI-MRNBC模型.最后对本文工作进行了总结与展望,提出进一步工作方向是研究基于粗糙集的多关系贝叶斯分类算法.  相似文献   

4.
针对基于模拟退火的贝叶斯网络结构学习算法由于模型扰动方式遍历模型空间的能力不足,往往不能获得全局最优网络结构的问题,将K2算法与模拟退火算法相结合,提出了一种改进的贝叶斯网络结构学习算法.算法通过随机交换当前节点序中2个节点的位置以产生新的节点序,再利用K2算法学习获得贝叶斯网络结构,作为模拟退火算法中的新状态,以达到提高模型全局扰动能力的目的.算法记录了在模拟退火过程中遇到过的最优网络结构,并在模拟退火过程结束后再利用爬山法对其作进一步优化.对Asia网的仿真学习结果表明:在样本量较为充足的情况下,所提算法能够获得近似全局最优的网络结构,具有较好的学习效果,但算法的效率略显不足.  相似文献   

5.
条件偏好网(Conditional Preference networks,CP-nets)是描述属性间条件偏好的图模型,多值无环CP-nets学习是重要的研究方向之一.区别于传统的CP-nets学习方法,提出基于贝叶斯方法和遗传算法的多值无环CP-nets学习.在偏好处理上以多值属性的完整偏序关系作为条件偏好,进行相关性关系判定.随后,基于贝叶斯方法,以单一父属性推出多父属性下的相关性关系,进行CP-nets结构学习.采用遗传算法在CP-nets结构搜索空间中进行搜索,求解最优结构.通过Delink算法进行去环,完成无环CP-nets学习.在寿司数据集上验证算法的有效性,实验结果表明,基于贝叶斯-遗传算法的CP-nets学习算法能够在有限时间内学习得到局部最优无环CP-nets.  相似文献   

6.
介绍了一种基于Dignet ANN无监督学习聚类算法和自适应模糊控制算法的智能火灾探测算法模型.详细阐述了算法模型的思想和实现,给出了环境模式阈值自适应的方法和简单的多类型火灾探测器探测数据融合的方法,较好地解决了环境阈值的自适应问题.在实验室条件下利用欧洲标准火对算法进行了检测,结果表明该智能算法可以有效地对火灾进行探测.  相似文献   

7.
针对目前高速铁路列控车载设备故障诊断过度依赖于专家经验且诊断正确率不高等问题,提出了以专家知识为基础,以贝叶斯网络为核心的故障诊断方法.首先,以CTCS3-300T型列车运行控制系统的车载设备为研究对象,建立基于专家知识的贝叶斯网络.其次,根据故障记录数据集使用K2算法进行结构学习并对学习后的贝叶斯网络结构做适当简约处理.利用极大似然估计算法进行参数学习,得到故障诊断的最优贝叶斯网络.最后,通过诊断推理,得到该故障诊断模型的诊断正确率为88.20%,验证了该贝叶斯网络模型的可行性和有效性.  相似文献   

8.
针对传统贝叶斯优化算法进化效率低及收敛速度慢的情况,提出一种新型混合贝叶斯优化算法.该算法利用适应度遗传及个体的局部搜索方法,使种群个体趋向于全局最优解,提高了进化效率.为提高贝叶斯优化算法中贝叶斯网络结构学习的效率,提出一种爬山法和模式蚁群算法相结合的网络结构学习方法,同时对新型贝叶斯优化算法的收敛性进行了分析.利用典型的函数对提出的新型混合贝叶斯优化算法进行了仿真分析,证明了所提出的方法可以有效地加快算法的收敛速度和收敛精度.将该算法应用于目标分配问题中,仿真证明了所提算法的有效性和优越性.  相似文献   

9.
基于多传感器信息融合理论的交互式多模型算法   总被引:1,自引:0,他引:1  
在经典的交互式多模型算法中,对似然函数的高斯近似以及概率密度函数与概率质量函数的混合计算使得所求得的模型概率仅为贝叶斯意义下的次优值.为解决此问题,基于各滤波器估计误差的相关性和多传感器最优信息融合准则,提出了一种重新加权的交互式多模型算法.该算法通过计算估计误差的互协方差阵对模型概率进行更新,在此基础上利用最优信息融合理论对各滤波器的滤波结果进行融合.理论分析及仿真结果表明:经过重新加权的交互式多模型算法较原始算法以及其他忽略误差相关性的交互式多模型的改进算法在估计精度上均有显著的提高.  相似文献   

10.
贝叶斯网络是人工智能领域研究不确定环境下知识表示和因果推理的有效工具之一,迄今为止已经提出了许多贝叶斯网络结构学习算法.MMHC算法是一种较新的贝叶斯网络结构学习算法,该算法的评分搜索阶段应用了贪婪搜索算法,但该算法容易陷入局部最优而无法得到全局最优网络,针对该缺点,在MMHC算法的评分搜索阶段应用模拟退火、随机重启爬山搜索、禁忌搜索3种搜索策略取代贪婪搜索,详尽的实验结果表明在MMHC算法中这3种搜索算法的效果普遍优于贪婪搜索,其中模拟退火搜索学习效果最好,MMHC算法的评分搜索阶段可以用模拟退火搜索替代贪婪搜索达到提升算法的学习效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号