排序方式: 共有28条查询结果,搜索用时 15 毫秒
21.
22.
Q-learning作为一种无模型的值迭代强化学习算法,被广泛应用于移动机器人在非结构环境下的导航任务中。针对Q-learning在移动机器人导航中环境探索和利用存在矛盾关系导致收敛速度慢的问题,该文在Q-learning算法的基础上,受啮齿类动物可以利用嗅觉线索来进行空间定向和导航的启发,提出一种基于气味奖励引导的Q-learning环境认知策略。该算法通过改善Q-learning中的动作选择策略来减少对环境的无用探索,在动作选择策略中融入了环境气味奖励的引导,并提出了嗅觉因子来平衡动作选择策略中Q-learning和气味奖励引导的权重关系。为了验证算法的有效性,在Tolman老鼠实验所用的迷宫环境中进行了仿真实验,动态仿真结果表明,相比Q-learning算法,基于气味奖励引导的Q-learning算法在环境认知过程中,可减少对环境的无用探索,并增强对环境的认知学习能力,且提高算法的收敛速度。 相似文献
23.
提出了一种用语音转换技术改善电话语音识别性能的方法。通过模拟真实电话信道条件下影响语音质量的各种因素,实现由纯净语音到电话语音的转换。识别试验利用模拟电话语音评估了HMM识别器做MLLR自适应前后的性能.实验数据显示,自适应前由转换语音训练的模型识别率比由纯净语音训练的模型识别率增加了18.9%,而自适应试验表明,由转换语音训练而成的模型在MLLR自适应后,系统识别性能进一步得到改善,识别率增加了5.8%。识别实验表明所提语音转换方法可以减小由于真实电话语料缺乏而造成训练语音和测试语音声学性质的不匹配,从而有效地改善电话语音识别系统的性能。 相似文献
24.
基于3维模型的月球表面软着陆燃耗最优制导方法 总被引:1,自引:0,他引:1
为了解决月球探测器软着陆燃耗最优制导问题,基于变分法设计了最优制导律.首先,基于变分法,将问题转换为终端时间自由且带有条件约束的两点边值问题;其次,引入了时间尺度变换方法,将终端时间自由的两点边值转换成终点时间固定的两点边值问题;最后,为了确保两点边值的求解迭代算法收敛,提出了一种终端时间和共轭变量初始值猜测方法,并通过数值方法取得终端时间和共轭变量精确的初始值以及着陆过程中最优制导律和3维最优轨迹.仿真实验结果表明,所提方法有效,算法可收敛,并且实现了燃耗最优制导. 相似文献
25.
分析了目前青霉素发酵过程中存在的问题.基于RBF神经网络的辨识方法,建立了青霉素发酵过程模型.以动力学模型为基础产生教师数据,采用遗传算法对网络进行训练,建立了基于RBF神经网络的发酵过程模型,并进行了仿真实验验证.实验结果表明,该辨识模型对青霉素补料分批培养过程具有实用价值. 相似文献
26.
为了模拟动物大脑皮层结构连接与功能连接间的关系,为机器学习提供新的思路,本文用图论测度表示网络的结构,用信息论测度表示功能整合和功能分离间的相互作用,采用图选择的方法对随机图进行变异和选择,确定与特定的功能动力学模式相对应的网络结构,并研究在外界刺激信号作用下,系统连接与感觉层间的匹配关系。仿真结果表明:由图选择获得的网络结构,呈现若干密集的顶点区,区域间松散连接,具有功能分离与功能整合的特点。在外界信号刺激下,特定的结构模式可以使系统与感觉层信号的统计结构间达到最大程度的匹配。 相似文献
27.
以概率自动机(probabilistic automata, PA)为平台,结合遗传算法(genetic algorithm, GA)的进化思想,设计了反映Skinner操作条件反射(operant conditioning, OC)思想的仿生学习模型,称为基于遗传算法的操作条件反射概率自动机(genetic algorithm-operant conditioning probabilistic automata,GA-OCPA)学习系统。每一次学习尝试之后,首先,学习系统把通过OC学习算法学习得到的信息熵值作为个体适应度;然后,执行遗传算法,搜索最优的个体;最后,再执行OC学习算法学习最优个体内的最优操作行为,以得到新的信息熵值。理论上分析了GA-OCPA学习系统学习算法的收敛性,通过对两轮机器人运动平衡控制的仿真分析,表明设计的GA-OCPA学习系统的学习是一个自动获取知识和提炼的过程,具有高度的自适应能力。 相似文献
28.
基于改进BP神经网络预测蛋白质二级结构 总被引:6,自引:0,他引:6
蛋白质结构预测在生物信息学研究中占有重要地位,而蛋白质二级结构预测是蛋白质结构预测的关键步骤。针对标准BP算法存在的缺点,讨论采用几种不同的改进BP神经网络来实现蛋白质二级结构的预测,运用MATLAB语言实现各种改进算法的初始化和训练。并分析比较了它们对蛋白质二级结构预测精度的影响。实验表明,遗传算法结合动量法与学习率自适应调整策略的BP算法可获得较高的预测精度。 相似文献