基于强化学习的服务规划生成方法 |
| |
引用本文: | 张梦洋,田国会,龚京,袁媛.基于强化学习的服务规划生成方法[J].华中科技大学学报(自然科学版),2018(9). |
| |
作者姓名: | 张梦洋 田国会 龚京 袁媛 |
| |
作者单位: | 山东大学控制科学与工程学院;山东大学深圳研究院 |
| |
摘 要: | 提出了一种基于强化学习的半监督学习方法,将家庭服务相关的自然语言信息转化为服务规划.首先,构建与家庭服务相关的交互环境,并赋予环境中物体对应的状态属性;其次,针对稀疏激励问题,设计即时激励和延时激励,提高动作交互过程中的奖励值,引导动作选择向最优化发展;然后,构建物体状态向量并结合余弦相似度作为衡量服务执行的标准;最后,针对生成的服务规划设计对比实验.实验结果表明:该方法能够提升规划生成的准确率并加快收敛速度.
|
本文献已被 CNKI 等数据库收录! |
|