排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
提出了一种基于强化学习的半监督学习方法,将家庭服务相关的自然语言信息转化为服务规划.首先,构建与家庭服务相关的交互环境,并赋予环境中物体对应的状态属性;其次,针对稀疏激励问题,设计即时激励和延时激励,提高动作交互过程中的奖励值,引导动作选择向最优化发展;然后,构建物体状态向量并结合余弦相似度作为衡量服务执行的标准;最后,针对生成的服务规划设计对比实验.实验结果表明:该方法能够提升规划生成的准确率并加快收敛速度. 相似文献
1