排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
介绍了激励学习和两类学习算法:Q学习和SARSA学习,提出一类基于RBF函数的特征状态离散化方法,并对该方法进行了初步的实验比较. 相似文献
1