首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   0篇
  国内免费   1篇
综合类   4篇
  2023年   1篇
  2019年   1篇
  2013年   1篇
  2006年   1篇
排序方式: 共有4条查询结果,搜索用时 671 毫秒
1
1.
基于平均报酬模型的强化学习算法研究   总被引:1,自引:0,他引:1  
对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向.  相似文献   
2.
王占全 《山西科技》2013,28(4):140-141
通过理论分析、数值模拟和现场观测,系统分析了复合顶板巷道围岩变形破坏机理,提出了相应的支护方式。研究结果表明:煤巷两顶角为剪切应力集中区,应及时加强支护;顶板两顶角锚杆、锚索分别向两帮倾斜20°,可有效控制复合顶板煤巷的破坏。  相似文献   
3.
针对法学理论和法律实践中缺乏智能决策的问题,综合考虑该领域内的业务数据特征,采用多种数据分析模型进行智能决策算法的研究.法计算学理论以法律关系的数据化智能驱动为核心,在作为法律研究与应用本体的法律关系与计算机科学领域内的数据特征属性之间建立联系,提出了"涵摄分类"概念,并对决策树、朴素贝叶斯等算法进行法律场景下的改进,建立了法律关系坐标系,实现法律关系分析的空间几何转化,最后提出了智能化的辅助决策平台.实验结果表明,该辅助决策与真实律师的办案策略与结果高度吻合,具有辅助律师决策的可行性和有效性.  相似文献   
4.
在线学习会话退出预测旨在准确预测在线学习过程中的学习会话退出,是智慧教育领域中十分重要的一项研究任务。针对现有模型在小样本场景下预测准确率较低的问题,提出了基于前缀提示的在线学习会话退出预测模型Prefix-LSDPM。该模型为获取单个学习行为内部特征及连续学习行为之间的隐含关联信息,在改进了键值向量的Transformer网络中对提示形式的合成序列进行掩码学习;为降低模型训练涉及的参数量以适应小样本学习,将学习会话退出预测任务建模形式靠近预训练任务,并在冻结的预训练参数基础上对提示参数进行调优。基于多个数据集的实验结果表明,Prefix-LSDPM的预测准确率优于现有模型,且在小样本学习中仍能达到较好的预测效果。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号