期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	0篇
国内免费	1篇

专业分类

综合类

4篇

出版年

2023年	1篇
2019年	1篇
2013年	1篇
2006年	1篇

排序方式： 共有4条查询结果，搜索用时 671 毫秒

基于平均报酬模型的强化学习算法研究 总被引：1，自引：0，他引：1

黄炳强曹广益费燕琼王占全《上海理工大学学报》2006,28(5):418-422

对于有吸收目标状态的循环任务,比较合理的方法是采用基于平均报酬模型的强化学习.平均报酬模型强化学习具有收敛速度快、鲁棒性强等优点.本文介绍了平均报酬模型强化学习的3个主要算法:R学习、H学习和LC学习,并给出了平均报酬模型强化学习的主要应用及研究方向. 相似文献

复合顶板松软煤层回采巷道支护技术研究

王占全《山西科技》2013,28(4):140-141

通过理论分析、数值模拟和现场观测,系统分析了复合顶板巷道围岩变形破坏机理,提出了相应的支护方式。研究结果表明:煤巷两顶角为剪切应力集中区,应及时加强支护;顶板两顶角锚杆、锚索分别向两帮倾斜20°,可有效控制复合顶板煤巷的破坏。相似文献

基于法计算学理论的人工智能辅助决策算法研究

陈亮郭佳雯武建功王占全史令《华东师范大学学报(自然科学版)》2019,(5)

针对法学理论和法律实践中缺乏智能决策的问题,综合考虑该领域内的业务数据特征,采用多种数据分析模型进行智能决策算法的研究.法计算学理论以法律关系的数据化智能驱动为核心,在作为法律研究与应用本体的法律关系与计算机科学领域内的数据特征属性之间建立联系,提出了"涵摄分类"概念,并对决策树、朴素贝叶斯等算法进行法律场景下的改进,建立了法律关系坐标系,实现法律关系分析的空间几何转化,最后提出了智能化的辅助决策平台.实验结果表明,该辅助决策与真实律师的办案策略与结果高度吻合,具有辅助律师决策的可行性和有效性. 相似文献

Prefix-LSDPM：面向小样本的在线学习会话退出预测模型

陈芮李飞王占全《华东理工大学学报(自然科学版)》2023,(5):754-763

在线学习会话退出预测旨在准确预测在线学习过程中的学习会话退出，是智慧教育领域中十分重要的一项研究任务。针对现有模型在小样本场景下预测准确率较低的问题，提出了基于前缀提示的在线学习会话退出预测模型Prefix-LSDPM。该模型为获取单个学习行为内部特征及连续学习行为之间的隐含关联信息，在改进了键值向量的Transformer网络中对提示形式的合成序列进行掩码学习；为降低模型训练涉及的参数量以适应小样本学习，将学习会话退出预测任务建模形式靠近预训练任务，并在冻结的预训练参数基础上对提示参数进行调优。基于多个数据集的实验结果表明，Prefix-LSDPM的预测准确率优于现有模型，且在小样本学习中仍能达到较好的预测效果。相似文献