排序方式: 共有1条查询结果,搜索用时 0 毫秒
1
1.
推荐系统旨在从用户-项目的交互中进行建模,为用户推荐感兴趣的内容,从而提
高用户体验. 然而大多数用户-项目的序列并不总是顺序相关的,而是有更灵活的顺序甚至存
在噪声. 为解决这一问题,提出一种基于策略记忆的深度强化学习序列推荐算法,该算法将用
户的历史交互存入记忆网络,使用一个策略网络将用户当前的行为模式更细致地划分为短期
偏好、长期偏好以及全局偏好,并引入注意力机制,生成相应的用户记忆向量,利用深度强化
学习算法识别对未来收益较大的项目 . 在用户和项目的交互中不断更新、强化学习网络的策
略以提高推荐准确性 . 在两个公共数据集的实验中表明,本文所提出的算法与最先进的基线
算法相比,召回率指标在2个数据集上分别提升了8.87%和11.20%. 相似文献
1