首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
点击率预测技术在视频推荐系统中具有重要的作用.视频推荐系统可以根据点击率预测的结果调整投放顺序,从而提高用户的真实点击率.在点击率预测问题中,由于数据存在海量性以及不平衡性等问题,点击率预测的精确度一般都较低.针对以上问题,使用特征工程和机器学习相结合的方法,有效地改进了现有的视频点击率预测算法的性能.首先,使用特征工程方法,从原始数据中提取特征,并使用矩阵分解等方法生成交叉特征;然后,分别基于逻辑回归、因子分解机和梯度提升决策树-逻辑回归实现点击率预测模型.实验结果表明,基于因子分解机模型和基于梯度提升决策树-逻辑回归模型的预测精度要优于基于逻辑回归的模型,并且将用户特征和视频特征进行交叉组合能够改进点击率预测的精度.  相似文献   

2.
广告点击率估算技术综述   总被引:1,自引:0,他引:1  
计算广告是根据给定的用户和网页内容,通过计算得到与之最匹配的广告并进行精准定向投放的一种广告投放机制.广告的点击率预测是指利用点击日志预测的点击率,其结果受到广告的自身性质、广告位置、页面信息、用户性质,以及广告主信誉等诸多因素的影响.有效地预测广告的点击率,对于提高广告投放的效率有着至关重要的作用.本文介绍了广告点击率预测的常用模型,包括历史数据丰富的广告点击率预测模型、新广告和稀疏广告的点击率估算模型和点击率预测的优化模型,并通过真实数据集举例说明了其实现的方法.  相似文献   

3.
一种考虑用户兴趣转移特征的协同预测模型   总被引:1,自引:0,他引:1  
大多数预测模型使用用户属性或社交关系信息来优化预测结果,然而真实系统中用户的属性或社交关系信息往往很难获得,或者取得的是虚假信息,从而导致用户行为表达不准确或模型不具有普适性.另外,几乎所有使用用户特征的模型仅考虑用户兴趣本身的度量,而忽视兴趣的变化这一重要特征.因此,本文提出一种考虑用户兴趣转移特征的协同预测模型.该模型根据用户连续行为序列构建用户兴趣转移特征和用户行为演变网络,利用用户兴趣转移特征计算用户相似性,进而搜索最近邻集合,利用用户行为演变网络筛选候选集,最后设计最频繁项提取算法来产生预测结果,从而构建用户行为的预测模型.在真实的新闻浏览日志、交互式网络电视视频访问日志和微软服务器日志上的实验表明该预测模型是有效的.  相似文献   

4.
为了提高混沌时间序列预测精度,利用相空间重构和预测模型参数间的相互联系,提出一种基于遗传算法的混沌时间序列参数联合优化方法.该方法首先将相空间重构和预测模型参数作为遗传算法的个体,混沌时间序列预测精度作为适应度函数,通过选择、交叉和变异等遗传操作获得最优参数,最后利用混沌时间序列实例对联合优化方法进行验证性测试.实验结果表明:相对于传统参数优化方法,联合优化方法大幅度提高混沌时间序列的预测精度,为混沌时间序列预测提供一种新的思路.  相似文献   

5.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

6.
预测视听在线人数能够帮助厂商提供有价值的信息, 获取更大效益. 从时间序列分析出发, 经过特征调整, 利用支持向量回归对用户视听在线人数进行准确预测. 首先, 对数据进行时间序列分析建模并预测; 然后, 将模型视为线性回归对用户视听在线人数作进一步改进, 结合时间与实际生活中的特征进行调整, 并添加了新的特征; 接着, 对新特征组成的样本进行支持向量回归, 通过社会认知优化寻找径向基函数中的最优参数; 最后, 得到比较理想的预测效果.  相似文献   

7.
预测视听在线人数能够帮助厂商提供有价值的信息,获取更大效益.从时间序列分析出发,经过特征调整,利用支持向量回归对用户视听在线人数进行准确预测.首先,对数据进行时间序列分析建模并预测;然后,将模型视为线性回归对用户视听在线人数作进一步改进,结合时间与实际生活中的特征进行调整,并添加了新的特征;接着,对新特征组成的样本进行支持向量回归,通过社会认知优化寻找径向基函数中的最优参数;最后,得到比较理想的预测效果.  相似文献   

8.
Web在过去数十年飞速发展,其低延迟和快响应的特性已经变得越来越重要.面对这样的需求,通常会预取用户即将访问的文件到缓存中,利用代理服务器缓存来获取数据,避免网络堵塞,提高Web访问效率.可见,在预取技术中,一个有效的预测模型是非常有必要的.针对目前缓存预取工作对用户差异关注度不足和度量指标单一化的薄弱环节,提出一个基于用户分级化的Web预测模型,并且能够随着Web请求进行多参数动态调整.该模型通过对代理服务器上用户访问情况分布的变化趋势分析,将用户集分为重要性不同的若干等级,并适当利用序列相似度来聚类低贡献用户产生的会话,之后在部分匹配预测模型的基础上,结合缓存替换策略为预测树结点构造包含多个参量的目标函数,并使构建好的模型能够进行自适应调整.最后通过实验证明该模型可以有效提高缓存的预取性能.  相似文献   

9.
机器学习算法广泛应用于电商用户行为数据分析及商业预测.其中,XGBoost算法作为一种常用的有监督机器学习算法,能够实现电商用户行为特征最优选择与行为模型构建、评估消费价值、预测重复购买行为概率、提高商业决策的精准性与可行性.本研究采用阿里云天池大数据竞赛“天猫复购预测”所提供的“双十一”电商购物节关联数据集中约42万电商平台用户产生的5 500万条行为数据,基于促销活动情境完成特征构造,实现有监督分类学习.本研究实现了XGBoost算法的参数优化与数据特征值处理过程优化,完成了促销活动后6个月内电商用户重复购买行为的预测模型演算.结果表明:优化后的XGBoost算法能够比较精准地预测电商用户重复购买行为、评估在线用户潜在购买价值、实现精准营销以及真正促进促销活动的长期投资回报率提高.  相似文献   

10.
随着互联网的发展和用户的增长,广告行业从传统的线下广告模式,逐步转变为线上广告模式.同时,由于大数据分析技术的运用,线上广告模式相比于传统广告也体现了巨大的优越性.广告主之间相互竞争,通过竞价的方式,将自己的广告投放在运营媒体的广告位上.所以,在投放前预测该广告可能被用户点击的概率(CTR),对于广告主减少成本和增加可能收入来说非常重要.本文在调研了目前常用的广告点击率预测模型的基础上,选取广告主、广告和投放媒体平台信息作为预测模型的特征,采用真实数据集验证说明各种模型的优劣性,以及不同特征对广告点击率预测结果的影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号