首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Slope One 协同过滤算法被广泛应用于个性化推荐系统中。标签是一种描述项目特性的重要形式,针对Slope One 算法推荐精度不足的问题,将标签信息融合到 Slope One 算法当中。同时参考 k 近邻算法思想,选取阈值过滤后的 k 近邻项目参与平均评分偏差计算,提高计算效率的同时增加预测精度。使用评分相似度和标签相似度作为权重修正线性回归模型。通过线性加权融合预测结果,进一步提升推荐质量。将算法应用于 MovieLens 数据集,与传统加权 Slope One 算法相比,平均绝对偏差下降4.8%,召回率和准确率分别提高32.1%和26.3%。  相似文献   

2.
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。  相似文献   

3.
基于不同数据集的协作过滤算法评测   总被引:3,自引:0,他引:3  
针对协作过滤算法评测中普遍采用单一数据集,该文将传统的User-based(近邻数为20)、Item-based、Itemaverage、Item user average和Slope One 5种算法应用于MovieLens和Book-Crossing两种数据分布特征不同的数据集。结果显示,在Movielens这种评分值相对比较稠密的数据集上,Slope One算法的预测精度最好;而在评分值相对比较稀疏的Book-Crossing数据集上,Item-based算法的预测精度最好,Slope One的预测精度最差。选择算法应根据用户和资源分布具体情况确定。  相似文献   

4.
为了提高智能推荐系统的性能,采用狼群优化的K-means聚类挖掘实现数据分类,通过协同过滤完成智能推荐。为了提高推荐效率,引入Spark平台多节点完成聚类和推荐。建立用户和资源的K-means聚类模型,采用狼群优化算法对初始类别中心点进行优化,以提高聚类准确度,根据用户和资源的类别属性获得用户-资源评分数据,最后建立协同过滤智能推荐模型。根据推荐效率要求,将推荐模型部署至Spark平台,实现聚类和智能推荐的分布式运算。实验证明,通过合理设置聚类中心点数目,结合Spark平台多节点运算,与常用推荐算法对比,所提算法可以获得更准确的推荐性能,在大规模数据的智能推荐系统中更能满足实时性要求,智能推荐效率高。  相似文献   

5.
针对新闻的个性化服务差及推荐效率低的问题,提出了一种新闻事件的分布式混合推荐算法.该算法改进了传统的层次聚类算法用于新闻事件发现,通过协调簇中心距离和簇间最远距离的权重解决了传统层次聚类中的大簇问题;使用混合推荐算法进行事件推荐,引入了事件的多重特征来计算用户兴趣模型,更准确地表示用户的兴趣偏好;采用Spark分布式计算平台实现该算法,可处理大数据的个性化推荐问题.在公开数据集上的实验结果表明本文方法有效.   相似文献   

6.
邵琳琳 《科学技术与工程》2013,13(12):3452-3456
针对传统协同过滤推荐算法生成推荐速度慢、推荐质量不高等缺陷,提出了一种基于混合蛙跳模糊聚类的改进协同过滤推荐算法。算法首先利用模糊C-均值(FCM)聚类方法对用户数据进行预处理,得到用户数据聚类中心,有效地降低了推荐工作量。然后选取相似度最优的若干聚类组成候选用户邻居集合,并利用混合蛙跳算法快速地全局寻优能力得到用户最近邻居集合,提高了推荐精度。最后,通过计算预测评分生成推荐结果。仿真结果表明,相比于传统协同过滤推荐算法,该算法在推荐速度和推荐精度上有明显改善。  相似文献   

7.
为实现大数据环境下高效、精准的商品推荐,将协同过滤思想与信息检索理论有机融合,提出基于学习排序(LTR)的并行协同过滤推荐算法.首先利用相似物品-物品网络图结构共享参数的方法减少参数,通过Pairwise方法构造目标函数,并利用梯度上升法得到参数.还提出了通过使用层次聚类的方法对差异性较大的相似图进行分裂,以保证推荐的准确度.最后给出大数据平台Spark下该推荐算法的并行化实现方案.在真实数据集Netflix上的实验结果表明:提出的算法不仅在召回率和准确率上有所提高,而且计算效率高效,表明该方法可以应用于大数据场景中的推荐服务.  相似文献   

8.
针对现有大数据空间查询处理方法存在执行时间长和查询结果不够准确的问题,提出一种基于动态分布式聚类算法的大数据查询处理方法,该方法分为数据预处理、数据聚类和查询处理3个部分.首先将输入数据划分为多个子集,以RRD格式存储在一组机器节点中;其次采用划分和层次混合动态聚类算法,在Apache Spark平台上对数据进行分布式聚类;最后通过K近邻查询方式获得高精度和高效率查询结果.实验结果表明,本文提出的方法具有可扩展性,可为空间查询处理提供高质量的结果,比其他查询方法更具优势.  相似文献   

9.
为提高基于项目协同过滤推荐方法的抗评分攻击能力,提出结合用户信任等级和项目进行资源协同过滤算法。提出根据用户兴趣相关性、评分相似性和评分相关性构建用户关联图,然后提出用户信任等级计算模型,并将用户信任等级值作为用户的权重结合到经典协同过滤推荐算法Slope One的项目差异性的计算中,形成基于用户信任等级的协同过滤方法。实验数据表明新算法在不影响推荐的预测准确性的基础上,比传统的过滤推荐算法具有更好的抗攻击能力。  相似文献   

10.
现有协作过滤算法评测中普遍采用单一数据集,而忽略算法可能受不同数据集特征影响的情况。针对这一问题,该文将传统的User-based(近邻数为20)、Item-based、Item average、Item user average和Slope One 5种算法应用于MovieLens和Book-Crossing两种数据分布特征不同的数据集,通过试验得到其评测精度。结果显示,在Movielens这种评分值相对比较稠密的数据集上,Slope One算法的预测精度最好;而在评分值相对比较稀疏的Book-Crossing数据集上,Item-based算法的预测精度最好,Slope One的预测精度最差。应根据用户和资源分布具体情况选择合适的算法。  相似文献   

11.
为了提高推荐算法在对少数类用户进行推荐时的时效性、准确性,提出一种面向少数类用户兴趣演化的推荐算法。该文算法将时间窗口、指数衰减函数和带有时间效应的用户项目交互信息3个因素相结合,描述出不同用户对不同项目类型的兴趣倾向值。通过改进的K-means算法对用户进行分类,并对聚类结果中近邻数量极少的类用户(少数类用户),使用平衡的方法来增加这类用户的近邻数量,避免少数类用户兴趣趋于窄化,以防信息茧房现象的发生。最后将聚类结果与推荐算法结合对少数类用户进行推荐。在MovieLens 100K数据集上的实验对比分析表明,该文算法的推荐精度最大提高了2.07%。  相似文献   

12.
考虑Spark大数据平台内存计算框架在迭代计算的优势,提出Spark平台下KNN-ALS模型的推荐算法.针对矩阵分解算法只考虑隐含信息而忽视相似度信息的缺陷,将相似度信息加入评分预测中,并采用适合并行化的交替最小二乘法进行模型最优.在MovieLens数据集上的实验表明:该算法能够提高协同过滤推荐算法在大数据集下的处理效率,且加速比也达到并行处理的线性要求,相比其他方法有较好的精度.  相似文献   

13.
随着通信用户数量的逐渐增加,当前多维信任数据协同推荐算法无法有效满足用户对资源多样性、准确性和发掘能力的要求。为此,提出一种新的定向信息推荐下多维信任数据协同推荐算法。通过矢量空间模型对用户兴趣进行描述,将具有代表性的用户看作该类用户的聚类中心,建立用户对资源的偏好矩阵,求出依据综合信任值的用户相似度;重复选择聚类中心,直至符合既定阈值。获取用户聚类结果后,选择待推荐用户所处聚类中和该用户相似的若干用户,依据上述近邻对目标资源的评分值实现目标用户对目标项目的预测。给出定向信息推荐下多维信任数据协同推荐算法的实现过程,输出Top-N多维信任数据推荐集合。实验结果表明,所提算法预测精度和资源多样性高,发掘能力强,推荐效果好。  相似文献   

14.
随着大规模网络数据的增加,可扩展性成为推荐系统的一个关键因素,为此提出一种基于并行化谱聚类的协同推荐算法.首先通过并行化改进的谱聚类方法对项目进行聚类;然后在基于用户的协同推荐算法基础上,结合已聚类的项目打分信息,提出一种改进的相似用户计算方法,并进行推荐;最后在数据集上进行测试.结果表明,该算法可以有效降低时间复杂度,推荐精确度和推荐效率也有显著提高.  相似文献   

15.
针对交替最小二乘法(ALS)在处理大数据集时所面临的处理速度和计算资源问题,提出了基于相似用户索引的分布式矩阵分解推荐算法。首先算法基于用户的评分行为找到用户之间的最近邻,然后使用Spark平台运行提出的算法,并产生推荐。在GroupLens网站上提供的MovieLens数据集上进行仿真实验,实验结果表明,提出的算法能够有效解决ALS对于大数据集运行效率低及在云环境中可扩展性较差的问题。  相似文献   

16.
为了帮助人们从大量互联网资源中找到感兴趣的信息,推荐系统由此而生.其中,应用最广泛,也是最早出现的推荐算法包括协同过滤算法,但是该算法还存在着许多不足之处.该算法主要考虑用户的评分数据,未能结合项目进行考虑,同时在选取当前用户的最近邻用户时,通常统一规定了近邻用户数目,没有结合每个用户的实际数据,导致推荐的效果无法取得最优.因此,本文在充分考虑用户评分的情况下,还结合项目信息加入了用户的兴趣偏好,提出了一种基于用户兴趣的动态近邻协同过滤算法.综合用户的标签数据和评分数据来计算相似度,可以很好的缓解仅依靠评分数据带来的稀疏性问题.同时在得到用户之间的相似度之后,设定2个阀值,分布选取最近邻用户.只有当用户间相似度超过阈值,该用户才会被选择为最近邻的用户,动态的找到每一个用户的严格最近邻用户.通过实验,与常用的协同过滤算法相比,本文提出的算法推荐的误差更小,并且为以后的研究工作奠定了基础.  相似文献   

17.
伴随着互联网技术的高速发展,当今世界已进入信息时代.在"人人皆媒体"的大环境下,网络上信息巨大繁杂,为了从数以亿计的数据、新闻等各类信息中提取出自己感兴趣的信息,推荐技术应运而生.研究了在影视网站中融入推荐算法,根据用户的历史评分数据了解用户喜好,为使用者推荐符合他审美口味的,可能感兴趣的影视作品.在对原有Slope one推荐算法的不足进行分析的基础上,把最近邻和用户加权的思想融入到Slope one算法中,已达到增强算法性能的目的.  相似文献   

18.
谱聚类算法建立在谱图划分理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。然而,谱聚类算法涉及如何选取合适的尺度参数σ构造相似度矩阵的问题。并且,在处理大规模数据集时,聚类的过程需要较大的时间和内存开销。研究从构造相似度矩阵入手,以传统NJW算法为基础,提出一种基于K近邻的自适应谱聚类快速算法FA-SC。该算法能自动确定尺度参数σ;同时,对输入数据集分块处理,并用基于K近邻的稀疏相似度矩阵保存样本信息,减少计算的内存开销,提高了运行速度。通过实验,与传统谱聚类算法比较,FA-SC算法在人工数据集和UCI数据集上能够取得更好的聚类效果。  相似文献   

19.
聚类集成作为数据挖掘的重要应用工具,得到了广泛的认可和研究.本文在投票法的基础上提出一种新的软聚类投票(VMSC)算法.算法首先求取平均隶属度矩阵,然后进行迭代优化.该算法能够消除噪声点影响,具有很好的稳定性.Spark云计算平台能够高效处理大数据.为了提出的算法处理大数据,在Spark云计算平台上实现并行的VMSC算法.VMSC算法实验用12组UCI数据集进行验证,并与sCSPA、sMCLAs HGBF及SVCE等软聚类算法进行对比.结果表明,VMSC算法对软聚类算法具有较好的集成效果.在Spark云计算平台上对VMSC算法并行实现.实验表明,该算法具有较理想的并行效果,能够有效处理大数据.  相似文献   

20.
基于用户聚类和项目分类的电影推荐系统构建   总被引:1,自引:0,他引:1  
针对推荐系统中普遍存在的数据稀疏性问题,提出了一种结合项目分类和用户聚类的推荐算法.通过聚类算法将相似的用户聚类在一起形成若干个用户子网,在各个用户子网之间和用户子网中通过信任机制加强子网之间和子网内部的相互关系,根据项目的种类将项目分类,再通过用户对项目的选择计算用户对每种类型项目的大众喜爱度,在每个用户子网中将项目分类和大众喜爱度加权求和得出最终的相似度,由此构造出推荐系统.实验验证了方法的有效性,减小了数据稀疏性对推荐结果的负面影响.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号