首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。  相似文献   

2.
针对协同过滤推荐算法中因图书评分数据稀疏,导致推荐质量和推荐效率低的问题,提出结合用户聚类的图书协同过滤推荐算法。首先将用户身份特征数据和行为数据进行向量化表示,并利用K-means聚类算法进行用户聚类成为不同的类别;其次计算目标用户与各类别的距离,并选择最近距离的类别作为目标用户的检索空间;最后,从检索空间中通过相似度计算确定目标用户的最近邻居,在此基础上产生推荐列表。实验结果表明,所提算法能够有效提高推荐精度,降低推荐所耗时长。  相似文献   

3.
针对大数据时代下Slope One算法推荐效率不高的问题,提出结合聚类和动态K近邻的双极Slope One推荐算法.首先,结合Canopy和K-medoids的聚类算法把相似的用户汇聚到一起.然后,在所属聚类中,根据用户之间相似度的具体情况动态地寻找最近邻,并用Slope One-BI算法推荐预测.最后,在Spark平台上实现并行化.在电影数据集上的实验结果表明:基于Spark平台的优化算法与其他协同过滤算法相比,推荐精度具有明显优势.  相似文献   

4.
针对推荐算法数据稀疏及聚类中心点敏感问题,提出了一种基于用户偏好和麻雀搜索聚类的协同过滤推荐算法.首先使用评分偏好模型对原用户项目矩阵进行修正,得到新的用户偏好-项目矩阵.利用麻雀搜索对聚类中心点进行优化,从目标用户所在簇内得到最近邻,提高了算法迭代速度,改善了聚类中心点敏感的问题.使用相似度公式对目标用户未评分项目进...  相似文献   

5.
基于K-medoids项目聚类的协同过滤推荐算法   总被引:1,自引:1,他引:0  
针对传统协同过滤推荐算法通常针对整个评分矩阵进行计算,存在效率不高的问题,提出一种基于K-medoids项目聚类的协同过滤推荐算法.该算法根据项目的类别属性对项目进行聚类,构建用户的偏好领域,使用用户偏好领域内的评分矩阵进行用户间相似度的计算,得到目标用户的最近邻居集,并生成推荐结果.与常用的K-means聚类方法相比,采用K-medoids方法对项目类别属性进行聚类,不仅克服了评分聚类可靠性不高的问题,而且算法还具有更好的鲁棒性.实验结果表明,该算法能有效提高推荐质量.  相似文献   

6.
针对海量新闻的个性化推荐算法进行研究,提出一种改进的推基于K-means聚类的协同过滤用户推荐算法.该算法首先随机初始化了K个质心,按照重新定义过的新的用户相似度公式将用户进行K-means聚类,并选取相似度最大的作为当前用户所属类别;然后再重新定义了质心并进行迭代聚类;最后在每一个用户类里应用基于用户的协同过滤推荐算法,并给用户合理的个性化推荐.仿真实验测试表明,新算法能够提高推荐的准确率,并且有效提高了扩展性.  相似文献   

7.
个性化推荐系统是帮助用户发现内容,克服信息过载的重要工具.为了提高推荐算法的准确率和效率,综合协同过滤推荐算法和K-means聚类算法,设计了一种基于用户特征和评分的精准推荐策略.该策略一方面针对新用户冷启动问题,引入K-means聚类算法对全体用户特征进行聚类,将新用户所属类中其他用户喜好的物品中的Top N个推荐给...  相似文献   

8.
为了克服传统协同过滤(CF)推荐方法数据稀疏和可扩展性差的不足,该文提出1种基于局部优化降维和聚类的协同过滤算法。采用局部优化的奇异值分解(SVD)降维技术和K-均值(K-means)聚类技术对用户-项目评分矩阵中的相似用户进行聚类并降低维度。利用近似差分矩阵表示评分矩阵的局部结构,实现局部优化。局部优化的SVD降维技术可以利用更少的迭代次数缓解CF中数据稀疏和算法可扩展性差的问题。K-means聚类技术可以缩小邻居集查找范围,提高推荐速度。将该文算法与基于Pearson相关系数的协同过滤算法、基于SVD的协同过滤算法、基于K-means聚类的协同过滤算法相比较。在MovieLens数据集上的实验结果表明,该算法的平均绝对误差(MAE)较其他算法降低了大约12%,准确性(Precision)提高了7%。  相似文献   

9.
为了提高数据挖掘的聚类准确度,提出了一种基于菌群优化的K均值(K-means)聚类算法。采用K均值算法建立数据聚类模型。根据聚类类别数设定多个聚类中心坐标。设定所属类别距离阈值,然后计算待聚类点和所有中心点距离来划分该聚类点的类别。根据参与聚类各节点和各自中心点的距离值建立适应度函数。引入菌群优化算法对K均值聚类过程进行优化。通过细菌的多次驱散、复制和趋化操作,不断提高数据聚类的适应度,直到达到最大操作次数或者最低聚类精确度阈值,获得稳定的数据聚类挖掘算法。实验证明,通过合理设置驱散和趋化次数,微调菌群算法的引力和斥力参数,能够获得较好的聚类性能。分别采用K均值和该文基于菌群优化的K均值聚类算法对6个不同数据集进行聚类仿真。该文算法对所有数据集的平均聚类准确率都高于92%。针对UCI混合数据集,当聚类达到稳定时,该文算法的聚类标准差明显优于K均值聚类算法;而且该文算法对5 000个混合样本完成聚类消耗的时间约70 s,K均值聚类算法约需93 s。  相似文献   

10.
传统的基于图书和读者的协同过滤方法缺乏语义知识,易混杂不符合读者喜好的噪音数据,从而影响聚类效果和推荐的准确度.针对该问题,提出一种基于K-means的语义协同过滤推荐算法.为了反映读者对图书的偏爱程度,首先定义读者-图书关联矩阵,然后通过K-means聚类算法寻找相邻集合,在聚类过程中兼顾关联矩阵和语义知识,分别计算读者和图书的相似度,最后通过相似程度排序向用户推荐图书.结果表明,该算法在保证计算效率的情况下能显著提高推荐的准确度.  相似文献   

11.
针对传统协同过滤推荐算法(CF)存在用户-项目矩阵稀疏以及推荐准确率较低等问题,提出了一种基于NKL和K-means聚类的协同过滤推荐算法(NKL-KM).首先,NKL-KM算法定义了一种新的相似性度量方法,该方法在进行相似性度量时考虑了各项目评分的分布以及评分值差异.其次,NKL-KM算法将K-means算法与CF算法结合,提高了推荐算法精度.最后,在MovieLens和Netflix数据集上进行算法对比实验,实验结果表明NKL-KM算法有较高的推荐精度.  相似文献   

12.
邵琳琳 《科学技术与工程》2013,13(12):3452-3456
针对传统协同过滤推荐算法生成推荐速度慢、推荐质量不高等缺陷,提出了一种基于混合蛙跳模糊聚类的改进协同过滤推荐算法。算法首先利用模糊C-均值(FCM)聚类方法对用户数据进行预处理,得到用户数据聚类中心,有效地降低了推荐工作量。然后选取相似度最优的若干聚类组成候选用户邻居集合,并利用混合蛙跳算法快速地全局寻优能力得到用户最近邻居集合,提高了推荐精度。最后,通过计算预测评分生成推荐结果。仿真结果表明,相比于传统协同过滤推荐算法,该算法在推荐速度和推荐精度上有明显改善。  相似文献   

13.
基于互联网的推荐系统为广大用户提供了一个信息共享平台,给用户提供便利,但是初期信息量少,矩阵过于稀疏,所以本文利用矩阵分解中的SVD分解,对协同过滤中的matrix进行运算,再次输入到协同过滤的模型中,从而进一步提高推荐系统的准确性.实验结果表明,该方法较单纯的协同过滤推荐算法评估指标RMSE上有明显降低,表明误差会降低.协同过滤推荐算法作为是推荐系统中使用较广泛的算法之一,因此一点点改进都是有必要的.本文后面提及了张量,为之后引入时间序列,类别(利用NLP识别所属类),标签等维度,利用张量分解建立用户、物品、评分,时间,类别,标签等多维度的推荐系统.  相似文献   

14.
在传统的协同过滤推荐算法的基础上,设计了一个基于改进的协同过滤算法的练习测试推荐系统。首先,根据学科、试题和学生的特点,有效的解决了矩阵稀疏和"冷启动"的问题;其次,使用机器学习中的K-means聚类算法对用户进行聚类,且初始聚类中心由Prim最小生成树算法确定,增加了聚类的稳定性;然后在每个聚类中搜索用户的最近邻居,缩小了计算用户之间相似度问题的规模;最后,通过实验将改进的算法与传统的算法进行了比较。实验结果表明,改进的算法提高了推荐系统的质量和准确度。  相似文献   

15.
提出一种融合用户偏好优化聚类的协同过滤推荐算法。首先利用RP-IIP算法形成细粒度用户-项目类型偏好矩阵,真实反映出用户兴趣偏好并缓解数据稀疏性;然后在该矩阵上利用蝙蝠优化的用户模糊聚类算法进行聚类,增强了用户的聚类效果并提高可扩展性,从隶属度较高的簇中选取目标用户的最近邻居,提高了最近邻选取的准确性;最后,建立用户加权相似度模型对目标用户进行评分预测并产生推荐,进一步提高推荐结果的准确性。实验结果表明,所提出的算法能够产生更好的推荐结果。  相似文献   

16.
针对K-means聚类算法依赖初始点、聚类结果受初始点的选取影响较大的缺陷,给出了一种稳定的基于影响空间的初始点优化K-means聚类算法。该算法借助了影响空间数据结构和定义的加权距离吸引因子,将特殊中心点合并为K个微簇,并对微簇中的数据点加权平均得到K个初始中心点,然后执行K-means算法;最后,理论分析和实验结果表明,该初始点优化K-means聚类算法能够有效降低噪声数据对聚类结果的影响,在聚类结果、聚类过程效率方面有较大优势。  相似文献   

17.
针对传统的协同过滤算法在电子商务系统中存在数据稀疏性和扩展性方面的问题,提出了一种混合用户和项目协同过滤的电子商务个性化推荐算法。该算法采用聚类技术,将基于用户协同过滤和基于项目的协同过滤结合起来进行双重聚类,结合基于用户协同过滤和基于项目协同过滤两方面的优点,从而获得更好的性能。实验表明,通过与其他推荐算法的比较,文中算法具有较高的推荐质量,更好的准确率和召回率。  相似文献   

18.
考虑Spark大数据平台内存计算框架在迭代计算的优势,提出Spark平台下KNN-ALS模型的推荐算法.针对矩阵分解算法只考虑隐含信息而忽视相似度信息的缺陷,将相似度信息加入评分预测中,并采用适合并行化的交替最小二乘法进行模型最优.在MovieLens数据集上的实验表明:该算法能够提高协同过滤推荐算法在大数据集下的处理效率,且加速比也达到并行处理的线性要求,相比其他方法有较好的精度.  相似文献   

19.
为提高传统协同过滤算法在个性化推荐系统中的大数据处理能力,研究了一种基于模糊聚类的并行推荐算法。在Hadoop平台下首先通过PCA降维和FCM聚类对用户物品评分矩阵进行预处理,采用皮尔逊相关系数计算用户间的相似度,通过得到的聚类簇集合构建最近邻集合,生成基本预测评分。最后实现算法的并行化处理并得到推荐结果。实验结果表明,与基于PCA降维的协同过滤和单机式传统协同过滤算法相比,该算法提高了推荐的准确性和实时性。  相似文献   

20.
为解决传统协同过滤算法在产生推荐时实时性较差性问题,提出了一种基于蚁群模糊聚类的协同过滤推荐算法.该算法将分两个步骤产生推荐.离线时,应用蚁群模糊聚类技术,对基本用户进行聚类;在线时,利用已有的用户蚁群聚类寻找目标用户的最近邻居,并产生推荐.实验表明,基于蚁群模糊聚类的协同过滤推荐算法能提高推荐产生的速度,即实时性得到...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号