首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对新闻的个性化服务差及推荐效率低的问题,提出了一种新闻事件的分布式混合推荐算法.该算法改进了传统的层次聚类算法用于新闻事件发现,通过协调簇中心距离和簇间最远距离的权重解决了传统层次聚类中的大簇问题;使用混合推荐算法进行事件推荐,引入了事件的多重特征来计算用户兴趣模型,更准确地表示用户的兴趣偏好;采用Spark分布式计算平台实现该算法,可处理大数据的个性化推荐问题.在公开数据集上的实验结果表明本文方法有效.   相似文献   

2.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

3.
为了提高人力资源推荐系统的效率,提出一种基于Spark平台的K均值聚类算法来完成人力资源推荐;Spark平台在分布式系统所有节点的内存弹性分布式数据集中完成聚类迭代运算,以加快聚类速度;将K均值聚类算法与聚类簇思想相结合,以提高大规模数据样本聚类的效率,得到聚类结果后,采用动态推荐算法实现人力资源实时推荐。结果表明,Spark平台相比于单机在聚类计算效率方面更有优势,且所提出的算法比单机的K均值聚类算法的聚类速度和准确率均更优,在动态推荐性能方面也优于常用推荐算法。  相似文献   

4.
为了提高智能推荐系统的性能,采用狼群优化的K-means聚类挖掘实现数据分类,通过协同过滤完成智能推荐。为了提高推荐效率,引入Spark平台多节点完成聚类和推荐。建立用户和资源的K-means聚类模型,采用狼群优化算法对初始类别中心点进行优化,以提高聚类准确度,根据用户和资源的类别属性获得用户-资源评分数据,最后建立协同过滤智能推荐模型。根据推荐效率要求,将推荐模型部署至Spark平台,实现聚类和智能推荐的分布式运算。实验证明,通过合理设置聚类中心点数目,结合Spark平台多节点运算,与常用推荐算法对比,所提算法可以获得更准确的推荐性能,在大规模数据的智能推荐系统中更能满足实时性要求,智能推荐效率高。  相似文献   

5.
在推荐系统中,往往会存在数据的非实时性、稀疏性和冷启动性等问题,文中通过引入遗忘曲线来跟踪用户对资源偏好程度随时间变化情况,利用提出一种改进的K-Means聚类算法对用户集进行聚类,根据改进的个性化推荐算法对用户进行推荐,建立了一种基于动态时间的个性化推荐模型. 通过实验验证,文中提出的个性化推荐模型能够获取准确的用户偏好信息,并缓解冷启动问题,降低算法计算的时间空间复杂度,提高个性化推荐算法的推荐质量.  相似文献   

6.
介绍Web数据挖掘概念、个性化推荐技术,着重设计了一个基于Web挖掘的个性化推荐系统,并给出了个性化推荐核心模块的实现过程。本系统根据Web挖掘过程,结合基于聚类划分的增量式关联规则挖掘算法的实现。  相似文献   

7.
在几种流行的推荐算法的基础上,本文提出了一种新的融合用户聚类和关联规则的算法来改善推荐效果。该算法在经典的关联规则算法Apriori基础上引入多最小支持度的概念,并在关联规则算法之前进行用户聚类,在聚类算法中使用了包含字符属性的混合属性距离函数,提高聚类效果。在此算法的基础上,设计并实现了一种新的基于图书馆的推荐系统。实验证明该算法改善了数字图书馆中新书的推荐质量,去除了部分只含高浏览量图书的无意义规则,并趋向于发现相近种类图书的关联性。  相似文献   

8.
针对大数据时代下Slope One算法推荐效率不高的问题,提出结合聚类和动态K近邻的双极Slope One推荐算法.首先,结合Canopy和K-medoids的聚类算法把相似的用户汇聚到一起.然后,在所属聚类中,根据用户之间相似度的具体情况动态地寻找最近邻,并用Slope One-BI算法推荐预测.最后,在Spark平台上实现并行化.在电影数据集上的实验结果表明:基于Spark平台的优化算法与其他协同过滤算法相比,推荐精度具有明显优势.  相似文献   

9.
随着大规模网络数据的增加,可扩展性成为推荐系统的一个关键因素,为此提出一种基于并行化谱聚类的协同推荐算法.首先通过并行化改进的谱聚类方法对项目进行聚类;然后在基于用户的协同推荐算法基础上,结合已聚类的项目打分信息,提出一种改进的相似用户计算方法,并进行推荐;最后在数据集上进行测试.结果表明,该算法可以有效降低时间复杂度,推荐精确度和推荐效率也有显著提高.  相似文献   

10.
数据聚类标签技术是在小规模样本上进行聚类,然后利用聚类结果对其余样本标注类别的方法是提高大规模数据聚类效率的一种有效途径.混合数据是现实应用中最广泛的数据类型,文章将用户兴趣数据作为小规模数据,利用K-prototypes算法对其聚类,在此基础上构建用户兴趣域.利用拟标签数据的各属性值与用户兴趣域分量的关系定义了数据关于用户兴趣域隶属度.基于用户兴趣域和"数据-用户兴趣域"隶属度的概念,提出了一种基于用户兴趣混合数据聚类标签算法UIMCL(User’s Interest Mixed Data Clustering Label).该算法克服了以往数据标签算法只能为拟标记数据指派一个类标签的局限性,可以应用于电子商务的推荐服务和用户行为分析.实验结果表明,该算法对混合数据聚类标签处理有较好的效果.  相似文献   

11.
随着我国旅游业发展和人们对旅游服务需求的不断增多,旅游景点的精准推荐不仅可以节约用户大量的时间,还能够提升用户的消费体验,为此本文提出一种基于情境聚类扩展用户画像的旅游景点推荐方法。基于用户情境数据进行情境聚类,构建出扩展的用户画像模型;根据群体用户画像反映的用户特征,结合情境标签设置个体用户情境特征属性,再融合关联规则和相似度计算为用户推荐个性化的景点。实验结果表明,相较于传统的关联规则Apriori推荐算法或加权Apriori推荐算法,基于情境聚类扩展用户画像的旅游景点推荐方法具有更优的推荐结果。  相似文献   

12.
针对混合属性数据聚类难度高的问题,提出一种基于广义线性模型的混合属性数据聚类方法.首先,构建低阶多元广义线性模型处理海量数据聚类问题,考虑数据属性的时间特性,获取属性时间序列矩阵;然后,基于优化K-prototypes聚类方法处理混合属性数据时,考虑属性的时间序列矩阵;最后,在考虑样本同聚类中心距离基础上兼顾已知样本信息内容,采用优化方法计算数据相异度、样本与聚类集间距离,当聚类结果趋于平稳时终止运算,输出聚类结果.为验证基于广义线性模型的混合属性数据聚类方法的有效性展开实验分析.结果显示,该方法经过较少次迭代即可优化划分混合属性数据聚类集,聚类适应度值为0.88~0.94,适应度优,可准确体现样本间差异,是一种准确度高的混合属性数据聚类方法.  相似文献   

13.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

14.
为提高传统协同过滤算法在个性化推荐系统中的大数据处理能力,研究了一种基于模糊聚类的并行推荐算法。在Hadoop平台下首先通过PCA降维和FCM聚类对用户物品评分矩阵进行预处理,采用皮尔逊相关系数计算用户间的相似度,通过得到的聚类簇集合构建最近邻集合,生成基本预测评分。最后实现算法的并行化处理并得到推荐结果。实验结果表明,与基于PCA降维的协同过滤和单机式传统协同过滤算法相比,该算法提高了推荐的准确性和实时性。  相似文献   

15.
针对移动电商个性化推荐服务领域情景感知应用不足和推荐质量不高的问题,提出一种基于情景感知的移动电商用户-项目聚类推荐算法(UIC-CF).在分析情景感知和传统推荐系统基础上,首先基于用户-项目-情景数据模型,构建用户项目类型偏好矩阵,并对评分矩阵填充优化,然后基于情景相似度对用户和项目进行聚类,以用户的评分矩阵和聚类结果为输入,执行UIC-CF算法完成Top-N项目推荐.基于LDOS-CoMoDa数据集,对UIC-CF算法和其他两种算法的对比实验,结果显示本文给出的算法均方根误差最小,准确率值显著提高,表明UICCF算法不仅有效,且具有进一步优化利用的前景.  相似文献   

16.
为了快速挖掘大规模空间数据的聚集特性,在cluster_dp密度聚类算法基础上,提出了一种基于弹性分布数据集的并行密度聚类方法 PClusterdp.首先,设计一种能平衡工作负载弹性分布数据集分区方法,根据数据在空间的分布情况,自动划分网格并分配数据,使得网格内数据量相对均衡,达到平衡运算节点负载的目的;接着,提出一种适用于并行计算的局部密度定义,并改进聚类中心的计算方式,解决了原始算法需要通过绘制决策图判断聚类中心对象的缺陷;最后,通过网格内及网格间聚簇合并等优化策略,实现了大规模空间数据的快速聚类处理.实验结果表明,借助Spark数据处理平台编程实现算法,本方法可以有效实现大规模空间数据的快速聚类,与传统的密度聚类方法相比具有较高的精确度与更好的系统处理性能.  相似文献   

17.
建立快速有效的针对大规模文本数据的聚类分析方法是当前数据挖掘研究和应用领域中的一个热点问题.为了同时保证聚类效果和提高聚类效率,提出基于"互为最小相似度文本对"搜索的文本聚类算法及分布式并行计算模型.首先利用向量空间模型提出一种文本相似度计算方法;其次,基于"互为最小相似度文本对"搜索选择二分簇中心,提出通过一次划分实现簇质心寻优的二分K-means聚类算法;最后,基于MapReduce框架设计面向云计算应用的大规模文本并行聚类模型.在Hadoop平台上运用真实文本数据的实验表明:提出的聚类算法与原始二分K-means相比,在获得相当聚类效果的同时,具有明显效率优势;并行聚类模型在不同数据规模和计算节点数目上具有良好的扩展性.  相似文献   

18.
个性化推荐系统是帮助用户发现内容,克服信息过载的重要工具.为了提高推荐算法的准确率和效率,综合协同过滤推荐算法和K-means聚类算法,设计了一种基于用户特征和评分的精准推荐策略.该策略一方面针对新用户冷启动问题,引入K-means聚类算法对全体用户特征进行聚类,将新用户所属类中其他用户喜好的物品中的Top N个推荐给...  相似文献   

19.
针对现有大数据空间查询处理方法存在执行时间长和查询结果不够准确的问题,提出一种基于动态分布式聚类算法的大数据查询处理方法,该方法分为数据预处理、数据聚类和查询处理3个部分.首先将输入数据划分为多个子集,以RRD格式存储在一组机器节点中;其次采用划分和层次混合动态聚类算法,在Apache Spark平台上对数据进行分布式...  相似文献   

20.
个性化旅游景点推荐是推荐系统的一个重要应用,已被广泛的关注.现有的景点推荐方法聚集在给用户的偏好建模,大都忽略了用户与用户之间的关系以及用户与景点之间的关系.本文提出一种基于社交网络的个性化景点推荐方法,该方法首先使用k-means和DBSCAN算法分别对用户和景点进行聚类;然后将聚类后的用户与景点进行融合,构建个性化旅游景点推荐模型.为了验证本文提出方法的性能,进行了广泛的实验,实验结果显示本文提出的方法在召回率、准确率和平均绝对误差值都明显高于传统推荐方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号