首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统协同过滤算法存在使用信息单一、基础评分数据过于稀疏导致推荐效果不佳等问题,该文提出一种结合知识图谱进行信息强化的协同过滤(KGRI-CF)算法.该算法利用电影的特征数据构建1张关于电影的知识图谱,对用户-评分矩阵进行有条件的填充,有效改善了传统协同过滤算法的数据稀疏性问题.通过对评分数据进行统计与挖掘获取用户的偏好信息,构建了关于用户偏好的知识图谱.利用实体向量化算法将知识图谱中的实体以及关系向量化后计算出用户信息相似度,将其与基于用户的传统协同过滤算法得到的用户评分相似度以一定比例进行融合,从而得到最终的用户相似度,并以此为基础进行评分预测并得到推荐列表.实验结果表明:与传统协同过滤算法相比,该算法能有效地改善数据稀疏性问题,预测结果的精准率和召回率均有显著提升,同时具有较好的可解释性.  相似文献   

2.
基于改进ROCK算法的个性化推荐系统研究   总被引:1,自引:1,他引:0  
王荣  王飞戈  吴坤芳 《河南科学》2011,29(11):1346-1349
分析了ROCK算法的优点和缺点,ROCK算法优点是容易聚类Mushroom等分类属性数据集;缺点是这种算法的相似度函式sim是基于领域专家的直觉.改进的ROCK算法采用Jaccard系数计算相似度,根据相似度的值越大表示对象越相似进行聚类,得到聚类结果,从而实现用户的个性化推荐.  相似文献   

3.
介绍了数据聚类算法,提出了采用基于相似度的聚类算法进行客户分类的思路,给出了相似度的计算方法及客户分类的算法,并通过试验结果证明了算法对客户分类的有效性.  相似文献   

4.
针对文本在聚类或分类时,由于数据高维稀疏导致相似度值低的问题,提出一种基于改进文本相似度计算的聚类方法.首先,利用向量空间模型VSM表示文本,采用余弦函数计算文本之间的相似度;然后,基于网络中节点的相似性传播原理,通过设置阈值找到与各个文本相似度较大的文本集合,进而使用Jaccard系数将两个文本之间相似度计算转化为两个文本集合之间的相似度计算;最后根据得到的文本相似度矩阵,利用谱聚类算法对文本进行聚类.在WebKB上的实验结果表明,与传统的K-means、谱聚类方法相比,该方法提高了聚类的准确度,召回率与F值.  相似文献   

5.
基于向量的相似度计算方案   总被引:15,自引:0,他引:15  
在网络信息检索中,基于文档向量空间的分类、聚类、排序与相关性反馈需要计算相似度。本文就基于向量的相似度计算方案进行探讨,并论述了相似度在文档分类、聚类、排序与相关性反馈中的应用。  相似文献   

6.
苟和平 《科学技术与工程》2013,13(16):4720-4723
针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平均密度,以此获得样本类裁剪的相似度阈值,然后将样本类内相似度小于类相似度阈值的样本进行合并,减少训练样本总数。实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,有效地减少分类计算开销,并能在一定程度上提高少数类的分类性能。  相似文献   

7.
邵琳琳 《科学技术与工程》2013,13(12):3452-3456
针对传统协同过滤推荐算法生成推荐速度慢、推荐质量不高等缺陷,提出了一种基于混合蛙跳模糊聚类的改进协同过滤推荐算法。算法首先利用模糊C-均值(FCM)聚类方法对用户数据进行预处理,得到用户数据聚类中心,有效地降低了推荐工作量。然后选取相似度最优的若干聚类组成候选用户邻居集合,并利用混合蛙跳算法快速地全局寻优能力得到用户最近邻居集合,提高了推荐精度。最后,通过计算预测评分生成推荐结果。仿真结果表明,相比于传统协同过滤推荐算法,该算法在推荐速度和推荐精度上有明显改善。  相似文献   

8.
传统的基于图书和读者的协同过滤方法缺乏语义知识,易混杂不符合读者喜好的噪音数据,从而影响聚类效果和推荐的准确度.针对该问题,提出一种基于K-means的语义协同过滤推荐算法.为了反映读者对图书的偏爱程度,首先定义读者-图书关联矩阵,然后通过K-means聚类算法寻找相邻集合,在聚类过程中兼顾关联矩阵和语义知识,分别计算读者和图书的相似度,最后通过相似程度排序向用户推荐图书.结果表明,该算法在保证计算效率的情况下能显著提高推荐的准确度.  相似文献   

9.
基于用户聚类和项目分类的电影推荐系统构建   总被引:1,自引:0,他引:1  
针对推荐系统中普遍存在的数据稀疏性问题,提出了一种结合项目分类和用户聚类的推荐算法.通过聚类算法将相似的用户聚类在一起形成若干个用户子网,在各个用户子网之间和用户子网中通过信任机制加强子网之间和子网内部的相互关系,根据项目的种类将项目分类,再通过用户对项目的选择计算用户对每种类型项目的大众喜爱度,在每个用户子网中将项目分类和大众喜爱度加权求和得出最终的相似度,由此构造出推荐系统.实验验证了方法的有效性,减小了数据稀疏性对推荐结果的负面影响.  相似文献   

10.
协同过滤推荐算法是目前个性化推荐系统中应用比较广泛的一种算法,但也同样面临着数据稀疏性、冷启动、可扩展性等问题.本文主要针对数据稀疏性问题和冷启动问题导致的推荐效果不精确,提出了一种改进的数据填充方式和相似度计算方法.首先根据用户评分习惯对用户进行层次聚类,其次利用用户基本信息如年龄初步计算用户之间的相似度,并将共同评分项所占比值作为权重得到用户相似度,最后利用Slope-one算法计算前K个相似用户的填充值,加入相似度的权重以获得最终填充值.计算相似度寻找近邻集时,将用户基本属性作为相似度权重,并且引入Sigmoid函数来添加时间戳对相似度的影响,并得到最终的相似度计算方法. 实验结果表明,推荐精度得到了显著提高,数据稀疏性问题和冷启动问题得到了改善.  相似文献   

11.
为了提高餐饮推荐系统的准确率,提出一种基于集合论和图论的餐饮高维非数值型数据聚类算法.首先将菜品数据进行预处理,找出需要的特征,删除不必要的特征,再将这些特征以集合的形式输入到系统中,使用改进的杰卡德相似系数对集合进行相似度计算,得到以集合表示方式的菜品数据间的相似度,接着将所有的数据转换为无向图,最后利用图形聚类算法进行聚类分析.实验结果表明:所提出算法的聚类过程不受噪声影响,具有很好的实用价值.  相似文献   

12.
针对传统协同过滤算法数据稀疏性问题,提出一种基于用户和项目双向聚类的协同过滤推荐算法CFBC(Collaborative Filtering based on Bidirectional Clustering),将评分矩阵从用户和项目两个方向进行聚类,降低数据稀疏性的影响,提出一种改进的相似度计算方法P-J(Pearson-Jaccard)相关系数,提高相似度计算精度。实验证明,相较于传统协同过滤算法,该算法能有效提高推荐准确度。  相似文献   

13.
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销.  相似文献   

14.
K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度.当训练样本过多时,计算代价大,分类效率降低.因此,提出一种基于DBSCAN聚类的改进算法.利用DBSCAN聚类消除训练样本的噪声数据.同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数.实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量.  相似文献   

15.
针对大数据时代下Slope One算法推荐效率不高的问题,提出结合聚类和动态K近邻的双极Slope One推荐算法.首先,结合Canopy和K-medoids的聚类算法把相似的用户汇聚到一起.然后,在所属聚类中,根据用户之间相似度的具体情况动态地寻找最近邻,并用Slope One-BI算法推荐预测.最后,在Spark平台上实现并行化.在电影数据集上的实验结果表明:基于Spark平台的优化算法与其他协同过滤算法相比,推荐精度具有明显优势.  相似文献   

16.
现有的电影推荐系统大多是分析用户评分矩阵,没有考虑电影中的标签信息对推荐结果的影响,造成标签信息利用率较低.针对该问题提出一种基于标签的电影组推荐方法.通过改进的TF-IDF方法得到用户–标签矩阵以及结合时间因素得到归一化的用户评分矩阵,分别计算用户相似度并融合,通过融合相似度进行群组划分.在此基础上计算组成员中电影标签的好评率,根据好评率设置张量初始总权重.根据近似张量值进行群组偏好融合,得到组推荐列表.在MovieLens数据集上进行实验对比,结果表明本方法在准确率上有明显提高,召回率与F值有较大提高.  相似文献   

17.
基于K-medoids项目聚类的协同过滤推荐算法   总被引:1,自引:1,他引:0  
针对传统协同过滤推荐算法通常针对整个评分矩阵进行计算,存在效率不高的问题,提出一种基于K-medoids项目聚类的协同过滤推荐算法.该算法根据项目的类别属性对项目进行聚类,构建用户的偏好领域,使用用户偏好领域内的评分矩阵进行用户间相似度的计算,得到目标用户的最近邻居集,并生成推荐结果.与常用的K-means聚类方法相比,采用K-medoids方法对项目类别属性进行聚类,不仅克服了评分聚类可靠性不高的问题,而且算法还具有更好的鲁棒性.实验结果表明,该算法能有效提高推荐质量.  相似文献   

18.
为提高传统协同过滤算法在个性化推荐系统中的大数据处理能力,研究了一种基于模糊聚类的并行推荐算法。在Hadoop平台下首先通过PCA降维和FCM聚类对用户物品评分矩阵进行预处理,采用皮尔逊相关系数计算用户间的相似度,通过得到的聚类簇集合构建最近邻集合,生成基本预测评分。最后实现算法的并行化处理并得到推荐结果。实验结果表明,与基于PCA降维的协同过滤和单机式传统协同过滤算法相比,该算法提高了推荐的准确性和实时性。  相似文献   

19.
随着我国旅游业发展和人们对旅游服务需求的不断增多,旅游景点的精准推荐不仅可以节约用户大量的时间,还能够提升用户的消费体验,为此本文提出一种基于情境聚类扩展用户画像的旅游景点推荐方法。基于用户情境数据进行情境聚类,构建出扩展的用户画像模型;根据群体用户画像反映的用户特征,结合情境标签设置个体用户情境特征属性,再融合关联规则和相似度计算为用户推荐个性化的景点。实验结果表明,相较于传统的关联规则Apriori推荐算法或加权Apriori推荐算法,基于情境聚类扩展用户画像的旅游景点推荐方法具有更优的推荐结果。  相似文献   

20.
随着大规模网络数据的增加,可扩展性成为推荐系统的一个关键因素,为此提出一种基于并行化谱聚类的协同推荐算法.首先通过并行化改进的谱聚类方法对项目进行聚类;然后在基于用户的协同推荐算法基础上,结合已聚类的项目打分信息,提出一种改进的相似用户计算方法,并进行推荐;最后在数据集上进行测试.结果表明,该算法可以有效降低时间复杂度,推荐精确度和推荐效率也有显著提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号