首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
通过聚类可以缩小用户近邻空间,从而一定程度缓解传统协同过滤推荐算法存在的可扩展性问题,但因部分用户丢失了有效邻居而使得推荐精度不高。为解决该问题,结合三支聚类提出了一种新的协同过滤方法。该方法分为线下聚类和线上推荐两个步骤。对用户先进行聚类,进而将用户划为核心用户和边界用户,并对这两类用户分别应用不同的聚类规则进行聚类;然后在目标用户所属的簇中产生一个预测评分,对属于多个簇的用户,则聚合每个簇的评分得到其预测结果。实验结果表明,该方法与现有基于聚类的协同过滤算法相比,能有效地提高推荐精度。  相似文献   

2.
针对新闻的个性化服务差及推荐效率低的问题,提出了一种新闻事件的分布式混合推荐算法.该算法改进了传统的层次聚类算法用于新闻事件发现,通过协调簇中心距离和簇间最远距离的权重解决了传统层次聚类中的大簇问题;使用混合推荐算法进行事件推荐,引入了事件的多重特征来计算用户兴趣模型,更准确地表示用户的兴趣偏好;采用Spark分布式计算平台实现该算法,可处理大数据的个性化推荐问题.在公开数据集上的实验结果表明本文方法有效.   相似文献   

3.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

4.
DPC算法是一种能够自动确定类簇数和类簇中心的新型密度聚类算法,但在样本分配策略上存在聚类质量不稳定的缺陷.其改进算法KNN-DPC虽然具有较好的聚类效果,但效率不高而影响实用.针对以上问题,文中提出了一种近邻密度分布优化的DPC算法.该算法在DPC算法搜索和发现样本的初始类簇中心的基础上,基于样本的密度分布采用两种样本类簇分配策略,依次将各样本分配到相应的类簇.理论分析和在经典人工数据集以及UCI真实数据集上的实验结果表明:文中提出的聚类算法能快速确定任意形状数据的类簇中心和有效地进行样本类簇分配;与DPC算法和KNN-DPC算法相比,文中算法在聚类效果与时间性能上有更好的平衡,聚类稳定性高,可适用于大规模数据集的自适应聚类分析.  相似文献   

5.
针对海量新闻的个性化推荐算法进行研究,提出一种改进的推基于K-means聚类的协同过滤用户推荐算法.该算法首先随机初始化了K个质心,按照重新定义过的新的用户相似度公式将用户进行K-means聚类,并选取相似度最大的作为当前用户所属类别;然后再重新定义了质心并进行迭代聚类;最后在每一个用户类里应用基于用户的协同过滤推荐算法,并给用户合理的个性化推荐.仿真实验测试表明,新算法能够提高推荐的准确率,并且有效提高了扩展性.  相似文献   

6.
基于K-medoids项目聚类的协同过滤推荐算法   总被引:1,自引:1,他引:0  
针对传统协同过滤推荐算法通常针对整个评分矩阵进行计算,存在效率不高的问题,提出一种基于K-medoids项目聚类的协同过滤推荐算法.该算法根据项目的类别属性对项目进行聚类,构建用户的偏好领域,使用用户偏好领域内的评分矩阵进行用户间相似度的计算,得到目标用户的最近邻居集,并生成推荐结果.与常用的K-means聚类方法相比,采用K-medoids方法对项目类别属性进行聚类,不仅克服了评分聚类可靠性不高的问题,而且算法还具有更好的鲁棒性.实验结果表明,该算法能有效提高推荐质量.  相似文献   

7.
针对推荐算法数据稀疏及聚类中心点敏感问题,提出了一种基于用户偏好和麻雀搜索聚类的协同过滤推荐算法.首先使用评分偏好模型对原用户项目矩阵进行修正,得到新的用户偏好-项目矩阵.利用麻雀搜索对聚类中心点进行优化,从目标用户所在簇内得到最近邻,提高了算法迭代速度,改善了聚类中心点敏感的问题.使用相似度公式对目标用户未评分项目进...  相似文献   

8.
相比其它聚类算法,密度峰值点快速搜索聚类算法(clustering by fast search and find of density peaks,DPC)只需较少的参数就能达到较好的聚类结果,然而当某个类存在多个密度峰值时,聚类结果不理想.针对这一问题,提出一种基于簇边界划分的DPC算法:B-DPC算法.改进算法首先利用一种新的去除噪声准则对数据集进行清理,再调用DPC算法进行首次聚类.最后搜索并发现邻近类的边界样本,根据边界样本的数量和所占比例,对首次聚类结果进行二次聚类.实验证明,B-DPC算法较好地解决了多密度峰值聚类问题,能够发现任意形状的簇,对噪声不敏感.  相似文献   

9.
数据挖掘中基于密度的聚类结构及算法设计   总被引:1,自引:0,他引:1  
聚类分析是数据挖掘的主要技术之一。其中基于密度的聚类可以得到任意形状的聚类结果,从而可以观察到一个并发的、完整的聚类结构。对聚类、数据对象、簇的密度、基于密度的方法和OP TICS中的基本概念进行了描述,在此基础上,明确定义了簇的密度,建立了关于ζ的基于密度的簇、密度度量函数等概念,并设计了获得聚类结构的相应算法且对其进行了复杂性分析。  相似文献   

10.
现有的绝大多数过采样方法着重于寻找少数类样本的边界从而增强样本的可分性,忽略了样本的重叠分布与小析取问题,这导致在过采样阶段产生过多的噪声,最终无法实现对少数类样本的正确分类.针对这些问题,提出一种基于密度峰值聚类和局部稀疏度的过采样算法.首先利用改进的密度峰值聚类算法对全部样本自适应地划分出多个簇,根据簇内样本的不平衡比过滤掉不平衡比过高的簇,然后在筛选出的簇中根据少数类样本的分布情况对各簇的过采样个数进行分配,最后通过样本密度计算出各簇少数类样本的局部稀疏度,从中选择出稀疏度较高的少数类样本参与到最终的合成少数过采样.将提出的过采样算法与八种常用的过采样算法分别与三种基分类器相结合,在18个不平衡数据集上进行对比实验.实验结果表明,提出的算法总体上表现更优,能得到更好的分类性能.  相似文献   

11.
将内容挖掘中的文本分类技术与兴趣衰减相结合,提出了博客潜在好友及博客圈的推荐技术,并进行了推荐系统的原型实现。  相似文献   

12.
目前网络上存在着海量的农业信息,但是对于广大农民来说信息得不到有效的利用,迫切需要对信息进行集成推荐.针对网络上的农业种植方面的文本信息进行了深入研究,该系统首先利用爬虫技术自动地爬取海量农业种植信息,经清洗整理后构建数据集语料库.其次利用机器学习中KNN方法找到每个样本的k近邻对文章进行聚类,通过TF-IDF方法提取出关键词并构造词频矩阵,然后从文本中构建特征向量,进而对相似文档进行分类,最后将加权值经排序后的结果推荐给用户.该系统实现了对农业文本进行准确的自动分类以及自动提取出文章摘要,并对相似文章进行推荐展示的效果.  相似文献   

13.
基于Web内容挖掘的论坛发贴分类推荐技术   总被引:1,自引:0,他引:1  
随着Internet基础结构的不断扩大和其所含信息的持续增长,Internet用户感觉越来越容易在WWW服务中"资源迷向".目前提高用户使用效率的方法有页面预取技术、站点动态重构技术和Web个性化推荐技术等.因为网站的页面内容才是用户真正感兴趣的,本文应用了一种基于Web内容挖掘的文本分类技术来实现论坛中贴子的分类推荐...  相似文献   

14.
现有的新闻推荐模型一般由文本特征提取网络和推荐网络两部分组成。新闻相关的边信息(如类别信息)并没有作用在文本特征提取过程中。在未融合边信息的情况下,文本特征提取网络和推荐网络两部分的优化目标是有差异的。提出SIACNN(Side Information Aggregated CNN)的结构,它通过注意力机制的方式,将边信息结合到文本特征提取中,缩小了文本特征提取和推荐网络之间优化目标的差异,有效提升了新闻推荐的效果。将SIACNN替换多个典型新闻推荐网络中的卷积神经网络,并利用MSN(微软新闻)采集的大型新闻数据集MIND(MIcrosoft News Dataset)来进行实验,通过实验证明了SIACNN能提高推荐效果,并同时具有泛化性。  相似文献   

15.
有效的潜在好友推荐是促进社交网络不断增长的重要途径,对于大规模社交网络环境下的复杂计算问题,文章提出了一种适用于大规模社交网络的潜在好友推荐方法,该方法首先将用户的潜在好友划分为"可能认识的"和"可能感兴趣的"2类,然后分别基于用户共同好友关系拓扑图和Profile文本相似性计算模型进行描述,最后基于MapReduce云计算模型对相关方法进行了设计实现。探讨了云计算环境下的潜在好友推荐系统框架设计、大规模用户共同好友关系拓扑图以及Profile文本相似性计算的方法,并通过实验以及应用实例验证了该方法的有效性以及可扩展性。  相似文献   

16.
现有的各种推荐多样性定义难以体现用户在会话期内推荐项目的多样性,且现有的各种提高推荐多样性的方法通常以牺牲推荐准确率为代价.提出了会话推荐多样性的概念,分析了现有推荐系统会话推荐多样性偏低的主要原因是推荐树中存在过多的重复节点.设计了一种会话推荐列表SRL(sessionrecommendationlist)推荐系统模型,为每个活跃用户建立会话推荐列表,能够有效避免推荐树中出现推荐环路或弱推荐环路.通过MovieLens数据集测试表明,SRL推荐系统模型可以大幅度提高会话推荐多样性,同时也提高了推荐准确率.  相似文献   

17.
为解决因网络信息严重过载而导致用户获取有效信息困难的问题,笔者提出一种混合式网络信息推荐算法。首先为每个用户建立主题模型,同时应用该算法结合牛顿冷却定率平衡时间因素对用户偏好所产生的影响进行分析,再分别通过改进的协同过滤方法和基于内容的推荐方法满足用户对信息的多样性和个性化的需求。通过 实 践 证 明,该 算 法 在 推 荐 的 准 确 率 和 召 回 率 方 面 表 现 良 好,对 用 户 偏 好 的 预 测 效 果 良好,是有效的推荐方法。  相似文献   

18.
推荐技术作为解决情报过载的重要手段,已成为军事情报服务领域的研究重点之一,亟需根据现有研究成果进行总结综述,以期更好地服务于军事情报处理与利用。首先介绍推荐技术的军事应用背景、研究意义,其次,介绍推荐技术的一般框架,并对推荐技术的核心——推荐算法进行了重点综述,分析各类算法的优缺点,以及针对推荐算法应用于军事领域存在的问题给出解决方法;最后根据军事情报其应用特点,提出军事情报推荐技术未来可能研究的热点与方向,从而为后期研究提供依据与参考。  相似文献   

19.
The widespread use of Internet accelerates the rapid development of business to customer electronic commerce. To reduce information overload and help their customers to make better purchase decisions, e-commerce websites are beginning to use online recommendations. This paper compares the effectiveness of three types of online recommendations, the personalized recommendation, best sellers, and consumers’ reviews, which are widely used in e-commerce. This research used a laboratory experiment combined with a questionnaire. This paper also establishes an integrated model of the facts that influence recommendation effectiveness.  相似文献   

20.
数据挖掘技术在商业、工业等领域中的应用已相对成熟,而在高校中的应用仍处于起步阶段。参考数据挖掘在商业领域的应用,针对高校用户特点,从体系建设、算法使用、相关建议等方面,论述了基于数据挖掘的推荐算法在高校课程与图书个性化推荐中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号