首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

2.
基于兴趣度的聚类协同过滤推荐系统的设计   总被引:1,自引:0,他引:1  
协同过滤技术被成功地应用于个性化推荐系统中.随着用户数目和网页数目的日益增加,整个用户矩阵数据极端稀疏并且实时性效果不理想.传统的推荐方法解决不了这些问题.本文结合兴趣度和聚类技术对客户的个人兴趣进行评价,提出了基于兴趣度的聚类协同过滤推荐系统,实验表明,该算法能够有效避免传统方法带来的弊端,提高系统的推荐质量.  相似文献   

3.
针对当前个性化推荐系统处理数据效率较低的问题,提出了一种混合聚类关联规则优化的个性化推荐系统实现方法.深入分析了基于Web网络服务平台的电子商务个性化推荐系统的结构组成,将数据分析与推荐算法实现分为离线和在线处理两部分,阐述了算法初始化、关联实现以及推荐数据集合生成和兴趣模型预测的具体原理,并给出了算法的实现步骤.最后,基于提出的系统构建模型,建立了一种基于混合聚类关联优化的图书网络推荐平台.实验结果表明,该方法具有较高的推荐精度和推荐效率,更适合大数据环境的推荐系统.  相似文献   

4.
数据聚类标签技术是在小规模样本上进行聚类,然后利用聚类结果对其余样本标注类别的方法是提高大规模数据聚类效率的一种有效途径.混合数据是现实应用中最广泛的数据类型,文章将用户兴趣数据作为小规模数据,利用K-prototypes算法对其聚类,在此基础上构建用户兴趣域.利用拟标签数据的各属性值与用户兴趣域分量的关系定义了数据关于用户兴趣域隶属度.基于用户兴趣域和"数据-用户兴趣域"隶属度的概念,提出了一种基于用户兴趣混合数据聚类标签算法UIMCL(User’s Interest Mixed Data Clustering Label).该算法克服了以往数据标签算法只能为拟标记数据指派一个类标签的局限性,可以应用于电子商务的推荐服务和用户行为分析.实验结果表明,该算法对混合数据聚类标签处理有较好的效果.  相似文献   

5.
针对海量新闻的个性化推荐算法进行研究,提出一种改进的推基于K-means聚类的协同过滤用户推荐算法.该算法首先随机初始化了K个质心,按照重新定义过的新的用户相似度公式将用户进行K-means聚类,并选取相似度最大的作为当前用户所属类别;然后再重新定义了质心并进行迭代聚类;最后在每一个用户类里应用基于用户的协同过滤推荐算法,并给用户合理的个性化推荐.仿真实验测试表明,新算法能够提高推荐的准确率,并且有效提高了扩展性.  相似文献   

6.
为提高传统协同过滤算法在个性化推荐系统中的大数据处理能力,研究了一种基于模糊聚类的并行推荐算法。在Hadoop平台下首先通过PCA降维和FCM聚类对用户物品评分矩阵进行预处理,采用皮尔逊相关系数计算用户间的相似度,通过得到的聚类簇集合构建最近邻集合,生成基本预测评分。最后实现算法的并行化处理并得到推荐结果。实验结果表明,与基于PCA降维的协同过滤和单机式传统协同过滤算法相比,该算法提高了推荐的准确性和实时性。  相似文献   

7.
一种基于网格的层次聚类算法   总被引:1,自引:0,他引:1  
传统的凝聚层次聚类算法的时间复杂度为O(n3),由于时间复杂度太高而无法应用到大的数据集.针对这一问题,提出了一种新的基于网格的层次聚类算法,先用基于网格的方法进行一次微聚类,然后再用凝聚的层次聚类算法进行聚类.在进行凝聚的层次聚类时,提出了一种新的簇间距离度量方法,该方法采用簇中权值最高的代表点的最小距离作为簇间的距离.理论分析和实验结果表明,基于网格的层次聚类算法比传统的凝聚层次算法具有更高的效率和正确性.  相似文献   

8.
由于新闻更新快,对用户进行新闻推荐往往需要进行聚类预处理,而传统方法要么复杂度过高,要么依赖于迭代初值,都不能准确而高效地应用于新闻推荐中.针对以上问题,文中提出了一个基于二次聚类的新闻推荐方法,对随机抽样数据进行密度聚类,基于该样本密度聚类的簇数和初始簇心进行所有待推荐新闻的二次快速聚类,并结合时新性、新闻热度等因素实现新闻推荐.文中方法可以将相关新闻聚集在一起,同时又不导致过高的运算开销,并通过参数估计方法计算各因素参数.实验结果表明,与其他新闻推荐方法相比,文中方法具有较好的推荐多样性和推荐准确度.  相似文献   

9.
个性化推荐服务能够为网络用户提供针对兴趣偏好的推荐项目资源,现已被成熟地运用到网站导航、数字化图书馆检索系统、电子商务以及搜索引擎等领域.在研究有关推荐技术以及混合方式后,提出一种基于特定群体的混合推荐算法,其紧密结合了模糊聚类与两种协同过滤技术.实验结果表明,该算法不仅有效地解决了数据集的稀疏性问题,而且在一定程度上改善了推荐结果的质量.  相似文献   

10.
基于改进协同过滤算法的个性化新闻推荐技术   总被引:1,自引:0,他引:1  
针对传统的基于内容协同过滤算法只是依据用户历史访问矩阵向用户做出推荐,存在数据稀疏以及不能及时反映用户兴趣变化等问题,个性化新闻推荐技术在传统的协同过滤算法基础上提出了新闻文本内容相似度的计算方式和时间窗的概念,新闻内容相似度计算中还考虑了特征词的词性和在新闻中的位置的影响,时间窗用来建立适应用户兴趣随时间变化的模型;实验结果表明,改进后的算法有效地改善了新闻用户历史访问数据的稀疏问题,及时捕获用户兴趣,F-measure值相比传统的算法最大提高了11.5%,平均绝对误差值最高下降了8%,显著提高了推荐质量.  相似文献   

11.
针对传统Mashup服务推荐在网络构建方式的成本和计算复杂性过高问题, 提出一种基于半监督层次聚类描述的Mashup服务推荐算法. 首先, 利用网爬工具收集ProgrammableWeb上的Mashup服务信息, 并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式, 以此作为研究分析的数据集; 其次, 为提高聚类精度, 提出一种半监督层次描述聚类算法, 通过植入层次聚类算法顶层核心集方式, 有效解决了传统层次描述聚类因顶层分类集构造失败而影响Mashup服务推荐算法的准确度. 通过在聚类数据集和网爬Mashup服务数据库上的实验表明, 该算法的Mashup服务推荐准确率优于对比算法.  相似文献   

12.
黄欣  余思东  赵志刚 《广西科学》2020,27(1):104-109
针对车载自组织网(Vehicular Ad Hoc Networks,VANETs)拓扑结构经常变化导致通信链路容易断裂而通信质量不可靠的问题,将人工蜂与K-means混合算法应用在VANETs中。在成簇阶段,该混合算法利用人工蜂算法较强的全局搜索能力确定初始聚类中心,代替传统的K-means对初始聚类中心的选择,这样就消除了K-means对随机初始聚类中心的依赖。在簇头选取阶段,类内具有最小的速度方差以及到其他节点最小平均距离的车辆节点被选择为簇头。在簇的维护阶段,当最优节点即簇头有变化时,次优节点被选为临时簇头,直至更新为最优节点的簇头信息。为测试该混合算法的性能,将其和PSO与K-means混合算法、经典K-means算法进行实验对比,结果表明,该混合算法能够更加稳定VANETs通信链路,具有更高成簇质量和更高通信质量。  相似文献   

13.
协同过滤(collaborative filtering,CF)是推荐系统中最常用和最成功的推荐技术之一.现实中的数据往往比较稀疏,用户之间缺少共同评定项目,使一些传统的相似性度量无法进行计算;此外,传统的协同过滤算法忽视了用户偏好问题,这样会造成推荐精度的下降.针对这些问题,从用户全局项目和地方评级信息分析影响用户兴趣偏好的因素,通过计算用户评级信息在全局的概率分布和使用海明贴近度计算用户的兴趣偏好度,利用Jeffries-Matusita距离得出关于用户偏好的相似度算法,将相似度算法与加权的Jaccard相似度算法有效结合,提出了一种在稀疏数据下基于用户偏好的协同过滤算法模型.实验结果表明,提出的模型性能优于传统协同过滤算法,并且在更为稀疏的数据集上也有很高的准确率.  相似文献   

14.
为解决协同过滤方法中面向新用户的冷启动问题,提出基于用户特征的混合Top-N推荐方法.通过对用户特征的聚类分析,获得特征相似用户集,根据目标新用户与不同用户集的距离、用户集对不同项目的评分来预测新用户对项目的评分,并结合传统协同过滤方法进行推荐,最后采用命中率来评价推荐的准确度.实验结果表明,该方法针对新用户有较好的推荐精度.  相似文献   

15.
电力负荷曲线聚类在电力大数据研究中有重要的应用。针对传统负荷聚类方法难以有效处理海量化的高维负荷数据,以及存在簇间样本模糊导致算法聚类质量不高、聚类效率低下等问题,提出一种结合多维缩放(multi-dimensional scaling, MDS)和一种新的集成簇间、簇内欧式距离的加权K-means方法(weighting k-means clustering approach by integrating intra-cluster and inter-cluster distances, KICIC)的聚类算法(MDS-KICIC)。该方法首先采用MDS算法对高维负荷数据进行数据降维处理,得到降维后的低维矩阵和归一化的特征值向量作为KICIC算法的输入矩阵和权重向量,KICIC通过在子空间内最大化簇中心与其他簇数据对象的距离来融合簇内和簇间的距离进行聚类,得到最终聚类结果。通过算例表明该方法运算时间短、聚类质量高,进一步提高了负荷曲线的聚类性能。  相似文献   

16.
大数据空间分析是 Cyber-GIS 的重要方面。如何利用现有的网络基础设施(比如大规模计算集群)对大数据进行并行分布式空间分析仍然是一大难题。为此,提出一种基于 MapReduce 的空间权重创建方法。该方法依托Hadoop 框架组织计算资源,基于 MapReduce 模式从大规模空间数据集中高效创建出空间权重:大空间数据被分为多个数据块,将映射器分布给计算集群中的不同节点,以便在数据中寻找出空间对象的相邻对象,由约简器从不同节点处收集相关结果并生成权重文件。利用 Amazon 公司弹性 MapReduce 的 Hadoop 框架,从人工空间数据中创建基于邻近概念的权重矩阵进行仿真。实验结果表明,该方法的性能优于传统方法,解决了大数据的空间权重创建问题。  相似文献   

17.
提出了一种基于关键原子动作的视频事件学习与识别方法. 通过与或图来表示事件、子事件、原子动作之间的层次结构,以及子事件和原子动作间的时序关系,通过最小描述长度准则从训练数据中学习事件的与或图结构. 在此基础上,提出了一种事件中关键原子动作的学习方法,根据原子动作的重要性赋予相应的权值,该权值可以用于事件的实时解析,提高事件的识别率. 基于原子动作的权值及漏检数目定义了事件的可识别度,用于减少待识别的事件数目,进而提高事件识别的算法效率. 多种场景实验结果表明所提出的方法可以有效地进行事件识别.   相似文献   

18.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

19.
活动社交网络(event-based social networks,EBSNs)为用户提供了方便的组织、参加和分享社交活动的平台,由于冷启动用户/活动缺少丰富的历史数据,EBSNs上冷启动用户/活动的推荐是难点问题.面向EBSNs给出了包含活动、主办方和用户的表示模型,提出了向冷启动用户推荐活动,以及将冷启动活动推荐给用户的模型和基于随机游走的节点重要度计算方法.在分析用户参加活动行为模式的基础上,使用真实的EBSNs平台-豆瓣同城验证所提方法的有效性.提出的向冷启动用户推荐活动方案与群组活动推荐相比,评价指标有了明显的提升.该研究构建的向冷启动用户推荐活动,以及将冷启动活动推荐给用户的模型能有效解决活动社交网络上冷启动用户/活动的推荐问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号