首页 | 本学科首页   官方微博 | 高级检索  
     

用于稀疏数据集的协作过滤算法
引用本文:董丽,邢春晓,王克宏. 用于稀疏数据集的协作过滤算法[J]. 清华大学学报(自然科学版), 2009, 49(10): 1725-1728
作者姓名:董丽  邢春晓  王克宏
作者单位:清华大学,计算机科学与技术系,北京,100084;清华大学,图书馆,北京,100084;清华大学,信息技术研究院,北京,100084;清华大学,计算机科学与技术系,北京,100084
基金项目:国家“八六三”高技术项目(2006AA010101);;国家“十一五”科技支撑计划资助项目(2006BAH02A12)
摘    要:稀疏性问题是协作过滤算法应用中的一个突出问题,当系统中用户对资源的评分数据集很稀疏的条件下,算法的精度和覆盖率会显著降低。针对这一问题,该文通过分析影响基于资源的协作过滤算法中的相似性计算的因素,提出采用资源关系密度作为描述协作过滤评分矩阵的一个特征指标,分析并总结了资源关系密度对典型的基于资源的协作过滤算法的影响,进而提出一种虚拟用户填充算法。实验结果表明,虚拟用户填充法能够有效改善典型的基于资源的协作过滤算法在稀疏数据集上的精度和覆盖率。

关 键 词:协作过滤  稀疏性问题  资源关系密度  虚拟用户填充

Collaborative filtering algorithm for sparse data sets
DONG Li,,XING Chunxiao,WANG Kehong. Collaborative filtering algorithm for sparse data sets[J]. Journal of Tsinghua University(Science and Technology), 2009, 49(10): 1725-1728
Authors:DONG Li    XING Chunxiao  WANG Kehong
Affiliation:1.Department of computer Science and Technology;Tsinghua University;Beijing 100084;China;2.Tsinghua University Library;3.Research Institute of Information Technology;China
Abstract:This paper presents an algorithm to improve the performance of item-based collaborative filtering algorithms working with sparse data sets.The factors impacting the correlation calculation in item-based collaborative filtering algorithms were analyzed to develop an item relationship density as an important characteristic for describing the rating matrix,the effect of the item relationship density on item-based collaborative filtering is then illustrated.The item relation density is then used to develop a vi...
Keywords:collaborative filtering  sparse problem  item relation density  virtual user filling  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号