首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于PLSA方法的用户兴趣聚类
引用本文:陈冬玲,王大玲,于戈,于芳.基于PLSA方法的用户兴趣聚类[J].东北大学学报(自然科学版),2008,29(1):53-56.
作者姓名:陈冬玲  王大玲  于戈  于芳
作者单位:东北大学,信息科学与工程学院,辽宁,沈阳,110004
摘    要:为了在个性化搜索过程中能够准确地挖掘到用户的潜在兴趣并进行相应的聚类分析,提出采用潜语义空间的Zipf分布的特性,并结合PLSA(概率潜在语义分析)来获取全文的语义.即先通过Zipf分布原理找到文档的潜在语义空间,在此空间中对用户的兴趣进行聚类,并建立用户兴趣描述文件(user profile),即建立用户兴趣层次树.实验表明,所提出聚类算法的聚类效果明显优于传统的VSM(向量空间模型)的聚类效果,同时,在著名的CTI数据集上的个性化推荐实验结果也充分说明基于潜在语义空间构建的用户兴趣描述与用户真实兴趣相符合.

关 键 词:用户兴趣描述文件  PLSA  潜语义空间  Zipf分布  用户兴趣层次树  
文章编号:1005-3026(2008)01-0053-04
收稿时间:2007-01-30
修稿时间:2007年1月30日

User Interests Clustering Based on PLSA
CHEN Dong-ling,WANG Da-ling,YU Ge,YU Fang.User Interests Clustering Based on PLSA[J].Journal of Northeastern University(Natural Science),2008,29(1):53-56.
Authors:CHEN Dong-ling  WANG Da-ling  YU Ge  YU Fang
Institution:(1) School of Information Science and Engineering, Northeastern University, Shenyang 110004, China
Abstract:
Keywords:PLSA
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《东北大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《东北大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号