排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
基于网络浏览行为,研究小众领域的用户画像建模方法.本文提出构造领域文本伪本体的方法,并从用户的网络浏览行为中挖掘用户兴趣,生成了基于领域兴趣的用户画像,随后将构建的用户画像应用于个性化推荐领域,解决了小众领域因用户量少、信息不足而难以精准刻画用户画像的问题.该方法在以下三方面显著不同于其他相关研究工作:1)基于领域文本快速构建领域伪本体,构建基于伪本体的用户画像建模方法;2)采用词向量将网页映射到伪本体,构建画像生成算法;3)基于领域概念间相似度构建画像优化算法.最后,本文使用了交响乐团的售票数据及用户的网络浏览数据,采用多个指标进行实证分析,验证了本文提出的画像建模方法的有效性与合理性. 相似文献
2.
针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSC-SN(text soft classifying based on similarity threshold and non-overlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSC-SN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类. 相似文献
1