首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
数字图书馆个性化服务用户模型研究   总被引:32,自引:0,他引:32  
提出了一种数字图书馆个性化服务用户模型构架,并对实现过程中的几个关键问题,包括用户模型表示方法,用户模型的建立以及更新算法进行了详细论述.提出了基于本体论的空间向量用户模型表示方法,建立了简单的数字图书馆领域本体,以空间向量表示用户模型,以本体概念作为向量的特征项;采用支持向量机分类算法和无监督聚类算法相结合提取用户兴趣;在用户模型更新方法上,采用渐进遗忘和滑动窗口相结合的方法实现用户兴趣概念的漂移.  相似文献   

2.
微博话题推荐算法的作用是当用户面临微博信息过载时,结合用户的基本信息,帮助用户找到对自己有价值的微博话题。微博推荐算法的核心任务是以用户信息为基础,分析用户的偏好,并推荐给其他信息相似的用户。本文提出的基于用户聚类的微博推荐算法包括三个层次,即用户微博话题特征提取、用户聚类、微博话题推荐。实验表明该系统的准确率达到50.2%,可准确地为用户进行微博话题推荐,并提高了用户浏览微博的效率。  相似文献   

3.
利用新用户使用音乐时的上下文环境信息来解决冷启动问题.当用户播放音乐时,提取用户当时场景的时间、天气、状态等信息,利用这些信息构建决策树分类模型.当新用户使用音乐推荐系统时,提取当前情景的上下文信息,根据决策树分支和上下文信息判断新用户的兴趣,向新用户推荐音乐.实验结果表明,当采用上下文相关音乐推荐算法,推荐数目不超过6项时,新用户对推荐结果的满意度超过TopN算法.  相似文献   

4.
用户发布的微博内容能够体现用户兴趣,微博中用户的转发、评论、回复、他人评论等微博行为对用户兴趣具有很强的指导作用。为了有效利用用户微博行为,提出了一种基于有指导LDA(latent dirichlet allocation)的微博内容用户兴趣建模方法。首先通过分析对微博的转发、评论、回复、他人评论这4个因素对用户微博兴趣主题的影响,定义了4种约束关系;然后基于用户微博内容,将4种约束关系融合到LDA 模型中构建有指导的LDA微博主题生成模型,最后得到用户的微博主题分布,从而获得用户兴趣模型。实验结果表明,相比LDA模型,该方法的准确率有很大提高,引入4种信息对微博用户兴趣发现有非常重要的指导作用。  相似文献   

5.
微博转发是微博信息传播的重要途经.影响微博转发的因素主要是用户属性、微博内容、用户社交和用户兴趣.已有的微博转发预测模型仅考虑部分因素,实际上4个因素对用户转发行为都有影响,此外也应该关注预测模型的计算时间.基于此,提出一种基于混合特征和XGBoost算法的微博转发预测模型.首先根据4个因素分别提取用户特征、微博特征、社交特征以及兴趣特征;然后基于PageRank算法计算用户影响力,基于隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)模型和KL距离计算兴趣相似度,定义用户转发活跃度和用户交互影响力的计算公式;最后利用XGBoost算法构建预测模型,对转发预测进行分析.实验结果表明,新的预测方法在准确率和时间等评价指标上有较好的表现,同时也验证了综合考虑4个因素的重要性和有效性.  相似文献   

6.
为了改善目前社交网络中热点信息推荐与个性化好友推荐的不足,提出基于用户投票的推荐机制.首先,根据众多用户对某条信息的投票情况评估信息的热度与价值,将用户对信息的浏览、评论、转发等操作以及时间因素与用户主动性投票相结合,提出基于用户投票的热点信息推荐算法.然后,根据某个用户对众多信息的投票情况评估用户的兴趣,从用户对网络信息的投票以及浏览情况中提取出用户的兴趣度特征,进而提出基于用户投票的个性化好友推荐算法.最后,针对2个算法进行仿真实验,评估各因素对推荐算法的影响和推荐的有效性.实验结果表明,基于用户投票的推荐机制可以有效地进行热点信息与个性化好友的推荐.  相似文献   

7.
从海量无结构互联网信息中提取高质量的社会网络有着广阔的应用前景和较高的学术价值,本文以新浪微博网站作为信息源提取用户之间的共同兴趣网络,在知网文本相似度计算方法的基础上,结合用户特征词的词性分析,提出了一种结合词性的用户相似度计算方法,此方法可以计算用户之间的兴趣强度,进而构建共同兴趣网络。实验结果表明,该方法对用户类别判定的准确率有所提高,对兴趣网络的提取有较好的效果。  相似文献   

8.
以微博为代表的在线社交媒体在预警信息的传播中发挥着越来越重要的作用.该文以灾害应急预警信息为例,从用户的角度出发,分别从利益相关、理性思考和用户兴趣3个方面分析微博用户传播应急预警信息的动机.基于分析结果,提出以地域指数(突发事件是否和用户所在地域相关)和兴趣指数(用户平时转发微博的内容)作为特征变量对用户的预警转发行...  相似文献   

9.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

10.
为了提高微博用户转发行为预测的精度,提出一种有效的基于集成学习的微博用户转发行为预测算法.首先,对影响用户转发的各种特征进行综合分析,提取出用户属性、社交关系、微博内容等影响用户转发行为的特征;然后,采用Logistic回归、支持向量机与BP(BackPropagation)神经网络等机器学习算法对用户转发行为进行预测;最后,利用"加权投票法"的集成学习方法对多个预测结果进行融合.实验结果表明,相对于BP神经网络算法,在综合评价性能的F1度量值上,集成学习算法有1.5%的性能提升.  相似文献   

11.
微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了3.4%,达到0.91。  相似文献   

12.
在微博社交网络中,微博文本内容短小,主题覆盖较少,同时主题变化快,用户兴趣更新频繁。已有用户模型不能完全准确刻画微博用户变化的兴趣。友邻集由用户认知度高的群体组成,友邻集的主题兴趣可以全面反映目标用户的多样化兴趣。利用目标用户的友邻集,在本体用户模型上构建微博用户的友邻主题兴趣集,计算更新友邻主题兴趣度,提出友邻-用户模型的实现算法。实验表明,在微博社交网络平台中,友邻一用户模型的微博主题推荐精度要优于传统的用户模型。  相似文献   

13.
鉴于电子商务网站推荐系统的需要,将用户兴趣分为长期兴趣和短暂兴趣,并提出一种基于长期兴趣和短暂兴趣的用户偏好表示法.利用web服务器数据库的数据,采用无监督学习方法,对用户注册信息进行挖掘,提取出用户长期兴趣.基于向量映射,对web服务器日志上的用户使用记录数据和内容数据进行分析,提取用户短暂兴趣.通过用户反馈信息修正"粗糙"用户偏好文档,使得用户偏好文档更新得以实现.最后,应用了实证案例验证了该方法的合理性和有效性.  相似文献   

14.
信息推荐技术能够帮助用户从海量网络信息中提取有用信息,因而得到研究者的广泛关注。通过建立用户隐式特征兴趣模型,即将用户-行为矩阵分解为用户-隐式兴趣-行为矩阵,在充分挖掘用户隐式兴趣的基础上,研究并实现了基于隐式特征兴趣模型的协同过滤算法。在Movielens语料集上进行测试的结果表明,隐式特征能够更加精准地表述用户兴趣,有效提升信息推荐性能。  相似文献   

15.
微博的使用人群数量基数大,状态信息更新频繁并且信息传播迅速,因此对微博平台上信息的挖掘具有重要意义,但是由于微博数据的海量性、突发性以及微博格式的不规则性,加大了采集数据的技术难度.在分析对比了基于Cookie爬虫微博数据采集方法和基于API接口微博数据采集方法的基础上,提出了一种基于用户影响力的微博用户信息采集方案.将每一个API调用封装成一个Task类嵌入到具有模拟登陆功能的爬虫程序中,通过贝叶斯-Pagerank算法量化微博用户之间的关注关系得到用户的影响力值,依据用户影响力值决定爬取顺序,可以在有限的时间内采集到更多有价值的节点信息.实验结果表明该方案在微博数据采集的效率与性能上都有较大提高.  相似文献   

16.
为了提高推荐算法在对少数类用户进行推荐时的时效性、准确性,提出一种面向少数类用户兴趣演化的推荐算法.该文算法将时间窗口、指数衰减函数和带有时间效应的用户项目交互信息3个因素相结合,描述出不同用户对不同项目类型的兴趣倾向值.通过改进的K-means算法对用户进行分类,并对聚类结果中近邻数量极少的类用户(少数类用户),使用...  相似文献   

17.
社交网络服务每天产生大量涉及众多话题的信息,并在影响力各异的用户群体推动下广泛传播。在IP(influence passivity)算法的基础上,提出了一种综合话题相似性与信息时效性的影响力用户发现算法EIP(extended influence-passivity)。该算法在转发网络上考虑用户间话题的相似性以及博文信息时效性,更加精准地建模和计算用户的影响力和消极性。基于新浪微博上爬取的约10万用户数据集上的实验验证,EIP影响力度量算法优于IP和TwitterRank等现有方法。  相似文献   

18.
针对传统的PageRank算法中存在主题漂移和偏重旧网页的弊端,提出了一种基于改进PageRank算法的微博用户影响力排序方法——TSPR算法.该算法将时间因素作为横向标度,采用TF-IDF方法计算网页间的相似度,并具体分析某个时间段用户搜索主题相似度的变化.通过计算网页PR值的大小,从而对微博用户影响力进行排序.仿真实验结果表明,该算法改善了微博用户影响力排序效果,与此同时,提高了搜索质量和准确率.  相似文献   

19.
针对现有微博社区发现的准确性与效用性问题,提出了一种高效的基于用户内容相似度的微博社区发现算法。首先对微博用户兴趣模型进行分析,进而挖掘微博意见领袖,通过AP算法对意见领袖进行兴趣聚类,以聚类结果为社区中心结合模块度优化算法完成微博社区发现。经实验验证了该方法可以更好地发现微博社区结构。  相似文献   

20.
利用迁移学习的方法, 融合京东问答平台数据与少量已标注的微博数据构建训练集, 提出一种基于注意力机制的双向长短期记忆神经网络(Attentional-Bi-LSTM)模型, 用于识别用户的隐性消费意图。针对显性意图识别问题, 提出一种结合TF-IDF (term frequency-inverse document frequency)与句法分析中动宾关系(VOB)的消费意图对象提取算法。实验结果表明, 通过将迁移京东问答平台的数据与微博数据相融合, 可以有效地扩充训练集, 在此基础上训练的神经网络分类模型具有较高的准确率和召回率; 融合VOB和TF-IDF的显性消费意图对象提取方法的准确率达到78.8%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号