首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 39 毫秒
1.
针对传统协同过滤算法用户相似度计算准确度低的问题,在推荐系统中引入项目属性信息和项目标签信息,提出融合标签和属性信息的混合推荐算法。首先将用户对项目的评分转化为用户对项目属性值及标签的评分,构建用户-属性值偏好矩阵和用户-标签偏好矩阵,将其作为用户描述文件;然后分别根据用户-属性值偏好矩阵和用户-标签偏好矩阵计算用户之间的相似性,并将结果加权平均,得到每个用户的最近邻居列表;最后根据邻居对项目的评分产生推荐结果。由于项目属性值的数量和主要标签数量远低于项目数量,该算法能有效解决协同过滤算法的数据稀疏性问题,同时也能更直观地描述用户的偏好。而且在构建用户描述文件时,考虑到用户偏好随时间变化的规律,对用户不同时间点的评分赋予不同的权重,权重随着时间推移逐渐增大。实验结果表明,该算法能更准确地预测用户对未评分项的评分,提高推荐的准确度和召回率。  相似文献   

2.
为了从文本中可以更加准确地分析其蕴含的内容,给人们的生产生活提供建议,在基于深度学习的传统多标签分类方法的基础上,提出一种融合多粒度特征和标签语义共现的多标签分类模型。该模型利用双向长短时记忆网络双向长短时记忆网络(bidirectional long short-term memory network, Bi-LSTM)提取多粒度的文本特征,获得不同层次的文本特征;并通过计算pmi的方式构建标签关系图,利用图卷积网络(graph convolution network, GCN)深入提取标签的隐藏关系,获得具有标签信息的文本表示;最终融合多粒度文本特征,进行多标签文本分类。在AAPD和news数据集上进行实验。结果表明:所提出模型的Micro-F1值分别达到0.704和0.729,验证了模型的有效性。  相似文献   

3.
针对一词多义现象, 提出一种基于上下文规则的词义消歧算法(CR-WSD), 该算法以定义消歧规则的方式确定多义词在文本中的具体含义, 利用WordNet中知识结构和上下文关系进行语义选择, 完成词义消歧. 用Senseval 3中的全文作为测试集, 实验结果表明该算法能有效地实现词义消歧.  相似文献   

4.
基于领域知识和词向量的词义消歧方法   总被引:3,自引:0,他引:3  
利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。  相似文献   

5.
传统的中文词义消歧方法是通过观察文本的上下文信息、词性等显性特征建立消歧模型,本文通过对歧义产生原因进行深入的分析,发现词语之间隐含的语法结构、语义信息等也会导致歧义的产生,可以考虑将这些信息加入消歧模型进行消歧。由于《知网》知识库中对词语之间的搭配信息进行了总结,本文借助《知网》提取训练语料库所获取的词语搭配信息的隐性语义特征,结合显性的上下文特征,采用条件随机场的方法进行词义消歧。最后,通过实验进行词义消歧和效果验证,结果表明:本文采用的方法与传统的条件随机场消歧相比,词义消歧的准确率得到了提高。  相似文献   

6.
在机器翻译涉及的技术很多.其中,语言消歧就被列为机器翻译最为急迫解决的问题之一.本文的的工作首先对语言歧义的问题进行分析。然后论述一些具体消歧方法.  相似文献   

7.
传统的图像标签推荐方法通过对图像视觉内容的分析计算标签与图像的相关度,完成标签推荐任务.而社会网络图像具有丰富的元数据,例如图像所属群组、地理位置等,充分利用这些元数据对于提高标签推荐的准确性具有积极意义.提出一种基于二分图的个性化图像标签推荐算法,通过充分挖掘图像、群组、地理位置与标签的关系,针对用户提供的少量标签进行个性化图像标签推荐.该算法建立了图像-标签、群组-标签、地理位置-标签等三个二分图模型,考虑到每个标签的重要性不同,引入TF-IDF(Term Frequency-Inverse Document Frenquency)技术对标签进行加权处理.利用二分图将初始标签分值进行信息扩散,计算出最终标签分值向量,并将该向量中分值较高的标签作为推荐结果.实验结果表明,融合了图像与群组、地理位置等元数据的个性化图像标签推荐结果的NDCG(Normalized Discounted Cumulative Gain)值优于仅单方面考虑图像、群组以及地理位置的标签推荐结果.  相似文献   

8.
本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.  相似文献   

9.
基于语境计算模型的汉语词义消歧   总被引:1,自引:1,他引:1  
提出利用相对词频(Relative Word Frequency,RWF)来评估词语之间搭配强度。基于相对词频,提出语境计算模型,用于对汉语文本词义进行消歧。选择3个常用多义词进行试验,结果验证了该方法的有效性。  相似文献   

10.
考虑了实体的全局一致性,充分利用了知识库中实体间结构化的语义信息.在PageRank算法的基础上,提出一种基于双向语义关联的实体消歧算法,该算法通过在维基百科中抽取出实体之间的超链接关系构建知识图谱,重新定义两个实体之间的平均最短路径,并联合实体之间的语义信息以完成实体链接消歧的任务.在公开数据集上进行的实验结果显示:该算法能提高实体消歧结果的准确率和召回率,实验结果优于当前主流算法.  相似文献   

11.
汉语的歧义分布在语言的不同层面上,从词形变化到句子结构都存在歧义.针对汉英机器翻译不同阶段遇到的歧义问题,采用了隐马尔柯夫模型和贝叶斯分类法来进行排歧.实验表明:基于统计的多步消歧策略在汉英机器翻译系统中具有较高的排歧准确率.  相似文献   

12.
基于热传导或物质扩散理论的推荐算法首先利用网络结构得到对象间推荐关系,然后根据对象间关系预测用户喜欢的对象,而忽略了用户偏好。为了弥补这个缺陷,根据用户已选择对象的标签,利用TF-IDF方法构建用户偏好模型,以用户在预测对象标签上的平均偏好作为对该对象的偏好程度,采用加权方法与现有基于网络推荐算法混合运算。经在基准数据集MovieLens上测试表明,通过与目前效果最好的几种基于网络推荐算法进行加权混合运算,推荐结果在推荐精度、个性化、多样化等多种评价指标方面均比原有算法有明显提高。  相似文献   

13.
    
The tag recommendation system is a series of tags that are most likely to be used to tag a resource for the target user. Currently, the Tucker decomposition model has better prediction quality than the traditional FolkRank algorithm, but it has high time complexity and is difficult to apply to large and medium-sized data sets. Although the time complexity of the regular decomposition model is linear, its prediction quality is not high. To solve these problems, firstly, the paired interaction tensor decomposition model PITD on the basis of improving the Tucker decomposition model is proposed. The model considers only some of the two-to-two interactions between the three characteristics of users, resources, and tags, reducing the impact of irrelevant information on model performance and efficiency. Then, the PITD model is deduced by Bayesian personalization method, and the corresponding optimization algorithm is designed. Finally, extensive experiments on real data sets show that the PITD model has better recommendation performance than the comparison algorithm.  相似文献   

14.
针对开源npm(node package manager)社区标签机制不完善的问题, 提出一种自动为开源第三方库npm包推荐标签的方法. 首先, 根据npm社区中现有标签间的关联关系对标签聚类, 在解决标签同义词问题的同时建立标签库; 其次, 利用词向量技术计算npm包的eadme文档与标签库中标签的语义相关程度; 最后, 根据相关程度对标签进行排序, 生成标签推荐列表并完成标签推荐. 实验结果表明, 该方法可有效地为npm包推荐标签, 准确率Recall@3为49.1%, Recall@5为56.3%, Recall@10为66.9%.  相似文献   

15.
Chinese multi-document personal name disambiguation   总被引:2,自引:0,他引:2  
This paper presents a new approach to determining whether an interested personal name across doeuments refers to the same entity. Firstly,three vectors for each text are formed: the personal name Boolean vectors denoting whether a personal name occurs the text the biographical word Boolean vector representing title, occupation and so forth, and the feature vector with real values. Then, by combining a heuristic strategy based on Boolean vectors with an agglomeratie clustering algorithm based on feature vectors, it seeks to resolve multi-document personal name coreference. Experimental results show that this approach achieves a good performance by testing on "Wang Gang" corpus.  相似文献   

16.
传统的Mashup服务推荐是基于关键字的检索方法,对于所推荐API服务的社会和功能属性利用较少,不利于全面评价所推荐API的适用度,对此提出一种多属性融合评级的Mashup服务推荐算法.首先,利用网爬工具收集ProgrammableWeb上的Mashup服务信息,并采用后缀剥离算法把Mashup服务的标签信息修改为名词形式,以此作为研究分析的数据集.其次,融入API服务的社会和功能等多属性对API模型进行扩充,并采用多属性相似度加权融合的方式对候选API的适用度进行评价,以此作为API服务推荐的依据.实验结果表明,多属性融合评级Mashup服务推荐算法具有更高的正确率和更快的运算时间,是可行有效的.  相似文献   

17.
裂缝在地震数据中的特征可视为一种纹理,因此可以使用纹理属性表征裂缝,基于纹理属性聚类分析方法对裂缝发育带进行预测。计算地震数据体不同灰度级和不同三维数据基元大小的体共生矩阵,以此提取多组纹理属性,并进行对比和优选,最后使用模糊C均值聚类法对优选的纹理属性进行分析,根据聚类结果对裂缝的分布范围进行预测。方法减少了人工预测裂缝的主观性,而且从多个方面表征裂缝来提高预测结果的可信度。对野外数据进行分析,其结果表明分析获得的裂缝预测范围与勘探结果具有较高的吻合度。  相似文献   

18.
基于个性化Web信息推荐模型的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对目前的推荐系统存在个性化程度不高,提出了一种采用语义Web的个性化Web信息服务模型,并对模型实现的关键问题进行分析研究.实现了个性化需求库和个性化资源库的语义构建,个性化程度更高、更智能.实验证明,该模型是有效的.  相似文献   

19.
基于用户浏览行为挖掘的电子商务个性化推荐系统   总被引:6,自引:0,他引:6  
本文介绍了电子商务个性化推荐系统,在此基础上提出了一种新的基于用户浏览行为进行数据挖掘的个性化推荐系统模型,并给出了详细的挖掘流程及实现算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号