首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
针对传统学位论文评审所存在的问题,提出了一种基于知识图谱的学位论文评审专家的推荐方法。通过论文数据关键词的同义关系和共现关系构建学术领域知识图谱,利用基于TextRank和逆文档频率的方法实现论文和专家的候选关键词提取,采用基于Levenshtein距离的方法实现初始特征向量到图谱节点向量的加权映射转换,并使用基于向量余弦值的方法计算送审论文与评审专家的匹配相似度,最终得到与送审论文最为匹配的评审专家,实现最佳评审专家的推荐。实验中以综合准确率和召回率的F_1指数作为指标,验证了该方法的性能。  相似文献   

2.
针对协同过滤推荐算法没有考虑推荐对象间语义关系的问题,提出一种融合推荐对象语义相似度的改进型协同过滤推荐算法.首先利用知识图谱表示学习算法将推荐对象的语义信息嵌入到一个低维语义空间;然后计算推荐对象之间的语义相似度,把该语义相似度融合到协同过滤推荐算法的相似度计算中,弥补协同过滤推荐算法没有考虑推荐对象自身语义知识的缺陷.实验结果表明,该改进型算法相比传统协同过滤推荐算法,具有更高的准确率、召回率和覆盖率.  相似文献   

3.
语义相似度计算在自然语言理解与处理、信息检索、知识获取、机器翻译等领域具有重要作用.近年来,随着知识本体和知识图谱研究的深入,面向复杂关系处理的结构化知识表达手段更为丰富和强大,从而推动了基于本体的语义相似度计算方法的快速发展.基于本体的语义相似度计算大致分为基于距离的方法、基于信息量的方法、基于属性的方法和混合式方法 4种代表性方法.回顾了上述方法的发展脉络,分析了各自的基本思想和主要实现方法,并对其优缺点进行了系统比较.最后总结了语义相似度的评测方法,并在此基础上,展望了基于本体的语义相似度计算方法的发展方向.  相似文献   

4.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

5.
针对现有上下位关系识别方法未能充分挖掘利用词对共现句中上下位关系语义的问题,提出一种基于依存语义注意力的词对上下位关系识别方法.利用词对共现句最短依存路径的路径向量训练Softmax分类器进行上下位关系识别,引入依存语义注意力机制,构建最短依存路径的注意力权重向量和路径评价函数,更细粒度挖掘和表示不同词和不同路径对上下位关系语义的不同贡献,从而更充分利用精细语义特征实现更准确的上下位关系识别.结果表明:相比HypeNet和NPM等代表性方法,本方法在中文和英文实验数据集上的识别准确率分别可提高2.0%和1.3%,且识别性能更稳定.  相似文献   

6.
针对传统信息量计算方法中仅考虑WordNet内的上下位关系,而未考虑部分整体关系问题,提出一种基于扩展关系的信息量计算方法,并验证了该方法的优越性.应用该方法能改进词语或概念的语义相似度计算结果.  相似文献   

7.
以往的竞价排名算法,大多只考虑搜索关键词与广告的语义相似度,但语义上的相似并不代表提交该查询需求的用户具有购买广告对应产品的意向,也就是说不代表该搜索关键词具有商业价值。本文从搜索关键词的商业价值入手,分析搜索关键词词性、长度以及热门程度等方面的特征与搜索关键词商业价值之间的关系,对推荐搜索关键词和广告商有效投放广告,提供了一些可供考虑的特征,并给出了一定的分析。  相似文献   

8.
传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。  相似文献   

9.
传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。  相似文献   

10.
领域本体中的概念相似度计算   总被引:21,自引:1,他引:21  
借鉴计算语言学中的语义距离思想,提出了RDF Schema构词所描述的本体概念相似度计算方法,并利用该方法对农业知识本体(AO)所描述的部分概念进行了相似度计算和分析.结果表明,该方法可以定量地分析概念、特性之间的相似度,并可以指导基于领域知识本体的语义查询中的概念集扩充和查询结果排序.  相似文献   

11.
基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.  相似文献   

12.
为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover's distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。  相似文献   

13.
为提高文献综合推荐效率,提出一种基于Vague相似性的文献推荐方法。该方法首先利用文献数据库检索用户感兴趣文献,作为待推荐文献集;然后,对文献中的关键词依据提出的方法重新排序、计算关键词的模糊隶属度和关键词转换为Vague值;最后,利用Vague相似性度量文献的相关性,并结合年均下载量和年均引用,对进入推荐集的文献进行推荐排序供用户选择使用。实验表明,该算法不仅利用关键词相似度,还融入了对文献有重要意义的引用数和下载量参数作为推荐参数,综合推荐效果明显。  相似文献   

14.
针对分布式建立与存储的领域本体主题图在融合过程中的语义与结构重复问题以及冗余信息的判断与消除问题,提出了基于语义词典与语料库相结合的主题图融合算法(TMMC),给出了概念相似度计算以及同义关系、整体部分关系等的处理方法.对本体中概念进行基于HowNet语义词典及其他语义词典的多层次相似度计算,定义概念间不同语义关系的融合规则,针对专业领域本体中大量术语词典未收录的问题,提出基于语料库的概念相似度算法,并对计算机教育专业领域扩展主题图进行了融合实验.实验结果表明,TMMC提高了融合的准确率与查全率.  相似文献   

15.
混合语义模型的产品知识文档检索   总被引:1,自引:0,他引:1  
为解决产品知识文档检索过程中遇到的问题,提出一种基于混合语义模型的检索方法.该方法将传统的用户查询需求扩展为用户偏好、语境和用户查询混合而成的语义集合,并对知识文档和用户需求进行基于本体的模糊概念表达.对于知识文档,选择领域本体的叶节点来构造文本概念向量,根据概念在本体图中的深度、携带的信息量,及出现在文档与语料库中的频度来计算权重.同样采用本体表达知识语境与查询语义,建立用户偏好模型.针对检索模型的不同组成,阐述了相应的相似度计算方法,采用概念的语义距离计算用户当前语境和文档语境之间的相似度,用余弦法计算查询语义、用户偏好与文档的相似度.最后用实验验证了该方法的检索效果优于传统的向量空间方法.  相似文献   

16.
为了更好地对新闻和用户进行建模, 将语义相似度模型引入基于内容的推荐系统中, 挖掘两者之间的语义关联。提出一种基于本体结构的相似度模型(OBSM), 利用在线百科构建的本体结构, 计算新闻和用户之间的语义相似度。为了降低本体结构上噪音数据对推荐效果带来的影响, 提出X-Ontology聚类算法对本体结构进行清理, 并衍生出OBSM的升级模型X-OBSM。中文和英文实验表明, OBSM和X-OBSM比基准模型具有更好的推荐效果, 尤其是对本体结构进行清理后, X-OBSM具有比OBSM更高的计算效率。  相似文献   

17.
随着电影网站用户数量以及电影数量的上升,用户评分数据变得极其稀疏,导致推荐系统推荐质量下降。针对这一问题,文章在传统基于项目的推荐算法(IBCF)基础上提出基于共现潜在语义向量空间模型(CLSVSM)的项目评分预测算法。文章先通过CLSVSM得到电影共现矩阵以及电影共现相对强度矩阵,然后利用电影之间的共现潜在关系对评分矩阵进行补全,在此基础上预测用户对未观看的电影评分,进而生成推荐。实验结果表明:与传统的IBCF推荐算法相比,CMLVSMIBCF算法的均方根误差(RMSE)和平均绝对误差(MAE)分别下降17.7%和17.6%。新提出的算法计算出的电影之间的相似度更准确,有效地减小了数据稀疏性对推荐结果的影响,显著提高了电影网站的推荐质量。  相似文献   

18.
为了实现组合服务的查找功能,提出了一种基于语义的组合服务模板推荐算法。用Web服务本体OWL-S和领域本体描述Web服务,将2个服务之间的语义相似度计算转化为加权二部图的最优匹配问题,利用改进的Kuhn-Munkres算法计算服务间的语义相似度;在此语义相似度的基础上提出一种基于语义的组合服务模板推荐算法。实验结果表明,提出的组合服务模板推荐算法可以快速地搜索出满足用户请求的组合服务模板。  相似文献   

19.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

20.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号