首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
针对多数据源的融合应用,构建了基于多数据源的知识图谱.首先,对不同领域内的数据源构建相应本体库,并将不同本体库通过数据融合映射到全局本体库;然后,利用实体对齐和实体链接方法进行知识获取和融合;最后,搭建知识图谱应用平台,提供查询和统计等操作.在实体对齐方面,利用传统的基于相似性传播实体对齐方法,获得良好的实体对齐效果;在实体链接方面,提出了基于约束嵌入转换的预测推理方法,实验结果表明,在预测准确率上取得较好的结果.  相似文献   

2.
针对Trans系列的知识图谱表示与推理模型在训练的过程中,随机构造正负例三元组样本进行训练,没有考虑替换的实体与原实体之间存在的相似度差异度关系,导致模型无法识别实体之间的相似度,效果低下。在TransH模型的构建基础上,采用单层神经网络的非线性操作来精确刻画实体和关系之间的语义信息,同时创新性地加入了正、负三元组之间的头/尾实体之间的差异度信息,用于校正正、负三元组样本之间的联系,使模型能够辨别替换的实体与原实体间的相似度,进而提出了mTransH模型。实验证明:mTransH模型在知识图谱的链接预测任务中,提高了模型对正例样本的辨识度,从而提高知识推理的链接预测准确率。  相似文献   

3.
采用半自动化的方法构建中文影视知识图谱。以国内影视领域数据为研究对象,对豆瓣网、百度百科和时光网的数据进行本体对齐,使异构数据源语义描述一致。在知识融合方面,借鉴并优化了Similarity Flooding算法的核心思想,实验结果表明,实体匹配的准确率基本保持在85%以上。建立了中文影视知识图谱可视化平台,并提供开放性的数据访问和查询接口。  相似文献   

4.
针对传统协同过滤算法存在使用信息单一、基础评分数据过于稀疏导致推荐效果不佳等问题,该文提出一种结合知识图谱进行信息强化的协同过滤(KGRI-CF)算法.该算法利用电影的特征数据构建1张关于电影的知识图谱,对用户-评分矩阵进行有条件的填充,有效改善了传统协同过滤算法的数据稀疏性问题.通过对评分数据进行统计与挖掘获取用户的偏好信息,构建了关于用户偏好的知识图谱.利用实体向量化算法将知识图谱中的实体以及关系向量化后计算出用户信息相似度,将其与基于用户的传统协同过滤算法得到的用户评分相似度以一定比例进行融合,从而得到最终的用户相似度,并以此为基础进行评分预测并得到推荐列表.实验结果表明:与传统协同过滤算法相比,该算法能有效地改善数据稀疏性问题,预测结果的精准率和召回率均有显著提升,同时具有较好的可解释性.  相似文献   

5.
与现有的根据知识图谱的结构信息或实体属性特征进行相似度匹配的实体对齐的方法不同,提出了一种基于表示学习的知识图谱实体对齐方法.首先,在低维向量空间下,通过机器学习方法学得实体和关系的语义表示,这种表示形式蕴含了知识图谱的内在结构信息及实体属性特征;其次,将人工标注的实体对作为先验知识,学习知识图谱间实体对的映射关系.经实验验证表明:与基于特征匹配的方法SiGMa相比,本文方法能够有效提高知识图谱实体对齐的精确率,同时保持较高的F1值.  相似文献   

6.
知识图谱技术在信息检索、智能问答领域有着重要作用.为了解决大型知识图谱中的有效实体缺失问题,需要使用链接预测手段自动预测实体之间缺失的链接,完善知识图谱中缺失的实体.现在有许多链接预测的方法,其中基于神经网络的Grail模型侧重于对局部子图进行推理,具有很强的归纳倾向,但在语义层次建模方面存在不足.因此,提出了Grail&HAKE融合模型,通过将Grail模型与HAKE模型进行融合,解决了Grail模型在语义层次建模方面存在的不足.实验结果表明,Grail&HAKE的融合模型比单独使用Grail和HAKE模型的MRR值分别高出0.100 5和0.306 3,并且在部分数据集上优于其他融合模型.说明Grail&HAKE融合模型在知识图谱的有效实体链接预测方面是有效可用的.  相似文献   

7.
提出了一种异构数据源的实体模式匹配算法.算法从中英双语的环境出发,利用基于中文wordnet的中英文词义相似度算法和中文分词工具,从列名距离、数据类型、数据内容的词性成份等角度来建立同类实体不同模式之间的映射关系.该算法可用于分析数据空间中不同数据源实体之间的关联,以及其他研究领域中的中英文语义信息相关性分析和实体模式匹配.  相似文献   

8.
为了克服当前图像匹配方法主要通过测量距离的方法来实现图像匹配,忽略了图像间的相似度,导致算法存在错误匹配较多以及鲁棒性较差的问题。本文提出了基于相似度模型耦合角度制约规则的图像匹配算法。采用FAST检测方法对图像特征进行检测,快速获取鲁棒特征点,以改善算法的匹配正确率。随后,利用SURF特征描述机制,通过计算特征圆域内的Haar小波响应值,对特征点进行描述。引入结构相似度SSIM(structural similarity index measurement)模型,将其与欧氏距离模型相结合,构造相似度模型,从结构相似度与测量距离两方面出发,将特征点进行粗匹配。最后,利用特征点的余弦关系,求取特征点间角度,建立角度制约规则,对粗匹配结果完成优化。实验结果显示:与典型的匹配方法相比,该算法具有更好的匹配性能较好,在多种几何变换下仍具有理想的匹配精度。  相似文献   

9.
提出基于双语合成语义的翻译相似度模型, 通过在翻译过程中引入双语语义相似度特征提高翻译性能。首先利用分布式方法分别在源端和目标端获取短语的单语合成语义向量, 然后利用神经网络将它们映射到同一语义空间, 获得双语合成语义向量。在该语义空间, 计算源语言短语和对应的目标语言短语之间基于合成语义向量的翻译相似度, 将其作为一个新特征加入解码器。在汉英翻译NIST06和NIST08测试数据集上, 相较于基准系统, 基于双语合成语义的翻译相似度模型获得0.56和0.42 BLEU值的显著性提高。  相似文献   

10.
为提高软件项目案例相似度算法的精确度,在分析传统的基于匹配函数的相似度算法基础上,结合软件项目案例的特点,建立了基于神经网络的软件项目案例相似度算法模型,通过对已完成项目案例学习,模型自动计算案例各个特征之间的权重,解决了人为给定特征权值的主观性,使软件项目案例相似度的更加准确,为软件项目相似案例搜索提供依据.  相似文献   

11.
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务, 使用CCF提供的新浪微博数据作为训练和测试数据, 利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具, 提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法, 提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF 中文微博实体链接评测任务中正确结果的准确率为0.8838, 在10 个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。  相似文献   

12.
实体解析是指识别同一实体的不同描述形式的过程, 旨在保障数据质量, 是数据清理、数据集成及数据挖掘中的关键技术. 随着电子商务的不断发展和成熟, 商品的多样性和消费者灵活的购买方式, 使得对网络商品的精确识别和匹配成为大数据时代亟待解决的问题. 与传统实体解析主要针对结构化数据不同, 网络数据具有非结构化、异构和海量的特性, 为此设计了综合相似度算法(synthesized similarity method, SSM)来计算网络商品数据间的相似度, 同时引入凝聚的层次聚类框架, 以匹配来自不同数据源的异构商品. 此外, 为了解决大数据环境下对执行效率的要求, 从字符串相似度缓存、约束知识库和分块策略三个方面对SSM进行优化, 基于真实数据集的实验结果验证了SSM的执行效率和有效性.  相似文献   

13.
讨论电影语言本体问题既可以从结构主义视角加深对电影本身的理解,也是以后结构主义理论阐释电影的门径和基础。电影语言本体论的核心观点是“电影即没有语言系统的语言”。电影可以被隐喻性地称为语言,但在电影中不存在天然语言中的记号系统或结构。电影是部分的和欠缺记号的系统。电影的影像充满丰富讯息,其内涵丰富但符码却很贫弱,其系统也十分简单。不同于天然语言的语法,电影语言的语法特征表现在叙事内的陈述中。电影语言能指和所指的表意功能被归为电影修辞格,同时即文化修辞。  相似文献   

14.
命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。  相似文献   

15.
The multi-signature method can improve the accuracy of entity resolution. However,it will bring the redundant computation problem in the parallel processing framework. In this paper,a multisignature based parallel entity resolution method called multi-sig-er is proposed. The method was implemented in MapReduce-based framework which first tagged multiple signatures for each input object and utilized these signatures to generate key-value pairs,then shuffled the pairs to the reduce tasks that are responsible for similarity computation. To improve the performance,two strategies were adopted. One is for pruning the candidate pairs brought by the blocking technique and the other is for eliminating the redundancy according to the transitive property. Both strategies reduce the number of similarity computation without affecting the resolution accuracy. Experimental results on real-world datasets show that the method tends to handle large datasets rather than small datasets,and it is more suitable for complex similarity computation as compared to simple similarity matching.  相似文献   

16.
属性相似度的准确性是影响实体分辨准确程度的重要因素之一.为提高属性相似度的准确性,分析了属性相似度与函数依赖的关系,给出了属性相似度调整原则,提出了依据函数依赖进行相似度划分、相似度传递调整和计算相似度调整代价的方法,提出了通过属性相似度调整提高属性相似度准确性的属性相似度传递调整算法.实验结果表明,该算法能够更好地区分匹配记录对和不匹配记录对,获得更高的查全率、查准率和F1值.  相似文献   

17.
影片《三峡好人》讲述了在三峡拆迁的真实历史影像中两个虚构的故事,采用独特而新颖的表现方法与叙事视角,纪录了三峡拆迁过程中底层人民的生存状态和生命追求.文章从叙事结构、主题阐释、电影语言、结尾叙事四个方面分析了该影片独具匠心的叙事策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号