首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
针对公安多数据源数据融合分析过程中常出现不同数据源中同一实体对象存在不同关系描述的情况,提出了一种结合实体关系时间属性权值和数据源权重的实体关系真实度计算算法,以数据源为基准单位,实现了对多数据源融合的实体关系关联度计算和有效性分析。实验结果表明,此算法能有效降低数据融合过程中带来的实体关联值计算偏差,提高实体关系之间发现的实时性和准确率,提升数据资源的情报价值。  相似文献   

2.
一个web信息集成系统一般包含以下几个部分:领域模型构建,数据抽取,模式匹配和实体统一等.目前对与模式匹配和实体统一的研究都是各自独立的,但这两部分是相互关联的.笔者提出了一种通过模式匹配促进实体统一的新思路,并提出了基于这种思路的SMPER算法,该算法充分利用模式匹配和实体统一的关联性,使得查准率和查全率得到有效提高,从而验证了通过模式匹配促进实体统一这一新思路的正确性和可行性.  相似文献   

3.
专家实体主页识别是专家检索的一个重要的组成部分,本文提出了一种基于J48的机器学习算法来对中文专家实体主页进行分类识别.首先,人工收集中文专家实体及对应的专家主页面2 113个,针对中文专家实体特点,定义与链接和网页内容特征相关的专家实体特征,并对这些特征进行提取,形成训练数据集.然后,采用不同学习算法对在不同特征上的...  相似文献   

4.
模式匹配的一种新方法   总被引:1,自引:0,他引:1  
为找出模式匹配中数据源模式和一个全局模式之间的模式对应关系、实例转换和语义映射等 ,采用框架方法来描述待匹配的两种模式 .应用多Agent系统中的Matchmaking方法 ,对框架中的不同槽的内容采用不同的匹配处理 ,是比较新颖的模式匹配方法 .  相似文献   

5.
分析了几种常用的模式匹配算法,提出一种适合于中文的基于KMP的改进算法,即双向比较模式匹配算法.该算法以KMP算法为基础,引入特征数组以记录模式串尾字符在模式串中出现的位置信息,从而获得模式串在匹配过程中的最大移动距离和最少比较次数.实验结果表明,双向比较模式匹配算法可有效降低匹配次数.  相似文献   

6.
采用半自动化的方法构建中文影视知识图谱。以国内影视领域数据为研究对象,对豆瓣网、百度百科和时光网的数据进行本体对齐,使异构数据源语义描述一致。在知识融合方面,借鉴并优化了Similarity Flooding算法的核心思想,实验结果表明,实体匹配的准确率基本保持在85%以上。建立了中文影视知识图谱可视化平台,并提供开放性的数据访问和查询接口。  相似文献   

7.
网络上存在很多包含实体属性的表格,可以用来扩充RDF知识库,这涉及到实体表与RDF知识库之间的模式映射问题.已有的模式匹配方法仍然不足以用来解决一个实体表与RDF知识库之间的模式匹配问题.为了准确高效的获得Web实体表与RDF知识库的匹配模式,本文提出了一种基于实例的模式匹配的方法,在匹配数据基础上得到统计意义上的Web实体表与RDF知识库之间的匹配模式.依此构建的系统,能根据知识库包含的信息,主动寻找与知识库相关的Web实体表,并利用找到的Web实体表扩充RDF知识库.  相似文献   

8.
数据集成问题一直是数据库研究领域的热点之一,而全局模式构建是数据集成中的一项重要任务。通过对模式元素之间语义关系的分析,从数据源系统数据字典入手,利用模式匹配结果,提出了一种基于模式元素语义关系进行模式合并的方法,并给出了基于模式元素语义关系的合并规则及合并算法。最后,通过对已有模式合并方法的比较分析,说明该模式合并方法的可用性和有效性更好。  相似文献   

9.
基于模式元素语义关系的模式合并方法研究   总被引:1,自引:0,他引:1  
数据集成问题一直是数据库研究领域的热点之一,而全局模式构建是数据集成中的一项重要任务。通过对模式元素之间语义关系的分析,从数据源系统数据字典入手,利用模式匹配结果,提出了一种基于模式元素语义关系进行模式合并的方法,并给出了基于模式元素语义关系的合并规则及合并算法。最后,通过对已有模式合并方法的比较分析,说明该模式合并方法的可用性和有效性更好。  相似文献   

10.
为解决多数据源挖掘隐私保护问题,文章采取按相似度分类多源数据库及其增量数据库,利用原始数据库挖掘结果和增量数据库分析结果进行敏感序列模式匹配,以有效减少数据库扫描次数的方法,设计实现隐私保护的增量式的高投票率序列模式挖掘算法。实验结果表明,给出的算法既能够准确挖掘出多数据源中全局高投票率模式,又能有效地隐藏保护敏感模式,且显著缩短了挖掘时间。  相似文献   

11.
双语影视知识图谱的构建研究   总被引:1,自引:0,他引:1  
提出一种双语影视知识图谱(BMKG)的构建流程。通过半自动化的方法构建了双语影视本体(BMO), 将各个影视数据源对齐到BMO, 以保持异构数据源的语义描述一致性。在知识链接方面, 在充分挖掘和利用领域特征的基础上, 采用基于Word2Vec 和TFIDF 两种向量模型的实体相似度计算方法, 使相似度特征增加一倍, 大大提升了模型的链接效果。在实体匹配方面, 提出基于相似度传播算法的实体匹配算法, 并利用影视数据源之间的内在联系, 克服了跨语言实体之间计算相似度的语言障碍。实验结果表明, 当阈值取到0.75 以上时, 实体匹配的准确率都能达到90% 左右。此外, 还建立了影视知识图谱共享平台, 并提供开放性的数据访问和查询接口。  相似文献   

12.
模式匹配是获取不同模式间语义关联关系的技术,是数据集成过程中的关键操作.随着可检索在线数据库数量的迅速增加,大规模的模式匹配工作的需要使多源模式匹配方法成为模式匹配领域研究的重点.针对现有多源模式匹配方法的缺陷,本文提出了一种基于素数的多源模式匹配方法,并提出了具体算法-PMSM.该方法将素数理论引入模式匹配过程中,使单纯的字符匹配转换为素数计算,提高了匹配效率,同时保留了现有多源模式匹配方法的优点.实验证明,PMSM切实可行.  相似文献   

13.
基于模糊集的地理信息模式匹配算法   总被引:2,自引:0,他引:2  
结合现有模式匹配算法和GML模式的特点,给出了元素与元素语义贴近度的定义,在通用匹配规则的基础上引入具体的匹配规则.针对匹配规则在计算语义贴近度中的作用定义了权值调配函数,并给出了关于元素对的匹配函数的定义和计算公式.实验表明,该算法能够有效发现地理信息模式中元素之间的相似关系,提高了元素之间匹配结果的准确度,对地理信息模式的整合有较大的帮助.  相似文献   

14.
与现有的根据知识图谱的结构信息或实体属性特征进行相似度匹配的实体对齐的方法不同,提出了一种基于表示学习的知识图谱实体对齐方法.首先,在低维向量空间下,通过机器学习方法学得实体和关系的语义表示,这种表示形式蕴含了知识图谱的内在结构信息及实体属性特征;其次,将人工标注的实体对作为先验知识,学习知识图谱间实体对的映射关系.经实验验证表明:与基于特征匹配的方法SiGMa相比,本文方法能够有效提高知识图谱实体对齐的精确率,同时保持较高的F1值.  相似文献   

15.
Web服务语义标注方法   总被引:12,自引:0,他引:12  
为了对W eb服务语义信息进行描述,提出了一种W eb服务语义标注方法。以现有的W eb服务描述语言(W SDL)文件为基础,充分利用W SDL中XM L schem a的语义信息与本体实体的相似性,从W SDL文件中抽取语义信息,并利用实体之间的名称相似度与结构相似度进行语义标注,生成基于OW L-S的W eb服务语义描述。用该方法对多个领域的W eb服务进行了语义标注,标注正确率在92.5%以上,较好地解决了W eb服务的语义标注问题。  相似文献   

16.
中文嵌套命名实体关系抽取研究   总被引:1,自引:0,他引:1  
为了解决嵌套命名实体关系抽取研究缺乏相关语料库这一问题, 在现有中文命名实体语料库的基础上, 将人工标注与机器学习相结合来抽取其语义关系。人工标注一个中文嵌套命名实体关系语料库, 然后分别采用支持向量机和卷积神经网络等方法, 进行中文嵌套实体关系抽取实验。实验结果表明, 在人工标注实体的中文嵌套命名实体语料上, 嵌套实体关系抽取的性能非常好, F1指数达到95%以上, 而在自动识别实体上的抽取性能尚不理想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号