首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于图结构的文本表示方法在新闻文本去重中具有更好的效果.但是,目前该表示方法还不能完整地表示文本的全部信息,并且忽略了图的语义信息,降低了新闻文本的去重效果.为此,本研究提出基于事件异构图表示的文本去重算法,该算法首先通过事件异构图表示新闻文本的全局语义与结构信息,然后提出双标签图核算法表征事件异构图,实现深度表征图的结构及语义信息.实验结果表明,该研究提出的去重算法比现有的基于图结构的文本表示去重方法在F1-score指标上提升了10%.最后,该算法能提高新闻文本的去重效果.  相似文献   

2.
针对基于元数据或传统主题图的知识组织模式没有实现知识的多层次多粒度表示,以及知识融合过程中相似性算法准确性不高而影响融合质量的问题,结合全信息理论与扩展主题图结构特点及语义信息,提出了面向多源知识融合的扩展主题图相似性算法(ETMSC)和阈值选取的相关性、层次对应和实验确定三原则.该算法综合了语法、语义和语用的相似性,扩展了主题图元素间组成结构上的相似性,同时充分考虑了涵义及所处语境的相似性.主题图相似性的判别准则与阈值有关,阈值的确定与数据集相关.实验结果表明,ETMSC算法与单纯基于语法或语义的相似性算法相比,准确性提高了9.2%~11.1%.  相似文献   

3.
产品的数据交换是异构CAD实现协同设计的关键技术.为此,本文提出了一种以宏语义命令(MSC)结合细胞元表示的语义特征造型技术为基础的方法,来实现异构CAD间数据的共享.在该方法中每个CAD系统中与MCGs相对应的建模操作通过由XML格式表示的MSC交换来传递包括设计意图的参数信息,同时模型间特征的约束关系用特征依赖图(FDG)来存储.该文提到的思想应用在了理工大学自主开发的HUSTCAIDS与UG间的异构协同设计中,证明了以上理论的可行性.  相似文献   

4.
反映信息系统的结构语义是数据库设计的主要目的之一。这一目的一般采用语义数据模型来达到。我们考察这一问题的逆问题:识别关系数据库模式中IFO结构。本文描述了将无语义的关系模式转换成IFO图的方法,同时给出了该方法的具体应用。  相似文献   

5.
异质图表示学习旨在将图中的语义信息和异质的结构信息嵌入到低维向量空间中。目前大多数的异质图表示学习方法主要通过基于元路径、元图和网络模式的采样以保留图中同类型节点间的单粒度局部结构,忽略了现实世界中复杂异质图具有的丰富的层次结构。商空间理论中的多粒度思想可以在不同粒度内捕获节点间的潜在联系。因此,为在异质图表示中有效地保留层次结构的信息,文章提出一个基于多粒度的异质图表示方法(Heterogeneous Graph Representations Based on Multi-granularity,HeMug)。该方法首先基于不同元路径构建多个同质子图,并利用多粒度的粗化思想,将每个同质子图分别粗化形成多个多粒度子网络,以保留异质图中同类型节点在给定元路径下的层次结构。其次,利用多粒度的细化思想,将每个多粒度子网络最粗层通过现有表示学习方法获得的节点表示逐层细化,以得到节点在每个多粒度子网络下的表示。最后,设计注意力机制以融合节点在不同元路径对应的多粒度子网络下的表示。在四个真实数据集上的实验结果表明,与对比算法相比,提出的HeMug获得了更有效的节点表示。  相似文献   

6.
7.
反映信息系统的结构语义是数据库设计的主要目的之一。这一目的一般采用语义数据模型来达到。我们考察这一问题的逆问题:识别关系数据库模式中IFO结构。本文描述了将无语义的关系模式转换成IFO图的方法,同时给出了该方法的具体应用。  相似文献   

8.
为解决已有复述语义计算方法未考虑句法结构的问题, 提出基于句法结构的神经网络复述识别模型, 设计基于树结构的神经网络模型进行语义组合计算, 使得语义表示从词语级扩展到短语级。进一步地, 提出基于短语级语义表示的句法树对齐机制, 利用跨句子注意力机制提取特征。最后, 设计自注意力机制来增强语义表示, 从而捕获全局上下文信息。在公开英语复述识别数据集Quora上进行评测, 实验结果显示, 复述识别性能得到改进, 达到89.3%的精度, 证明了提出的基于句法结构的语义组合计算方法以及基于短语级语义表示的跨句子注意力机制和自注意力机制在改进复述识别性能方面的有效性。  相似文献   

9.
使用属性文法设计了研究生教育评价系统,非终结符表示一级和二级评价指标,终结符表示输入的数据,文法符号的属性表示相应数据的值,并设计语义规则实现了对这些属性的加工处理,完成了对某一单位研究生培养的评价.该设计方法不仅节省内存空间,而且提高了系统的灵活性.  相似文献   

10.
基于模式元素语义关系的模式合并方法研究   总被引:1,自引:0,他引:1  
数据集成问题一直是数据库研究领域的热点之一,而全局模式构建是数据集成中的一项重要任务。通过对模式元素之间语义关系的分析,从数据源系统数据字典入手,利用模式匹配结果,提出了一种基于模式元素语义关系进行模式合并的方法,并给出了基于模式元素语义关系的合并规则及合并算法。最后,通过对已有模式合并方法的比较分析,说明该模式合并方法的可用性和有效性更好。  相似文献   

11.
数据ETL过程中的模式集成技术研究   总被引:2,自引:0,他引:2  
阐述了在数据ETL(Data Extractlon,Transformation and Loading)中造成模式冲突的主要原因是不同的数据源可能采用不同的数据模型来表达;分析了常用模式集成方法,并比较了它们的优缺点;结合常用集成方法中的优点,设计了交互式的模式集成框架。该框架解决了较难的语义冲突问题,获得了良好的集成效果。  相似文献   

12.
模式匹配是数据集成、模型管理等数据库关键领域的基础问题。目前,大多数的研究集中在如何发现有效的元素匹配对,模式匹配的结果用映射来表示。映射的形式化的定义和表示还没有得到有效的研究。这里讨论了复杂的模式匹配,给出了映射的一个形式化的定义,提出了一个表示映射的框架。最后,利用数据集成来解释了如何利用这个映射的框架。  相似文献   

13.
数据仓库建模是构建数据仓库的核心,通常采用维度模型的建模方式.分析了维度模型中星型模式和雪花模式的优缺点,并针对金融业数据仓库特点,以证券业务为例,提出了星型衍生子维度模式概念,阐述了此结构的生成条件、算法和优点,即在典型的星型模式中,对大维度表中基数较小的相对独立的维度属性进行分解,生成子维度表,用代理键将其与父维度表及事实表关联,这有利于数据装入、提高数据仓库综合查询效率及一定程度上减少数据冗余,这对于金融业数据仓库中多主题的数据建模具有实际应用价值.  相似文献   

14.
翻译的实质,在某种程度上可理解为"图式翻译"。运用图式理论探讨中国古诗词的翻译过程,从语言图式、内容图式(包括意象图式、文化图式、语境图式和情感图式)和形式图式(包括韵律图式和音调图式)三方面来审视诗词翻译中图式的传译。  相似文献   

15.
丁峰  沈钧毅  赵天海 《西安交通大学学报》2002,36(10):1066-1069,1074
为了将关系数据以扩展置标语言(XML)数据的形式发布,分别提出了将关系模式映射为文件类型定义(DTD)和扩展置标语言方案(XMLSchema)的两种规则;非空表元素规则和空表元素规则,前者将关系模式中的表,记录和字段分别映射为表元素,表元素中的记录元素和记录元素中的字段子元素,后者将表映射为表元素,记录映射为表元素算法,前者借助一个链队列和两个栈分别存放解析得到的各级元素的开始,结束标记和属性,后者借助一个链队列存放解析得到的元素标记和属性,它们均可实现将关系数据写入XML文档,最后对实验结果进行了分析,得出在表数目相同,表中字段数也相同的情况下,表元素非空算法略优于空表元素算法的结论。  相似文献   

16.
图象数据模型研究   总被引:1,自引:0,他引:1  
数据模型研究是设计按内容检索的图象数据库系统的基础.本文根据图象信息系统的特点,将面向对象模型与超语义模型有机结合,提出了一种新的图象数据模型及相应的说明语言.该模型以紧耦合方式融合了语义数据模型和知识模型的特点,并增加了表示图象对象间空间关系的机制,使得该模型可以更好地描述图象信息系统中的图象数据、领域知识以及空间关系语义.  相似文献   

17.
为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取, 并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息, 输出最长频繁路径的集合, 以实现半结构化数据的提取。实验结果表明, 该算法能同时有效地处理分支及环路问题, 避免了死循环的出现。  相似文献   

18.
信息共享是实施供应商管理库存模式的前提条件.为了实现供需双方的信息共享,研究共享数据模式设计技术.在分析模式集成原理的基础上,提出共享数据模式的设计原则以及多目标优化函数,并提出一种共享数据模式启发式算法.该启发式算法包括5个步骤:定义集成问题边界、建立系统对象关联矩阵、建立业务对象树、求解初始解、优化初始解.共享数据模式启发式设计算法在实际案例中得到了应用和验证,是实现供需双方信息共享的有效工具.  相似文献   

19.
基于本体的数据集成冲突消解   总被引:1,自引:0,他引:1  
文章在深入分析异构数据集成冲突产生原因的基础上,提出一种使用两层本体来消解数据集成中语法和语义冲突的方法;通过使用数据源模型本体和集成映射模型本体,能够在解决语法和语义冲突的同时进行数据划分和安全控制,可提高数据集成的效率和自动化程度。  相似文献   

20.
How to integrate heterogeneous semi-structured Web records into relational database is an important and challengeable research topic. An improved model of conditional random fields was presented to combine the learning of labeled samples and unlabeled database records in order to reduce the dependence on tediously hand-labeled training data. The pro- posed model was used to solve the problem of schema matching between data source schema and database schema. Experimental results using a large number of Web pages from diverse domains show the novel approach's effectiveness.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号