首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 343 毫秒
1.
篇章级句间关系分析包括语义单元的切分和各个单元之间的语义关系识别.已有的研究主要面向英文,到目前为止,尚无可用的中文篇章级句间关系自动分析系统发布.在中文篇章关系语料库的基础上,首次实现面向中文的篇章级句间关系自动分析系统,包括语义单元切分、连词识别、显式语义关系识别以及隐式语义关系识别等.实验结果显示:该系统在显式句间关系识别上F-score为89.8;,隐式句间关系识别上F-score为55.5;.  相似文献   

2.
在标有复句逻辑语义关系的清华汉语树库上, 研究汉语篇章语义片段自动切分以及篇章关系的自动标注方法。通过比较不同序列标注模型对汉语篇章语义单元切分的性能, 提出基于最大熵模型的汉语篇章结构分析方法。实验结果表明, 篇章语义单元自动切分的F值能达到89.1%, 当篇章语义结构树的高度不超过6层时, 篇章语义关系标注的F值为63%。  相似文献   

3.
科技文献中回顾前人研究成果、分析存在的问题、提出解决方法等语言片段是论文创新性信息的构成部分。分析论文写作过程中问题分析信息的逻辑思维以及在文章中呈现的篇章关系,综合利用引用分布特征、篇章关系特征、否定情感特征构建具有普适性的信息抽取语义模式。从论文原始文本中通过匹配定义好的语义模式抽取出问题分析信息。同时,利用引导词特征、语义相似度计算从论文文本中抽取出论文的主要工作信息。以数据挖掘领域科技文献为例,对比人工抽取结果对提出的方法进行评价,结果表明该方法能较准确抽取相应信息,为科技论文聚类、论文推荐提供基础数据来源。  相似文献   

4.
篇章关系识别研究旨在理解篇章内部论述单元(简称"论元",包括短语、句子及文本片段)之间的语义连接关系.现有研究通过交互式注意力机制方法,提升论元之间的信息的交互性,从而提升模型的分类能力.尽管如此,仅通过提升论元间的信息交互不能表述论元对的整体语义概念,原因在于现有方法往往将论元对视作独立的个体,忽略上下文信息对其语义上的影响.针对以上问题,提出一种基于层次化表示的隐式篇章关系识别方法,通过基于词的交互式注意力机制提取出较为重要的单词或短语,并通过论元的注意力机制赋予关键论元较高的权重,最终通过基于上下文的注意力机制融合论元对所在段落的信息,获得具有上下文语义信息的论元对表示.该方法进一步强化了论元之间信息交互性,同时强化了论元对与上下文信息间的交互.使用PDTB(Penn Discourse Treebank)语料进行实验,结果证明该方法的F_1值在四个大类关系(Comparison,Contingency,Expansion,Temporal)上相对基准系统提高了4. 94%,5. 43%,4. 57%和7. 42%.  相似文献   

5.
隐式篇章关系识别是篇章分析领域中极具挑战性的子任务,其挑战性在于难以捕捉论元之间的交互信息,并对这类交互信息进行联合的表示学习(交互信息即为论元中有益于体现关联关系及关系类型的词义和语义信息)。针对这一问题,文章提出一种基于堆叠式注意力机制的隐式篇章关系分类方法,即,将论元的自注意力分布特征应用于论元之间的交互式注意力计算,通过自注意力和交互式注意力的信息融合,加大了论元间关联信息的权重。文章利用宾州篇章树库(Penn Discourse Treebank,PDTB)语料进行实验。实验结果表明,相较于基准系统,该方法的F1值在四大类关系上分别提高了6.47%、3.94%、3.82%和6.57%,准确率分别提高了6.41%、2.68%、6.88%和3.82%。  相似文献   

6.
针对中文细粒度隐式篇章关系识别进行研究。考虑细粒度篇章关系的方向性特点, 提出一种基于远距离监督的特征学习算法。该算法使用远距离监督的方法, 自动标注显式篇章数据, 然后利用词与连词之间的相对位置信息, 训练各个词的词表达, 将词的修辞功能以及关系的方向性编码到密集词表达中, 将这样的词表达应用到细粒度隐式篇章关系分类器。实验结果表明, 在细粒度隐式篇章关系识别任务中, 该方法的分类准确率达到49.79%, 比未考虑篇章关系方向性的方法有较大程度的提高。  相似文献   

7.
基于知网的关系网络的构建   总被引:1,自引:0,他引:1  
为了更好地利用知网中的语义关系,提出了一种将知网中的各种隐含关系形式化表示的方法.该方法通过仔细分析知网中关系标知符、动态角色以及例句所描述的各种语义关系,以概念、特征、关系为基础,构建了一基于知网的关系网络.利用该关系网络,既可以高效地查找到词语的概念与概念之间的语义关系,也可以查找到概念的属性之间的语义关系.给出了该方法的实现算法,并用实例说明了该方法的优点.  相似文献   

8.
由于遥感场景固有的语义特征,深度学习在场景分类中具有突出的语义特征提取能力,近年来得到了广泛的研究。然而,现有的基于深度学习的方法大多没有精细描绘场景几何形状,而是利用固定大小的滑动窗口来对影像分类,这些窗口可能由多种场景类型的混合像元组成,导致场景识别的可分离性低,细节粗糙,分类精度低。针对这一问题,将简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)与迁移学习相结合,实现场景斑块的精确分类,进一步提高场景变化检测的准确性。首先基于SLIC算法,考虑强度分布的相关性,将遥感影像分割成多尺度斑块;其次利用Xception模型结合迁移学习网络从多尺度斑块中提取深度语义特征,并基于softmax分类器计算概率,从而判别场景斑块的类别;最后,基于场景分类的结果提取地物的变化信息。实验结果表明,该方法能够适应不同尺度的场景识别,达到利用窗口网格检测方法的最高水平,提高了场景变化检测的精度和效率。  相似文献   

9.
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。  相似文献   

10.
零形式缺位填充是一种细粒度的语义角色标注任务,传统的语义角色标注只针对句中显式表达的语义论元标记语义角色,未显式表达的则不予标记,但这些缺失的语义论元对于篇章语义理解有很大的帮助。零形式识别与消解研究,有助于发现并找到这些缺失的语义论元,从而更深层次地理解篇章语义。文章重点研究了零形式核心框架元素集之间的关系,并将框架关系与框架语义特征相结合,提出了基于框架关系的零形式消解算法,实现了零形式的识别与消解。实验结果表明,核心框架元素集之间的关系可以较好地提升零形式的识别结果,框架关系的应用使得零形式消解的F值提高了3.52%。  相似文献   

11.
英汉总结性话语标记,是言语交际中使用频次较高的语言表达式,其语义关系多样,语用功能丰富。研究发现英汉总结性话语标记分布模式相对固定,存在原型位置,同一语段中前后话语之间存在递进强化、因果推导及逆向转折等五种语义关系。同时,话语建构中总结性话语标记突显出总结概括、阐发评述及交互主观的语用功能。这一研究有助于从类型学层面揭示英汉总结性话语标记的内在机理,促进两类话语标记的习得和使用。  相似文献   

12.
依据福柯的微观权力理论,可知兰姆《穷亲戚》中“穷亲戚”与“富亲戚”之间的权力关系、权力怎样在他们中流动、怎样依靠权力维持这种关系及大部分穷人对当时革命不积极的原因。  相似文献   

13.
隐喻在新闻英语中的应用在词汇方面,明示推理交际是隐喻理解的先决条件,追求最佳关联是隐喻理解的最终取向。通过对隐喻的理解,听话人可以推导出说话人的意图。在语法结构方面,通过对韩礼德的一致式和隐喻式的对比分析,可以看出新闻工作者借助隐喻来反映一定的意识形态。  相似文献   

14.
长距离的实体间关系识别是语义关系抽取中的难点.从修辞结构理论出发,提出把语篇树与复杂句法树相结合的方法,进行了对照实验,结果表明语篇分析对于实体关系分类有一定的作用.语篇分析在关系抽取中的研究还处于起步阶段,本文的方法为以后的深入研究提供了一个基础.  相似文献   

15.
针对汉语句际关系中分布最广泛的并列复句, 提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算, 使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法, 在广义并列关系上进行评测。最后将其中3种方法进行集成, 并取得了较为理想的效果。  相似文献   

16.
介绍了我国国际定价话语权缺失现状,探讨了造成这种局面的主要原因,针对性地提出若干可行性建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号