首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
信息抽取技术中,隐式篇章关系识别一直是研究难点.针对现有的有监督篇章关系识别方法中需要大量人工标注数据的缺点,提出了用自训练的策略实现半监督的隐式篇章关系的自动识别模型,尝试仅用少量标注样本,却获得和有监督方法相媲美的识别准确率,为未来实时大数据篇章关系识别提供了新的契机.此外,为了进一步提高识别的准确率,还针对词对特征、产生式特征、动词特征等9种篇章关系特征进行特征组合分析,构建候选篇章关系实例的知识表示,对模型进行优化.通过在Penn Discourse Treebank(PDTB2.0)语料库上的实验结果分析表明,该模型比传统有监督识别方法在准确率和F-score上分别提高了5.2%和13.5%.  相似文献   

2.
针对中文细粒度隐式篇章关系识别进行研究。考虑细粒度篇章关系的方向性特点, 提出一种基于远距离监督的特征学习算法。该算法使用远距离监督的方法, 自动标注显式篇章数据, 然后利用词与连词之间的相对位置信息, 训练各个词的词表达, 将词的修辞功能以及关系的方向性编码到密集词表达中, 将这样的词表达应用到细粒度隐式篇章关系分类器。实验结果表明, 在细粒度隐式篇章关系识别任务中, 该方法的分类准确率达到49.79%, 比未考虑篇章关系方向性的方法有较大程度的提高。  相似文献   

3.
篇章级句间关系分析包括语义单元的切分和各个单元之间的语义关系识别.已有的研究主要面向英文,到目前为止,尚无可用的中文篇章级句间关系自动分析系统发布.在中文篇章关系语料库的基础上,首次实现面向中文的篇章级句间关系自动分析系统,包括语义单元切分、连词识别、显式语义关系识别以及隐式语义关系识别等.实验结果显示:该系统在显式句间关系识别上F-score为89.8;,隐式句间关系识别上F-score为55.5;.  相似文献   

4.
隐式篇章关系识别是篇章分析领域中极具挑战性的子任务,其挑战性在于难以捕捉论元之间的交互信息,并对这类交互信息进行联合的表示学习(交互信息即为论元中有益于体现关联关系及关系类型的词义和语义信息)。针对这一问题,文章提出一种基于堆叠式注意力机制的隐式篇章关系分类方法,即,将论元的自注意力分布特征应用于论元之间的交互式注意力计算,通过自注意力和交互式注意力的信息融合,加大了论元间关联信息的权重。文章利用宾州篇章树库(Penn Discourse Treebank,PDTB)语料进行实验。实验结果表明,相较于基准系统,该方法的F1值在四大类关系上分别提高了6.47%、3.94%、3.82%和6.57%,准确率分别提高了6.41%、2.68%、6.88%和3.82%。  相似文献   

5.
针对篇章隐式关系检测较难的问题,提出了一种基于语义场景匹配的平行推理方法。该方法利用框架语义学,将论元抽象为概念一级的语义描述(简称语义场景),实现描述形式的压缩。基于大规模静态数据,通过语义场景的匹配挖掘可比较论元辅助关系推理。该方法能够在保证检测精度的同时,提升检测效率。利用宾州篇章树库(penn discourse tree bank,PDTB)对这一检测方法进行评测,检测精度为55.26%。  相似文献   

6.
将篇章结构表示为小句关联结构, 与修辞结构等层次化篇章结构模式相比, 可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先, 提出篇章小句关联结构的形式表示、判断准则和形式限制, 并进行人工标注。然后, 对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上, 基于分类模型, 设计连接词和词汇等分类特征, 得到的最佳识别准确率达92.70%。实验结果表明, 语料整体取样比独立取样取得的去环效果好; 词汇、小句距离及句域等分类特征对识别的贡献较大; 远距离和跨大句是小句关联识别的难点, 但相邻小句和同一大句内的小句对的不相关识别难度更大。  相似文献   

7.
基于自建的汉语篇章结构语料库以及语料库中连接词和连接词关系类别的标注, 抽取自动句法树和标准句法树的句法、词法和位置特征, 利用有监督的方法进行连接词识别和分类。实验结果表明, 连接词识别的F1值为69.2%, 连接词自动识别并分类的总正确率为89.1%。  相似文献   

8.
隐式篇章关系识别的主要挑战是如何表示两个文本单元的语义信息.由于句子的语义信息往往由语法树中的信息焦点(谓词部分)所决定,所以关注信息焦点可以提升篇章关系识别的效果.为了增强信息焦点的作用,引入树状长短时记忆(tree-structured long short-term memory,Tree-LSTM)网络,使用其遗忘门的特性区别对待不同孩子节点的信息.最后利用神经张量网络(neural tensor network,NTN)来计算两个句子语义向量之间的关系.基于PDTB2.0(Penn Discourse Treebank)语料数据进行实验,实验结果表明混合树结构神经网络比传统的RNN模型在大部分关系中的Fscore上提高了3.0%左右.  相似文献   

9.
中文篇章零元素语料库构建   总被引:1,自引:0,他引:1  
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。  相似文献   

10.
文章根据复合动词前后项动词对旬中名词的格支配关系,将日语复合动词分为三大类,即并列关系、修饰关系和融合关系。其中修饰关系又分为中心词前置式和中心词后置式两类。通过对句中名词的格支配关系分析,也可以为分析复合动词自他性的特征提供一个新方法。  相似文献   

11.
英汉总结性话语标记,是言语交际中使用频次较高的语言表达式,其语义关系多样,语用功能丰富。研究发现英汉总结性话语标记分布模式相对固定,存在原型位置,同一语段中前后话语之间存在递进强化、因果推导及逆向转折等五种语义关系。同时,话语建构中总结性话语标记突显出总结概括、阐发评述及交互主观的语用功能。这一研究有助于从类型学层面揭示英汉总结性话语标记的内在机理,促进两类话语标记的习得和使用。  相似文献   

12.
长距离的实体间关系识别是语义关系抽取中的难点.从修辞结构理论出发,提出把语篇树与复杂句法树相结合的方法,进行了对照实验,结果表明语篇分析对于实体关系分类有一定的作用.语篇分析在关系抽取中的研究还处于起步阶段,本文的方法为以后的深入研究提供了一个基础.  相似文献   

13.
在标有复句逻辑语义关系的清华汉语树库上, 研究汉语篇章语义片段自动切分以及篇章关系的自动标注方法。通过比较不同序列标注模型对汉语篇章语义单元切分的性能, 提出基于最大熵模型的汉语篇章结构分析方法。实验结果表明, 篇章语义单元自动切分的F值能达到89.1%, 当篇章语义结构树的高度不超过6层时, 篇章语义关系标注的F值为63%。  相似文献   

14.
基于知网的关系网络的构建   总被引:1,自引:0,他引:1  
为了更好地利用知网中的语义关系,提出了一种将知网中的各种隐含关系形式化表示的方法.该方法通过仔细分析知网中关系标知符、动态角色以及例句所描述的各种语义关系,以概念、特征、关系为基础,构建了一基于知网的关系网络.利用该关系网络,既可以高效地查找到词语的概念与概念之间的语义关系,也可以查找到概念的属性之间的语义关系.给出了该方法的实现算法,并用实例说明了该方法的优点.  相似文献   

15.
从共时层面入手,分析"这不"作为话语标记的理由,认为其核心意义是"证实性",说写者为强化所述内容的认知突显度,运用"这不"对所述内容进行进一步的阐述举例等。在此基础上,从语篇角度考察"这不"的语篇组织功能,指出它既能标示整体连贯,也能标示局部连贯,前后语句之间的逻辑语义关系有例证关系、解说关系、因果关系和承接关系等四种关系类型。  相似文献   

16.
隐喻在经济语篇中极为普遍,经济领域里的抽象概念往往通过隐喻概念来再现。经济隐喻的种类很多,主要结合所收集到的语料,对英语经济新闻报道中的金融危机概念隐喻进行调查,揭示自然灾害、疾病、战争和意外事故等四个领域与金融危机之间的相似性与认知关系,并从批评的角度探讨金融危机隐喻作为概念隐喻在新闻报道中的功能。  相似文献   

17.
基于优势关系的区间值粗糙集扩充模型   总被引:4,自引:0,他引:4  
区间值信息系统是单值信息系统的一种扩充。首先在区间值信息系统中引入了四种优势关系,分析了四种优势关系的重要性质及相互联系,并针对四种优势关系的局限性,提出了一种新的优势关系--α-优势关系,进而定义了基于α-优势关系的扩充粗糙集模型。最后,通过教师评估实例比较分析了区间值信息系统中基于优势关系的扩充粗糙集模型之间的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号