首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
在标有复句逻辑语义关系的清华汉语树库上, 研究汉语篇章语义片段自动切分以及篇章关系的自动标注方法。通过比较不同序列标注模型对汉语篇章语义单元切分的性能, 提出基于最大熵模型的汉语篇章结构分析方法。实验结果表明, 篇章语义单元自动切分的F值能达到89.1%, 当篇章语义结构树的高度不超过6层时, 篇章语义关系标注的F值为63%。  相似文献   

2.
针对中文细粒度隐式篇章关系识别进行研究。考虑细粒度篇章关系的方向性特点, 提出一种基于远距离监督的特征学习算法。该算法使用远距离监督的方法, 自动标注显式篇章数据, 然后利用词与连词之间的相对位置信息, 训练各个词的词表达, 将词的修辞功能以及关系的方向性编码到密集词表达中, 将这样的词表达应用到细粒度隐式篇章关系分类器。实验结果表明, 在细粒度隐式篇章关系识别任务中, 该方法的分类准确率达到49.79%, 比未考虑篇章关系方向性的方法有较大程度的提高。  相似文献   

3.
信息抽取技术中,隐式篇章关系识别一直是研究难点.针对现有的有监督篇章关系识别方法中需要大量人工标注数据的缺点,提出了用自训练的策略实现半监督的隐式篇章关系的自动识别模型,尝试仅用少量标注样本,却获得和有监督方法相媲美的识别准确率,为未来实时大数据篇章关系识别提供了新的契机.此外,为了进一步提高识别的准确率,还针对词对特征、产生式特征、动词特征等9种篇章关系特征进行特征组合分析,构建候选篇章关系实例的知识表示,对模型进行优化.通过在Penn Discourse Treebank(PDTB2.0)语料库上的实验结果分析表明,该模型比传统有监督识别方法在准确率和F-score上分别提高了5.2%和13.5%.  相似文献   

4.
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。  相似文献   

5.
观点挖掘技术旨在面向更为广阔的产品领域,从文本中自动获取观点所评价的对象,并有针对性地分析评论的倾向性.本文通过建立ChunkCRF模型对观点表达句中显式观点评价对象的识别;借助句法关系对句中出现多个评价对象的问题进行处理;利用语义搭配习惯对隐式评价对象进行填充生成.在此基础上,本文实现了基于观点评价对象的观点抽取与观...  相似文献   

6.
将篇章结构表示为小句关联结构,与修辞结构等层次化篇章结构模式相比,可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先,提出篇章小句关联结构的形式表示、判断准则和形式限制,并进行人工标注。然后,对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上,基于分类模型,设计连接词和词汇等分类特征,得到的最佳识别准确率达92.70%。实验结果表明,语料整体取样比独立取样取得的去环效果好;词汇、小句距离及句域等分类特征对识别的贡献较大;远距离和跨大句是小句关联识别的难点,但相邻小句和同一大句内的小句对的不相关识别难度更大。  相似文献   

7.
针对篇章隐式关系检测较难的问题,提出了一种基于语义场景匹配的平行推理方法。该方法利用框架语义学,将论元抽象为概念一级的语义描述(简称语义场景),实现描述形式的压缩。基于大规模静态数据,通过语义场景的匹配挖掘可比较论元辅助关系推理。该方法能够在保证检测精度的同时,提升检测效率。利用宾州篇章树库(penn discourse tree bank,PDTB)对这一检测方法进行评测,检测精度为55.26%。  相似文献   

8.
零形式缺位填充是一种细粒度的语义角色标注任务,传统的语义角色标注只针对句中显式表达的语义论元标记语义角色,未显式表达的则不予标记,但这些缺失的语义论元对于篇章语义理解有很大的帮助。零形式识别与消解研究,有助于发现并找到这些缺失的语义论元,从而更深层次地理解篇章语义。文章重点研究了零形式核心框架元素集之间的关系,并将框架关系与框架语义特征相结合,提出了基于框架关系的零形式消解算法,实现了零形式的识别与消解。实验结果表明,核心框架元素集之间的关系可以较好地提升零形式的识别结果,框架关系的应用使得零形式消解的F值提高了3.52%。  相似文献   

9.
针对当前神经机器翻译在捕捉复杂句内小句间的语义和结构关系方面存在不足,导致复杂句长文本翻译的篇章连贯性不佳的问题,提出一种融合小句对齐知识的汉英神经机器翻译方法.首先提出手工和自动相结合的标注方案,构建大规模小句对齐的汉英平行语料库,为模型训练提供丰富的小句级别的汉英双语对齐知识;然后设计一种基于小句对齐学习的神经机器...  相似文献   

10.
面向非受限领域的综合式自动中文文摘方法   总被引:7,自引:0,他引:7  
讨论了一种面向非受限领域的综合式中文自动文摘方法。其基本思路是 :采用向量空间模型对篇章结构进行自动分析 ,建立基于语义相似度的段落关系图 ,获取段落的重要度信息 ,并使用标题或聚类的方法划分意义段 ;根据词的频度 ,句子位置、提示语等文本形式特征计算句子的权值 ,分别从各意义段中选取高权值的句子作为文摘句 ;对文摘句进行句法和语义分析 ,消除冗余 ,解决指代词悬挂、文摘不连贯等问题 ,最终组成一篇简洁、通顺、可读性好的文摘  相似文献   

11.
戴晖 《韶关学院学报》2013,34(3):182-185
衔接问题一直是语篇分析中的重要研究对象,而大部分研究侧重于文本的显性衔接手段。以含意衔接这一隐性衔接为研究对象,采用量性结合、对比分析的研究方法,探讨中美大学生在各自的全国研究生入学考试中议论文范文的含意衔接的特征区别,分析中国学生在海外考试中作文部分的低分情况,为汉英语篇对比研究提供分析性意见。  相似文献   

12.
国外一批计算语言学研究者为开发语篇结构自动生成系统,以修辞结构理论为支撑.对大量英语语篇进行标注后发现,谬篇中的修辞关系应加以限制,语篇的抽象结构应为树型图式。这些国外研究成果带动了汉语篇章结构研究的发展,汉语语篇也应由基本语篇单位构成,其抽象结构也应为树型图,但基本语篇单位的切分并不是以引导从句的连词或短语为标记而是...  相似文献   

13.
基于自建的汉语篇章结构语料库以及语料库中连接词和连接词关系类别的标注, 抽取自动句法树和标准句法树的句法、词法和位置特征, 利用有监督的方法进行连接词识别和分类。实验结果表明, 连接词识别的F1值为69.2%, 连接词自动识别并分类的总正确率为89.1%。  相似文献   

14.
中国优伶具有"卑贱者"和"色情者"的社会性别角色,它的形成有其最原始和最基础的控制力量,即权力采用"话语"的手段,以抵消优伶在舞台和现实中任何可能造成性别和权利的混乱乃至颠倒倾向,而在此背后,权力话语对中国优伶性别角色的组织和控制,实质上是对经济及其在此之上的政治权力的一种维护和巩固,或者说是,经济及其在此之上的政治权力的一种本能提防和警戒。  相似文献   

15.
名词化与话语隐喻态度   总被引:1,自引:0,他引:1  
名词化是语言使用中常见的现象,它不仅仅是创造名词的手段,同时它也是表达隐性话语态度的重要手段。认知语义学的概念隐喻理论对我们理解名词化的隐喻本质有着非常重要的作用。名词化在新闻社论中可以隐喻既存性、不可协商性、逻辑关系等,是话语隐喻态度的有效实现形式。  相似文献   

16.
本文应用色散分析的付氏方法讨论显式及隐式差分格式的稳定性,相容条件及其系数同模拟方程系数的关系。  相似文献   

17.
对英汉新闻话语的词汇特点进行初步的定量分析就会发现新闻话语的一些语言学特点,这对帮助外语学习者更好地了解新闻话语,获取更多的语言知识和信息,促进交际的顺利进行,并在一定程度上推动外语教学的发展有积极作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号