首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
篇章级句间关系分析包括语义单元的切分和各个单元之间的语义关系识别.已有的研究主要面向英文,到目前为止,尚无可用的中文篇章级句间关系自动分析系统发布.在中文篇章关系语料库的基础上,首次实现面向中文的篇章级句间关系自动分析系统,包括语义单元切分、连词识别、显式语义关系识别以及隐式语义关系识别等.实验结果显示:该系统在显式句间关系识别上F-score为89.8;,隐式句间关系识别上F-score为55.5;.  相似文献   

2.
国外一批计算语言学研究者为开发语篇结构自动生成系统,以修辞结构理论为支撑.对大量英语语篇进行标注后发现,谬篇中的修辞关系应加以限制,语篇的抽象结构应为树型图式。这些国外研究成果带动了汉语篇章结构研究的发展,汉语语篇也应由基本语篇单位构成,其抽象结构也应为树型图,但基本语篇单位的切分并不是以引导从句的连词或短语为标记而是...  相似文献   

3.
基于自建的汉语篇章结构语料库以及语料库中连接词和连接词关系类别的标注, 抽取自动句法树和标准句法树的句法、词法和位置特征, 利用有监督的方法进行连接词识别和分类。实验结果表明, 连接词识别的F1值为69.2%, 连接词自动识别并分类的总正确率为89.1%。  相似文献   

4.
提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下,构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的关联强度。实验结果表明,所提出的SVM-R模型对句际关系树的分析显著优于传统方法。最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征。  相似文献   

5.
提出一种自动分析汉语小句级句际关系树的新方法.在修辞结构理论体系下,构建一个汉语句际关系标注语料库.不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的关联强度.实验结果表明,所提出的SVM-R模型对句际关系树的分析显著优于传统方法.最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征.  相似文献   

6.
MMT模型用于语篇语义理解的语段划分   总被引:1,自引:0,他引:1  
文章首先分析了自然语言理解中篇章语义理解的重要性,在此基础上提出了一种用于语篇语义理解的语段划分方法.该方法是在已分词的篇章语句中,引用冯志伟的汉语句子的多叉多标记树模型,在单句语义理解基础上,将语篇划分为各个语段,找出各语段间的层次关系,为语段内句子间意义分析做准备,最终达到篇章语义理解的目标.  相似文献   

7.
根据清华汉语树库的标注方法, 利用规则从中提取复句关系词并标注其类别, 然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征, 进行复句关系词的识别和分类。实验结果表明, 复句关系词判断准确率达95.7%, 复句关系词类别判断F1值为77.2%。  相似文献   

8.
兼语结构是汉语中常见的一种动词结构,由述宾短语与主谓短语共享兼语,结构复杂,给句法分析造成困难,因此兼语识别工作对于语义解析及下游任务都具有重要意义。但现存兼语语料库较少,面向中文抽象语义表示(AMR)标注体系的兼语语料库构建仍处于空白阶段。针对这一现状,该文总结出一套兼语语料库标注规范,构建了包含4 760个兼语句的面向中文AMR标注体系的兼语语料库。基于构建的语料库,采用LA-BiLSTM-CRF模型识别兼语结构,达到了86.06%的F1,并分析了识别结果,提出了改进方向。  相似文献   

9.
基于关联规则挖掘的汉语语义搭配规则获取方法   总被引:1,自引:0,他引:1  
针对自然语言处理系统在短语分析时的词汇排歧和结构排歧需要,本文提出了一种基于语料库的汉语短语语义搭配规则自动获取方法.该方法以《知网》为语义知识资源,在标注了句法语义信息的汉语短语熟语料库基础上,先采用数据挖掘中元规则制导的交叉层关联规则挖掘方法,自动发现汉语短语的语义搭配规律,再根据统计结果自动优选后生成语义搭配规则库.实验结果表明该方法是切实可行的.运用该方法自动获取的语义搭配规则具有较好的排歧效果.  相似文献   

10.
提出了一种高效的半自动构建语义单元表示库(英汉)的方法.该方法不是使用分词和词性标注等工具,而是直接对组成双语句子的基本字符进行处理,采用语义单元实量匹配和重构语义单元树的算法,对其产生的结果运用规则进行推断,规则独立于其他模块并且可扩充.经人工检查正确的语义单元加入语义单元表示库中.实验表明,该方法能保证结果的正确性,达到实用的水平.  相似文献   

11.
Introduction Although the word trigram dominates the statistical language modeling community, it still has some short- comings. For example, the word trigram cannot make use of the rich linguistic structure of the language, nor can it capture long-distanc…  相似文献   

12.
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。  相似文献   

13.
英汉总结性话语标记,是言语交际中使用频次较高的语言表达式,其语义关系多样,语用功能丰富。研究发现英汉总结性话语标记分布模式相对固定,存在原型位置,同一语段中前后话语之间存在递进强化、因果推导及逆向转折等五种语义关系。同时,话语建构中总结性话语标记突显出总结概括、阐发评述及交互主观的语用功能。这一研究有助于从类型学层面揭示英汉总结性话语标记的内在机理,促进两类话语标记的习得和使用。  相似文献   

14.
针对中文细粒度隐式篇章关系识别进行研究。考虑细粒度篇章关系的方向性特点, 提出一种基于远距离监督的特征学习算法。该算法使用远距离监督的方法, 自动标注显式篇章数据, 然后利用词与连词之间的相对位置信息, 训练各个词的词表达, 将词的修辞功能以及关系的方向性编码到密集词表达中, 将这样的词表达应用到细粒度隐式篇章关系分类器。实验结果表明, 在细粒度隐式篇章关系识别任务中, 该方法的分类准确率达到49.79%, 比未考虑篇章关系方向性的方法有较大程度的提高。  相似文献   

15.
基于依存关系的句法分析统计模型   总被引:5,自引:2,他引:3  
利用语义、语法等语言知识,建立一种基于依存关系的句法分析统计模型,并利用改进的句法分析模型进行句法分析实验.研究结果表明:利用依存关系、互信息对词聚类,能解决模型数据稀疏问题;模型可同时考虑几种语义依存关系;该模型是一个词汇化的句法分析模型,能结合分词、词性标注进行句法分析;概率上下文无关语法中由概率的上下文无关性假设和祖先结点无关性假设引起的问题在该模型中得到有效解决;精确率和召回率分别为86.96%和85.25%,其综合指标F与Collins的头驱动句法分析模型的F相比提高4.75%.  相似文献   

16.
Video-based person re-identification is an important research topic in computer vision that entails associating a pedestrian’s identity with non-overlapping cameras. It suffers from severe temporal appearance misalignment and visual ambiguity problems. We propose a novel self-supervised human semantic parsing approach (SS-HSP) for video-based person re-identification in this work. It employs self-supervised learning to adaptively segment the human body at pixel-level by estimating motion information of each body part between consecutive frames and explores complementary temporal relations for pursuing reinforced appearance and motion representations. Specifically, a semantic segmentation network within SS-HSP is designed, which exploits self-supervised learning by constructing a pretext task of predicting future frames. The network learns precise human semantic parsing together with the motion field of each body part between consecutive frames, which permits the reconstruction of future frames with the aid of several customized loss functions. Local aligned features of body parts are obtained according to the estimated human parsing. Moreover, an aggregation network is proposed to explore the correlation information across video frames for refining the appearance and motion representations. Extensive experiments on two video datasets have demonstrated the effectiveness of the proposed approach.  相似文献   

17.
时隙ALOHA需要使用控制算法以保证系统获得稳定吞吐量,而控制算法的关键是精确估计系统中的节点数.针对系统中的节点数在某时刻发生剧变时,传统的伪贝叶斯控制算法(pseudo Bayesian control algorithms,PBCA)存在调节时间较长的问题,提出分阶快速自适应伪贝叶斯控制算法(ranked fast adaptive PBCA,RFA-PBCA),首先设置一个门限值nth把信道的竞争情况分成高强度和低强度2种类型,再利用游程技术将信道分成空闲(冲突)和非空闲(非冲突)2种状态.当信道检测到c(c=6)个空闲时隙时,若估计节点数n大于nth,则节点将其传输数据概率增大为原先的2倍;同理,当信道检测c(c=6)个冲突时隙后,将其传输数据概率设为原先的1/2,其他情况下则采用PBCA进行调整.仿真结果表明,RFA-PBCA能够很好适应系统节点急剧变化的应用场景,其性能明显优于传统的PBCA.  相似文献   

18.
将篇章结构表示为小句关联结构, 与修辞结构等层次化篇章结构模式相比, 可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先, 提出篇章小句关联结构的形式表示、判断准则和形式限制, 并进行人工标注。然后, 对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上, 基于分类模型, 设计连接词和词汇等分类特征, 得到的最佳识别准确率达92.70%。实验结果表明, 语料整体取样比独立取样取得的去环效果好; 词汇、小句距离及句域等分类特征对识别的贡献较大; 远距离和跨大句是小句关联识别的难点, 但相邻小句和同一大句内的小句对的不相关识别难度更大。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号