首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于语义的自动文摘研究综述   总被引:1,自引:0,他引:1  
基于语义的自动文摘方法能解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量.常用语义模型包括统计主题模型和语义知识模型.基于语义的自动文摘是对传统文摘技术基于语义模型的扩充,在自动文摘的预处理、文档转换、文档候选片段提取和文摘生成4个基本过程中使用各种语义分析方法.  相似文献   

2.
面向非受限领域的综合式自动中文文摘方法   总被引:7,自引:0,他引:7  
讨论了一种面向非受限领域的综合式中文自动文摘方法。其基本思路是 :采用向量空间模型对篇章结构进行自动分析 ,建立基于语义相似度的段落关系图 ,获取段落的重要度信息 ,并使用标题或聚类的方法划分意义段 ;根据词的频度 ,句子位置、提示语等文本形式特征计算句子的权值 ,分别从各意义段中选取高权值的句子作为文摘句 ;对文摘句进行句法和语义分析 ,消除冗余 ,解决指代词悬挂、文摘不连贯等问题 ,最终组成一篇简洁、通顺、可读性好的文摘  相似文献   

3.
多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取.由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系.常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息.为此,我们提出使用维基百科——当今世界最大的在线概念语料库——为多文档文摘的提取提供语义支持.一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式.另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取.我们首先通过计算概念在维基中的全局相关性和当前文档集内的局部相关性,获取概念的权重.然后在维基概念表示的基础上,为文档中的句子提取多种基于维基的特征,并最后用于文摘生成.在实验中,我们依次用各个维基特征独立生成文摘,并使用ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向召回率的要点评估)指标评价文摘质量.通过比较,实验验证了维基词条首段能较好的提升文摘质量.  相似文献   

4.
提出一种基于最大树法的生成多文档文摘子主题划分方法。对多文档集合中的句子进行基于语义词典的相似度计算,形成相似度矩阵。提出了将相同或相似的句子通过模糊聚类的方法归并成一类,每一类代表一个子主题,通过抱团结构分析划分出子主题。实验结果表明,生成的多文档文摘覆盖性强,冗余信息少,具有一定实用价值。  相似文献   

5.
提出一种基于最大树法的生成多文档文摘子主题划分方法.对多文档集合中的句子进行基于语义词典的相似度计算,形成相似度矩阵.提出了将相同或相似的句子通过模糊聚类的方法归并成一类,每一类代表一个子主题,通过抱团结构分析划分出子主题.实验结果表明,生成的多文档文摘覆盖性强,冗余信息少,具有一定实用价值.  相似文献   

6.
多文档文摘提取方法的研究   总被引:1,自引:0,他引:1  
在深入分析当前流行的自动文摘技术和方法的基础上,将语义方法融入统计算法,提出了一种基于统计的多文档文摘提取方法,描述了它的实现过程.该方法利用文档内和文档之间段落的语义相关性,实现了多文档文摘的自动生成.首先对文档进行分段实现信息分割,再利用聚类技术对文本段进行聚类实现信息合并,最后从类中抽取代表段产生摘要文本.实验结果表明,该方法是一个有效、实用的方法.  相似文献   

7.
针对传统生成式模型在处理文本时出现梯度消失、爆炸及捕捉到文章前后语义信息不充分的问题,文章提出一种生成式自动文摘网络模型BiLSTM_MulAtten(BiLSTM and Multi-head Attention)。编码器端使用堆叠BiLSTM将文本编码成语义向量,并且使用多头注意力机制以降低序列信息损失;解码器端使用堆叠LSTM,并利用集束搜索方法对语义向量进行解码。实验结果表明,本文方法能够有效提升生成摘要质量,在语义获取方面有着更好的效果,在LCSTS测试集上比目前文摘效果最好的DRGD方法ROUGE分数提升了0.5%至5.8%。  相似文献   

8.
基于统计语义和结构特征的自动文摘   总被引:5,自引:4,他引:5  
在分析自动文摘现有方法优缺点的基础上,提出了一种基于统计、语义和结构特征的自动文摘方法。用这些特征构成句子向量表示,并用机器学习的方法对其进行训练得到器,从而把自动文摘转换为分类问题。实验表明,该方法具有较好的重合率。同时,为了解决文摘的冗余和不连贯缺点,进行了一系列的后期处理,提高了文摘的质量。  相似文献   

9.
针对目前基于主题相似性生成多文档文摘的系统存在语义不精确、只能传达多篇具有同一主题的文档所携带的主要信息(横向文摘)的问题.本文基于HNC理论,提出的面向事件的多文档自动文摘模型,旨在用很短的文本来传达多篇具有同一事件的文档所携带的后续报道信息(纵向文摘).实验结果表明,本方法在信息覆盖率、信息冗余度和文摘流利度方面比TF×IDF方法有很大的改进.  相似文献   

10.
基于句子相似度的自动文摘评价方法   总被引:1,自引:0,他引:1  
评价是自动文摘研究领域中非常重要的一个环节。针对目前自动文摘内部评价方法存在主观性强,无法体现深层语义的缺陷,提出了一种基于句子相似度的自动文摘评价方法。该方法是利用机器摘要和理想文摘中的句子相似度衡量文摘系统的性能,而不是单纯地利用词频或语句包含关系。实验表明,基于句子相似度的评价方法是一种更接近自然模型的评价方法。  相似文献   

11.
自动文摘的目的是借由计算机技术自动从原始文献中提取文摘,针对这一问题,提出了一种新的基于潜在语义分析(Latent Semantic Analysis,LSA)的中文自动摘要方法,该方法利用奇异值分解(Singular Value Decomposition,SVD)来获得文章的语义结构,以句子和全文的相似度为依据抽取一组句子作为文章的摘要,提升了自动摘要的效率和精度,并重点介绍了该方法的基本思想、特点以及实现方法。实验结果表明,该方法在实践中取得了预期的效果。  相似文献   

12.
自动文摘抽取的研究   总被引:1,自引:0,他引:1  
本文详细介绍了自动文摘抽取的六种方法的基本原理,最后,在潜在语义索引模型选取法的基础上,提出了一种基于LSI语句聚类的语句选取方法  相似文献   

13.
词汇相似度是信息检索、机器翻译、自动文摘、自动问答等应用研究的基础,它是自然语言处理领域中的重要研究课题。本论述研究潜在语义分析(Latent Semantic Analysis,LSA)在词汇相似度中的应用。  相似文献   

14.
HNC理论可以通过概念层次网络解决计算机辅助翻译的语篇语义理解的难题。自动文摘技术将文本的理解和表述推向了极致,为提高翻译效率提供了现实有效的途径。将两者相结合,以语篇分析为出发点,可以建构非受限领域的英汉科技翻译新模式。从整体效率而言,计算机辅助翻译比传统翻译方式先进,采用自动文摘技术对文本进行译前处理又比单纯使用计算机辅助翻译技术的效率有所提高。  相似文献   

15.
从语义场的涵义中总结出语义场的类别和语义场的特点.语义场可以分为同义义场、上下义场、反义义场和整体部分义场.语义场具有层次性、联想性、相对性、交互性、传递性和差异性特点.为了让学生更好的学习和掌握词汇,试图运用语义场理论来研究大学英语词汇教学更加有效的方法,把语义场的分类运用在英语词汇教学中,再总结出英语词汇教学中语义场的分类法,指导老师的教学和学生在词汇学习中的应用.  相似文献   

16.
基于概念共现图的多文档自动摘要研究   总被引:1,自引:0,他引:1  
以概念统计为基础,以WordNet为语义资源进行语义消歧和概念归并,提出了一种概念共现图模型并把它应用于多文档自动文摘.该模型利用概念间的共现信息构造概念共现图,抽取多文档集合的主题概念,再根据主题概念构建向量空间模型并计算句子的重要性.由于对概念进行了良好的归纳,该模型能够挖掘蕴涵在文档集中的深层次主题.在DUC2005数据集上评测的结果表明,该方法取得的效果令人满意,可用于实际的应用.  相似文献   

17.
副词"就"语义丰富,用法多样,在词典释义中常有分歧,学者研究也存在诸多争论。运用虚词的"语义结构分析法",对语义结构的描写,可以找出虚词所引出的语义要素并描写要素间的关系。对副词"就"进行语义分析,可以概括出副词"就"的15个义项。  相似文献   

18.
程度副词"比较"可以提取出[+中量][-参照对象][+书面语][+褒义][+肯定]和[+性质/状态]6个不同性质的语义特征。程度副词"比较"在语义特征上兼具实词和虚词的双重特征,因此,在进行语义特征分析时需要综合考虑。根据汉语研究特点可将程度副词"比较"语义特征分为四类:自然性语义特征、附属性语义特征、聚合性语义特征和组合性语义特征。  相似文献   

19.
吴娜 《科技资讯》2009,(6):236-237
在英汉广告语中,随处可见通过模糊词语来表达的广告模糊语义。本文从语义的角度分析了在英汉广告文体中模糊语言所体现的积极作用。从广告语中出现模糊语义的原因,模糊语义在广告文体中的不同体现以及广告语中表达出的模糊语义的功用三方面入手,结合大量的广告例子较全面地介绍和阐释了广告语中模糊语义的现象。  相似文献   

20.
本文统计出中文期刊被《中国数学文摘》(1986—1988年)摘引的文献次数,确定了累积文摘率达70%的前51种期刊为中文数学研究核心期刊,并对其结果作了具体的分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号