首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
基于语义的中文句子的直接生成方法   总被引:1,自引:0,他引:1  
给出一种基于知识机器翻译系统的中文句子的生成方法.这种方法根据中文的特点,从语义的中间语言表达式直接生成中文短语或句子,因此省却了中间语言到句法结构的变换步骤,简化了生成过程.  相似文献   

2.
压缩技术旨在模拟人类的文本概括和信息提取能力。句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子。文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩过程并用类C语言进行算法实现。提出了好的压缩句应该至少满足以下3个标准:第一是保留原句的核心内容,第二是具有正确的语法,第三是压缩长度合理。在算法的评估工作中,从DUC 2003语料库中选取了624个原始句子和对应的人工压缩句,与Hedge Trimmer压缩算法自动生成的压缩句进行对照分析。发现5种压缩效果不理想的情况,分析其原因并提出了改进策略。最后,通过实例对改进算法生成的压缩句和原来算法生成的压缩句进行对比评估,证明了改良算法能够获得更理想的压缩句。在英文句子压缩领域,改良的Hedge Trimmer句子压缩算法值得推广和应用。  相似文献   

3.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要.  相似文献   

4.
汉文-维吾尔文句子对齐模型的XML标记规范   总被引:1,自引:0,他引:1  
近些年来,在语言信息处理研发、双语教学和对比研究以及双语词典编纂研究中,双语语料库的作用日益凸显出来.在双语语料库中,不仅要描述双语文本在句子一级的对齐信息,还要详细描述收入语料库中的双语文本的所有者、领域、时间等方面的属性信息.为便于数据交换和共享,所有语料文本均采用XML编码方式来描述信息.详细阐述了构建的汉文-维吾尔文平行语料库的对齐句子和一些属性信息的XML标记规范和XML标记算法的设计方法.  相似文献   

5.
多语种自然语言生成系统中的语言模型   总被引:1,自引:0,他引:1  
介绍了在多语种自然语言生成系统中如何用统一的模型来表示各种语种的语言知识。本文将语言知识分为语义资源和语法资源两个部分。前者通过Schema和优化规则确定文本的内容;后者根据子结构类,句法规则和词典确定文本的具体形式。该模型以复杂特征集为语言知识的载体,将表示抽象语义的数据扩展为生成不同语种文本所需的语言资源。  相似文献   

6.
人类语言在本质上是创造性的。句子是按句子模式生成的具有相对自足的交际功能的言语单位。句子的形成大致经历几个阶段:1.句型的语义化、深层结构化。2.深层结构的句子转换为表层结构的句子。3.表层句子的情景化。确立新的句子观,将大大扩大现代语法学研究的领域。  相似文献   

7.
基于大型预训练语言模型的有监督学习方法在可控文本生成任务上取得了优秀的成果,但这些研究都着重于控制生成文本的高级属性(比如情感与主题),而忽略了泛化性问题.现有的基于自监督学习的研究方法则通过句子级别的训练来使模型获得补全整句的能力,使模型做到单词和短语级别的控制生成,但生成与特定属性强相关句子的能力依旧待提升.所以本文提出了一种单词级别(细粒度)与句子(粗粒度)级别相结合的多粒度训练方式:单词级别的主题模型让模型学习主题层面的语义以获得主题到文本的生成能力,句子级别的自监督训练让模型学习整句的表征以获得补全句子的能力.通过主题模型与自监督学习的结合,使模型在单词与短语级别的可控生成阶段取得了更好的效果.实验表明,本文提出的模型在主题契合度以及常规文本生成指标方面优于现有的基线模型.  相似文献   

8.
提出了改进的文本相似度计算方法,在计算文本的相似度时,赋予不同文本块中的句子不同的权值,同时直接去掉短句子和合并高相似度的句子以精简句子包中句子数量以提高运算速度.改进后的文本相似度计算方法为:先根据句子相似度的计算方法计算句子的相似度,再计算文本块的相似度,最后按照文本块的权值计算整个文本的相似度.经试验证明,改进后的算法在文本召回率、准确率和F1值上都有明显的提高.  相似文献   

9.
利用选择类问题具有明确候选项的特点, 简化问题分类过程, 并针对长文本语义蕴含短文本语义的语言现象, 提出一种根据文本蕴含强度大小对候选答案进行排序的方法。在没有大规模问答对的情况下, 采用维基百科中文语料库, 以全国各省市高考地理选择题作为实验数据, 通过句子相似度和文本蕴含两种方法来解答地理选择题。实验表明, 基于文本蕴含方法的准确率为36.93%, 比基于词嵌入的句子相似度方法提高2.44%, 比基于向量空间模型的句子相似度方法提高7.66%, 验证了该文本蕴含强度计算方法的有效性。  相似文献   

10.
最小生成树问题是运筹学网络优化中一个常见的基本问题.提出了一种新的求最小生成树的矩阵算法,此算法可以不必在原图上进行操作而得到最小生成树,过程简单易懂.  相似文献   

11.
写作是当前大学英语教学中需要进一步加强的重要方面,应按照循序渐进的方法组织教学。首先要进行大量的段落专项写作训练,然后才能转入篇章的写作练习。可从段落主题句、扩展句及结论句三个方面入手,提高英语段落写作的水平。  相似文献   

12.
将"事件"引入语法研究解决了谓词负担过重、句子蕴含关系描述等问题。在此基础上,从事件结构出发的方法在动词语义、复杂句法现象、类型学等方面的研究中都得到了运用。  相似文献   

13.
对“于”字比较句和“比”字句的结构和功能进行比较分析发现,“于”字比较句的句法结构和成分比较单一,语义语用功能较为狭窄;“比”字句对各种复杂句法结构的容纳性强,语义语用表达功能更加灵活多样;它们在现代汉语中的语体分布也不一致。两种比较句各有独自的语义语用价值。  相似文献   

14.
英语造句的根本特征是主谓构造,包括语法性和逻辑性“主谓结构”。逻辑性“主语-谓语”结构的逻辑主语采用中心词为主格形式的名词词组,逻辑谓语采用非限定动词词组或无动词词组,是一个具有独立性的意义表达单位。该结构既分布于大句,也分布于小句,既可以是从属结构,又可以独立存在。在一定语境下实现意义表达的简洁化是其主要语用理据。  相似文献   

15.
华莹 《科技信息》2012,(30):186-187
Of Time and the River is a famous novel written by American novelist–Thomas Wolfe who was a major American novelist of the early 20th century.His books are well received among Chinese readers.In the novel—Of Time and the River,we can find Wolfe’s frequent use of long sentences.In this paper,the skills of translating long sentences and the ways of analyzing sentence structures are discussed by several examples selected from the novel.Based on my own translation,we can find the importance of sentence structure analysis in translating long sentences.  相似文献   

16.
兼语式的实质是一类结构格局。从甲骨文到现代汉语,兼语结构格局发生了巨大变化,表现为兼语名词由V1前位移到V1后,即“S—O S—V1—V2”——“S—V1—O S—V2”。藏语语序古今变化不大,兼语结构格局始终“是S—O S—V1—V2”。藏语兼语的结构格局和甲骨文相同不是偶然的,而是藏汉语同源的凭证。  相似文献   

17.
张同德  葛璇 《科技信息》2011,(11):I0248-I0249
翻译实践中要获得对原文的正确理解离不开对原文进行透彻地句子分析,包括语法结构分析和语用范畴内的实义切分。译者只有把这两种分析方法有机结合起来,深入分析英汉两种语言的句子结构特点,才能获得正确理解和流畅表达,从而使译文达到“忠实、通顺”的翻译标准。  相似文献   

18.
<生命的礼赞>是十九世纪美国著名诗人亨利·华兹渥斯·朗费罗的一首名诗,也是最早译成中文的一首诗.在众多译本之中,黄新渠的译本比较接近原文的精神实质和文体特点.因此,本文从韵律、节奏、文化因素及句子层面等分析一下黄新渠的译诗特色.  相似文献   

19.
措辞是一门艺术,造句是一门技巧。由于句子写作的复杂性,不同的句式表现不同的语言风格和修辞效果。生动有力的句子是写作的心脏。英语平行句、警句和积极词汇是英语句级语义结构的重要组成部分。英语句式颇多,多加留意,认真实践,必有收获。  相似文献   

20.
大部分多重复句的语法结构是确定的 ,有少量多重复句 ,分句间结构层次或语法关系存在两可的情形。结构不同 ,复句的意义也有些差别。从语言理论和教学实践两方面分析 ,都有必要建立“多义复句”这个概念。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号