首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
句子规划器的设计与实现   总被引:5,自引:1,他引:4  
介绍生成多语种天气预报文本系统中句子规划器的设计与实现.句子规划主要由两部分组成:句子优化和语言资源映射.前者按照一定的优化规则在句子之间消除冗余成分;后者根据具体语言特点对句子进行结构化处理,确定文本结构树并为树中各节点添加语言资源信息,以供表层生成处理时使用.  相似文献   

2.
采用基于最大熵模型的方法对泰语句子级实体从属关系的抽取方法进行了研究.针对泰语句子中实体关系抽取的研究进程中语料库较为匮乏的问题,首先使用汉泰双语平行句对作为中间桥梁,将中文研究领域中相对成熟的分词、词性标注和实体识别等成果,通过汉泰双语词典映射到与中文句子相对齐的泰语句子上,对泰语句子进行必要的数据处理操作,并进行一定量的人工校正和人工实体关系标注工作;进而构建基础的泰语实体关系训练语料库.在语料库的基础上,将泰语实体关系抽取问题转化为分类问题,同时结合泰语语言本身的特点,选取合适的上下文特征模板,使用最大熵模型算法对训练语料进行学习训练,构建分类器,对泰语句子中的候选实体关系三元组进行识别,最终达到实体间从属关系自动抽取的目的.实验结果显示该方法可使F值相对于已有的泰语实体关系抽取研究方法提升8%左右.  相似文献   

3.
中文句子和欧洲语言的句子,在视点的安排上有很大的差异,集中体现了中西文化不同的思维方式。中文句子的视点,相对于欧洲语言句子的静态视点,是具有流动性的动态视点。中文句子的流动,依托自然的声气单位——句读段,既在流动的顺次中体现事理逻辑,又在流动的局势中体现表达功能。这种局势体现为三个向度,即在表面上流水潺潺的句读段铺排中,因句子表达功能的不同,而有动向、名向和关系向三种不同的铺排格局。  相似文献   

4.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

5.
提出一种以中间语言为基础的逆编译方法,此方法首先把机器语言的程序转换为中间语言的程序,然后在中间语言程序上进行数据类型分析和控制流程分析,最后生成目标高级语言的程序  相似文献   

6.
将第三方中间语言和基于可比较语料库两类方法相结合提出了新的构建双语词表方法并且通过实验对新方法进行了验证。实验将中文和瑞典文分别作为源语言和目标语言,英语作为中间语言并使用金融主题的可比语料库,构建了一个中文-瑞典文双语词表。实验结果表明,与传统方法相比,本文提出的方法在构建双语词表方面准确率更高。  相似文献   

7.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

8.
基于实时联想的医学诊断报告书语言生成器   总被引:2,自引:0,他引:2  
 在某一特定的领域中,组成自然语言句子的成分之间存在着很强的相互联系,根据这种相互联系可以由句子的中心语联想产生出句子的其他组成成分.据此,提出了一种基于实时联想的自然语言句子的生成方法,给出了一个医学诊断报告书语言生成器.  相似文献   

9.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要.  相似文献   

10.
中文句子中如果没有主语,句子依然可以是正确的,然而英文的句子如果没有主语往往是错误的。本文采用问卷调查法,试图找出中文零主语现象是否影响学生学习英语效果。结果显示,中文零主语现象对不同专业不同年级学生学习英语影响程度不同。对于中文零主语现象的认识不足,或没有足够的知识来处理两种语言主语差异现象,能影响到英语学习的进步。因而,重视中英文句子主语差异性对教师和学生都非常重要。  相似文献   

11.
着重阐述了日中机器翻译中可保留歧义关系(RSA)这一新概念及其处 理手法.所谓可保留歧义关系是指即使不消除原输入文中授受构造上的歧义 性也能生成反映原文意思的译文关系.具体而言,就是研究由并列助词[]、 连体助词[の]和名词构成的名词短语及由用言连体形构成的句子中授受构 造上的可保留歧义性;并在此基础上提出了一个新的翻译方法.从技术论文 的2 919个句子中抽出了含有上述可保留歧义关系类型的句子806个进行了 翻译实验,正确率为97.7%.从而确认了所提方法的有效性.  相似文献   

12.
汉语复句本体模型初探   总被引:7,自引:0,他引:7  
汉语的句子从结构上可以划分为单句和复句两大类,复句的意义容量比一般单句大,常表示人和人、事和事及人与物的逻辑意义关系.而复句一般由分句构成,各分句单独从其结构上看实际上就是小句.本文详细分析了复旬的静态结构及它与汉语小句的关系,在通过面向对象本体建模方法构造出的小句元模型的基础之上,初步探讨了复句静态本体模型.复句静态本体模型为中文信息处理从字、词处理级提升到句处理级及句处理级以上的研究提供了基础.  相似文献   

13.
14.
庞岩 《长春大学学报》2011,21(1):111-112
本文以韩礼德和哈桑的语法衔接手段为理论基础,通过大学体验英语教材课后练习中翻译句子,对英语和汉语的句子进行比较,最后为大学英语翻译教学提出可行性的建议。  相似文献   

15.
基于核心依存图(kernel dependency graph,KDG)的事件抽取主要通过语义结构进行匹配。在已构建的越-英-汉南海新闻框架网络基础上,主要对KDG语义分析模式、基于核心依存图的新闻事件抽取分析以及核心依存图生成和新闻事件信息抽取进行研究。研究重点包括典型KDG、零形式框架元素和框架元素融合等特殊KDG的分析模式,面向事件信息抽取的KDG的表示模式和标注例句自动生成KDG的过程。研究结果表明,基于KDG的事件信息抽取方法直观明了、语言学理据充分,具有一定的可行性,对新闻文本中的语义线索发现较为适合。目前已经可以从已完成框架语义标注的例句中自动生成KDG并抽取出相应的事件模型。  相似文献   

16.
从汉英科技语作翻译的角度出发,分析了汉语复句与英语复句的语言结构特点。探讨了两种语言在复句层面的编码与解码之功能对等或功能不对等的关系。并在此基础上提出了此类复句互译应遵循的方法和原则。  相似文献   

17.
判断句是古代汉语的一种句式,确定一个句子是否是判断句,要根据古代汉语判断句的结构特征和本质特征,古代汉语的名词谓语句并不都是判断句。  相似文献   

18.
将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不仅能生成多样性的问题,也有助于提升问题生成的模型性能。在基于SQuAD数据集划分的2个答案可知问题生成数据集Split1和Split2上,BLEU-4值分别被提升到20.75%和21.61%。  相似文献   

19.
本文从认知的角度出发,主要以复句、单句以及介于两者之间的紧缩句为对象,对这些句子中的因果关系的表达法及实质作归类总结,试图从认知和句法学的角度找到分析因果关系的契合点,从而探索汉语因果句的英译技巧.  相似文献   

20.
早期汉语中“遭”类词在语义和语法特征上存在诸多相似性,“遭”类词作为被动标记的词;12来源也具有普遍语言学的意义。早期汉语中存在一组以“被”为代表的“遭”类被动句,但“被”和其他“遭”类词在发展上的不平衡,导致“被”胜出而成为后世汉语的强势被动表达法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号