首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 406 毫秒
1.
SUSANNE语料库中语法规则的抽取   总被引:1,自引:1,他引:0  
邹文杰 《科技信息》2008,(10):53-54
近年来自然语言理解的研究中,语料库占有越来越重要的地位。将现实中真实的语言材料经过语言专家分析和加工,集中到一个库里面,然后计算机专家通过计算机技术从语料库中获取有用的知识从而指导自然语言处理系统的开发与研究已经成为常用的方法。语料库中语法规则的抽取是语料库数据预处理重要的一环,本文基于中山大学软件研究所WordHelp项目,讨论了SUSANNE语料库中抽取英文语法规则的问题。  相似文献   

2.
“配价”这一概念借自化学。朱德熙先生率先将“价”的概念引入汉语语法学,开拓了汉语动词研究的新领域。接着,不少学者也开始研究动词“价”的问题,动词配价研究已成为汉语语法研究的热点之一。目前,汉语语法学界在动词配价的性质、确定配价的标准及辩价方法等方面存在很大的分歧。  相似文献   

3.
通过配价语法的相关研究对分句内谓词的配价能力的描写,揭示了被修饰的名词与分句内谓词之间的依存关系,进而说明用作定语的分句在修饰名词时受到的语义限制。  相似文献   

4.
徐冰若 《科技资讯》2006,(27):188-188
语言构造的层次性和层次分析法是语法理论,配价语法理论对外汉语教学有重要意义。  相似文献   

5.
徐春 《科技信息》2011,(17):I0104-I0105
平行语料库研究是近年来语料库语言学横向发展的新趋势。人们清楚的认识到大规模的高质量汉英平行语料库在自然语言处理、比较语言学研究和第二语言教学等众多领域中的巨大价值。文章介绍了一个大规模汉英双语平行语料库的构建系统,利用互联网上存在的海量多语言文本资源,通过网页的内容分析和链接分析,实现了一个双语语料挖掘的自动获取系统,包括其总体规划、实施模型和流程细节。目的是通过学习国内外资料。最终建设一个基于互联网的平行语料库自动构建系统。  相似文献   

6.
李丽 《科技信息》2008,(8):275-275
汉语和俄语分属两个不同的语系,一个属于汉藏语系,一个属于印欧语系,但中国和俄国的语法学者均运用配价论对本国的语言进行了深入的研究,取得了一定的成果。本文对两国在配价理论方面的研究作了对比,旨在有效地解决俄汉教学中的一些问题,令学习者事半功倍。  相似文献   

7.
本文介绍了语料库语言学在历史上发展的几个阶段:早期的语料库语言学;Chomsky的转换生成语法与语料库语言学;新一代语料库语言学的兴起;语料库语言学的复兴。并探讨了语料库语言学在英语教学中的应用,它为学习者提供学习的新途径,为教育者提供更可靠的教学和研究的信息来源。  相似文献   

8.
武子英 《山西科技》2005,(5):100-102
格语法是自然语言处理学科的一种基本理论,问答系统是自然语言处理的一个重要分支。文章在介绍格语法理论的基础上,介绍了基于格语法的问答系统的设计及具体实现。  相似文献   

9.
指代消解是自然语言处理中的关键和热点问题之一,而语料库的研究是指代消解研究中的基础性工作.在中文突发事件语料库(Chinese emergency corpus, CEC)的基础上,通过自动生成和人工标注的方法,构造一个面向事件的中文指代语料库.与传统指代语料库不同,该语料库针对的是以事件作为知识表示单元的文本,对事件中各要素和事件的指代进行标注,其构建对面向事件的中文指代消解的研究十分关键,提供了更多的资源支持.同时,对CEC中各事件要素和事件的指代进行了统计和分析,为今后的工作提供了一些铺垫.  相似文献   

10.
按照所涉及的动作过程的复杂程度,嘉鱼方言双宾句可分为单过程双宾句和双过程双宾句。本文从配价语法和认知语法的角度出发,分析了这两种双宾句的形成机制以及某些相关语法特点的形成原因。  相似文献   

11.
Boundary recognition is an important research of natural language processing, and it provides a basis for the application of Chinese word segmentation, chunk analysis, named entity recognition, etc. Based on ambiguity in boundary recognition of Chinese punctuation marks, this paper proposes grammar testing methods for boundary recognition of slight-pause marks and then calculates the annotation consistency of these methods. The statistical results show that grammar testing methods can greatly improve the annotation consistency of slight-pause marks boundary recognition. The consistency during the second time is 0.030 3 higher than during the first, which will help guarantee the consistency of large-scale corpus annotation and improve the quality of corpus annotation.  相似文献   

12.
在自然语言处理中,词类划分属于基础研究,其重要性不可忽视。文章以明确藏语词类划分的标准入手,根据藏语自身的特点和规律性、系统性,从藏文信息处理的角度出发,提出了自己的见解和分类方法,致力于探索藏语词类的划分标准,为藏文信息处理各个层次的发展进行最基础的研究。  相似文献   

13.
回顾二语习得领域关于词块的研究以及语料库用于教材词汇评析的发展状况;以语料库语言学的词汇语法作为理论支撑,在英语专业教材《综合教程》中找出与Coxhead学术词汇相吻合的动词,尝试以大型英语本族语者语料库COCA为参照,把这些动词的深度知识,如搭配词(Collocates)、类联接(Colligation)、语义趋向(Semantic preference)、语义韵(Semantic prosody)与它们在教材中的呈现样貌进行对比分析;以动词sustain作为具体的例子,把该词在整套教材中的呈现样貌与其在COCA中所呈现的深度知识进行比较分析,期待能为语料库手段应用于英语专业教材分析提供一个新的切入点。  相似文献   

14.
句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN (dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP (microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK (sentences involving compositional knowledge)数据集上模型的皮尔森相关系数能达到87.5,在MSRvid (microsoft video paraphrase corpus)数据集上模型的皮尔森相关系数能达到92.2。  相似文献   

15.
可比语料库由于其自身优势和广泛用途逐渐成为语料库研究的热点方向之一,而目前国内俄汉可比语料库相关研究未见学者涉及。通过梳理国内外相关研究成果,设计了一种基于维基百科构建俄汉可比语料库的思路和方法,研制了语料自动获取系统,以篇章对齐为基础建立了俄汉可比语料库,语料字(词)总数达到了百万级,最后利用跨语言相似度计算的方法对俄汉语料的可比度进行计算。计算结果表明该方法能够有效获取可比度较高的俄汉语料,所构建的语料库可被用于俄汉翻译、话语分析及计算语言学研究中。  相似文献   

16.
以2009年第6期《中篇小说选刊》为语料,选取并分析了其中的类词缀、离合词和"干吗"类疑问句三个语法问题。通过对语言现象的分析,认为语言的语法构造是语言诸要素中最具稳定性的一个要素,但它也会逐渐发生变化,以语言现象作为催化剂,逐渐改进和改正自己的规则,促进语法系统的不断完善。  相似文献   

17.
随着网络资源的不断丰富,人们获取信息的途径已被网络代替。维吾尔文,在语言信息处理,WEB应用等领域有了迅速的发展。文章针对网络爬虫的工作原理以及聚焦爬虫策略进行阐述,在此基础上结合维吾尔语信息提取的相关研究,研究了维吾尔文的网络爬虫技术的结构和策略,从而为维吾尔文搜索引擎的网页数据库建设和维吾尔文网络舆情分析研究提供海量的语料。  相似文献   

18.
本文提出以自然语言为界面实现程序自动生成的研究成果。该研究系统使用面向对象的方法与技术,以自然语言为输入界面,使用扩充的格语法进行语法语义分析,将用户描述的VC 期望程序功能的汉语篇章依次进行自动切词处理、语法处理、语义分析理解、目标程序的自动生成,最终形成满足用户要求且符合Visual C 语法的结果程序。  相似文献   

19.
人际功能是系统功能语法中语言的三大元功能之一,而情态是实现人际元功能的主要语义载体。以伊拉克战争中美军传单为语料,运用功能语法的理论,探究传单文本中情态助动词所实现的人际功能,以及实现的人际功能与美军宣传者对目标受众实施说服之间的关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号